Q群聊天记录

Haibin
fragments
7小时前
4 Views
0 Comments
676 Words

前些天我思考过一个问题，目前的AI对专家的学习可能有很长的路，专家的培养环境复杂，比如去A、B、C Lab的交流合作，和不同人类交流。这个交互有两个困难：数据稀少和经验复杂。后者我觉得是可以解决的，因为你可以把“research taste”等高级想法理解为一个高维度的知识。前者可能要做很多工作。我的意思是，tairan可以作为这个数据集的一个sample

之前老板也和我严肃讨论过这个问题。做科研数量有了后最重要是求max，也就是最重要的工作是什么。他提醒我按照我的能力，干paper没问题，但是一定要想办法干好的paper。尤其是ai来了后，理论上你可以一周就赶完paper只要负责把控代码实验大方向和主写作。假设每个人都可以发100篇文章，那么我们一定要有找到做出那个好工作的能力，它跟research taste基本重合

我发现taste跟视野强相关，视野的获得有几个，最重要的是计算卡。9B的模型跟90B的表现可能完全不一样，dataset等也是。然后是人的交流和自己去尝试，能给你更多行业的经验。我感觉在学校里获得这些的有点小了

想到这里突然不想读phd了。以前人说你的半生努力，或许只是天才的一个下午。只不过今天天才它是gpt5.5。如果有视野更高的人，能提前做出最有用的事情，后面的都用ai补全，那我似乎就不用搞了，这对人类也是有利的，不要把资源投到低效率的地方。我计划等我被取代了，我就去备战cncs的未来，至少在那里，我还不是人类

我觉得门槛都是相对的。在ai infra岗位大规模出现前，大家都说难，等真来了八股文卷的跟之前分布式系统那些八股一样多，万人涌入，如果抱着竞争的想法，周围人总是无穷无尽的。真正的门槛还是taste和卡，在里边马太效应，ai又在里边做催化剂

写cpu是一个有趣的workload，它的改动牵一发动全身，对agent精准把握细节挺重要的。如果定义一个agent写的速度跟代码和turn的发展对比，写cpu的速度会低于写其他的速度

https://deepmind.google/research/publications/231971/ The Abstraction Fallacy: Why AI Can Simulate But Not Instantiate Consciousness

file