Q群聊天记录
- fragments
- 7小时前
- 4 Views
- 0 Comments
- 676 Words
前些天我思考过一个问题,目前的AI对专家的学习可能有很长的路,专家的培养环境复杂,比如去A、B、C Lab的交流合作,和不同人类交流。这个交互有两个困难:数据稀少和经验复杂。后者我觉得是可以解决的,因为你可以把“research taste”等高级想法理解为一个高维度的知识。前者可能要做很多工作。我的意思是,tairan可以作为这个数据集的一个sample
之前老板也和我严肃讨论过这个问题。做科研数量有了后 最重要是求max,也就是最重要的工作是什么。他提醒我按照我的能力,干paper没问题,但是一定要想办法干好的paper。尤其是ai来了后,理论上你可以一周就赶完paper只要负责把控代码实验大方向和主写作。假设每个人都可以发100篇文章,那么我们一定要有找到做出那个好工作的能力,它跟research taste基本重合
我发现taste跟视野强相关,视野的获得有几个,最重要的是计算卡。9B的模型跟90B的表现可能完全不一样,dataset等也是。然后是人的交流和自己去尝试,能给你更多行业的经验。我感觉在学校里获得这些的有点小了
想到这里 突然不想读phd了。以前人说你的半生努力,或许只是天才的一个下午。只不过今天天才它是gpt5.5。如果有视野更高的人,能提前做出最有用的事情,后面的都用ai补全,那我似乎就不用搞了,这对人类也是有利的,不要把资源投到低效率的地方。我计划等我被取代了,我就去备战cncs的未来,至少在那里,我还不是人类
我觉得门槛都是相对的。在ai infra岗位大规模出现前,大家都说难,等真来了八股文卷的跟之前分布式系统那些八股一样多,万人涌入,如果抱着竞争的想法,周围人总是无穷无尽的。真正的门槛还是taste和卡,在里边马太效应,ai又在里边做催化剂
写cpu是一个有趣的workload,它的改动牵一发动全身,对agent精准把握细节挺重要的。如果定义一个agent写的速度跟代码和turn的发展对比,写cpu的速度会低于写其他的速度
https://deepmind.google/research/publications/231971/ The Abstraction Fallacy: Why AI Can Simulate But Not Instantiate Consciousness

