MIT天才博士毕业即投身新锐公司聚焦大模型预训练年薪或达300万起

时间：2026-01-12 02:08 作者：朱天宇

MIT博士肖光烜近日在社交平台宣布完成学业，即将加入由OpenAI前CTO创立的初创公司Thinking Machines，专注大模型预训练领域。这一消息引发科技圈关注，英伟达科学家、xAI研究员及UCSD学者等业内人士纷纷在评论区送上祝贺。

翻开肖光烜的履历，其学术背景堪称亮眼。本科阶段就读于清华大学计算机系，同时辅修金融学并获得双学位，期间斩获国家奖学金、全国大学生数学建模竞赛一等奖等十余项荣誉。2020年至2021年，他以访问学者身份赴斯坦福大学开展研究，2022年进入MIT攻读博士学位，师从韩松教授，研究方向聚焦深度学习的高效算法与系统。

在MIT期间，肖光烜展现出极强的工程实践能力。2024年初，他在英伟达实习期间提出的DuoAttention技术，通过结合检索与流式注意力头，成功解决长上下文大语言模型的推理加速问题。此后参与的XAttention项目，利用反对角评分机制实现块稀疏注意力优化；StreamingVLM模型则突破视频流处理时长限制，可实时分析数小时长视频内容。这些成果均体现其从理论到落地的完整技术闭环能力。

其博士论文《Efficient Algorithms and Systems for Large Language Models》更被视为行业里程碑。针对大模型显存爆炸、推理迟缓等痛点，论文提出SmoothQuant量化技术，首次实现十亿级模型W8A8无损压缩；StreamingLLM架构通过"注意力汇点"机制，将模型上下文处理能力从数千token提升至百万级。更值得关注的是，团队通过信噪比分析证明"块越小越好"的理论极限，并开发FlashMoBA内核使小块架构在实际应用中提速9倍，为AGI发展开辟新路径。

科技行业薪酬数据印证了这场人才争夺战的激烈程度。据Business Insider获取的2025年一季度招聘记录显示，Thinking Machines为技术员工开出平均46.25万美元年薪，其中基础薪资最高达50万美元。这一水平不仅远超OpenAI技术团队29.2万美元的平均年薪，也高于Anthropic的38.75万美元。尽管与meta某些高管超亿元薪酬仍有差距，但在初创公司中已属顶尖水准。

更多>同类内容

从游戏引擎到数字孪生：跨界极客与科技巨头如何重塑地图的未来

过去的地图是“拍照片”，记录哪里有什么；现在的“世界模型”则是“造大脑”，它试图理解整个城市运行的逻辑：红绿灯的变换规律、早晚高峰的人潮走向、无数司机和外卖员之间的微观博弈。我们曾以为地图是世界的影子，但现…

01-12