科技·商业·财经

MIT天才博士毕业即投身新锐公司 聚焦大模型预训练 年薪或达300万起

   时间:2026-01-12 02:08 作者:朱天宇

MIT博士肖光烜近日在社交平台宣布完成学业,即将加入由OpenAI前CTO创立的初创公司Thinking Machines,专注大模型预训练领域。这一消息引发科技圈关注,英伟达科学家、xAI研究员及UCSD学者等业内人士纷纷在评论区送上祝贺。

翻开肖光烜的履历,其学术背景堪称亮眼。本科阶段就读于清华大学计算机系,同时辅修金融学并获得双学位,期间斩获国家奖学金、全国大学生数学建模竞赛一等奖等十余项荣誉。2020年至2021年,他以访问学者身份赴斯坦福大学开展研究,2022年进入MIT攻读博士学位,师从韩松教授,研究方向聚焦深度学习的高效算法与系统。

在MIT期间,肖光烜展现出极强的工程实践能力。2024年初,他在英伟达实习期间提出的DuoAttention技术,通过结合检索与流式注意力头,成功解决长上下文大语言模型的推理加速问题。此后参与的XAttention项目,利用反对角评分机制实现块稀疏注意力优化;StreamingVLM模型则突破视频流处理时长限制,可实时分析数小时长视频内容。这些成果均体现其从理论到落地的完整技术闭环能力。

其博士论文《Efficient Algorithms and Systems for Large Language Models》更被视为行业里程碑。针对大模型显存爆炸、推理迟缓等痛点,论文提出SmoothQuant量化技术,首次实现十亿级模型W8A8无损压缩;StreamingLLM架构通过"注意力汇点"机制,将模型上下文处理能力从数千token提升至百万级。更值得关注的是,团队通过信噪比分析证明"块越小越好"的理论极限,并开发FlashMoBA内核使小块架构在实际应用中提速9倍,为AGI发展开辟新路径。

科技行业薪酬数据印证了这场人才争夺战的激烈程度。据Business Insider获取的2025年一季度招聘记录显示,Thinking Machines为技术员工开出平均46.25万美元年薪,其中基础薪资最高达50万美元。这一水平不仅远超OpenAI技术团队29.2万美元的平均年薪,也高于Anthropic的38.75万美元。尽管与meta某些高管超亿元薪酬仍有差距,但在初创公司中已属顶尖水准。

 
 
更多>同类内容
全站最新
热门内容