科技·商业·财经

谷歌苹果顶尖华人科学家携手创业,以视觉推理为刃开辟AGI新赛道

   时间:2026-01-12 02:03 作者:顾青青

在硅谷人工智能创业浪潮中,两位来自科技巨头的顶尖科学家正联手掀起新一轮创新风暴。谷歌前资深研究员Andrew Dai与苹果前首席研究科学家Yinfei Yang,共同创立了聚焦多模态AI的初创公司Elorian,首轮融资目标即锁定5000万美元,引发资本市场高度关注。

作为谷歌DeepMind效力14年的技术元老,Andrew Dai的履历堪称AI发展史的活化石。从2012年加入谷歌至今,他不仅主导了Gemini模型预训练数据体系构建,更与Jeff Dean等传奇人物共同撰写过多篇开创性论文。其2015年提出的半监督序列学习框架,被业界视为GPT系列模型的重要理论基石之一。这种深耕预训练领域二十年的技术积淀,使他在数据质量优化和知识提炼方面形成独特优势。

联合创始人Yinfei Yang则带来了苹果系的产品化基因。这位在苹果机器学习团队担任首席研究科学家的技术专家,曾主导开发多模态表示学习框架,在图像-文本共嵌入领域取得突破性进展。其职业轨迹横跨谷歌与苹果两大科技巨头,既掌握大规模模型训练技术,又深谙AI技术落地之道,这种复合背景在初创公司中尤为罕见。

Elorian的核心技术方向直指当前AI发展的关键瓶颈——视觉推理。不同于现有模型通过文本中介理解视觉信息的路径,该公司致力于构建原生多模态架构,使机器能够像人类般直接感知物理世界逻辑。这种技术路线在机器人控制、复杂界面操作等场景具有革命性潜力,可能催生出真正意义上的通用AI助手。

资本市场对这支"黄金组合"展现空前热情。由前CRV合伙人Max Gazor创立的Striker Venture Partners正积极洽谈领投事宜,该基金虽成立不足半年,却因精准押注AI领域而备受瞩目。投资界普遍认为,Elorian的价值不仅在于技术路线创新,更在于其团队融合了谷歌的工程化能力与苹果的产品思维,这种基因组合在当下AI创业潮中堪称稀缺资源。

当前AI竞赛已进入新阶段,文本生成领域的格局初定后,多模态理解与物理世界交互成为新的战略高地。谷歌Gemini、OpenAI GPT-4等巨头产品均在加速补强视觉能力,而Elorian选择从底层架构创新切入,试图在巨头林立的市场中开辟新赛道。这种"颠覆者"姿态,恰是硅谷创新精神的最佳注脚。

据知情人士透露,Elorian的技术原型已展现出惊人潜力,其模型在复杂场景理解测试中超越多个现有基准。若能如期完成融资,这家初创公司将成为今年硅谷最值得关注的AI新星,其发展轨迹或将重新定义人机交互的未来图景。

 
 
更多>同类内容
全站最新
热门内容