科技·商业·财经

马斯克xAI新突破:Grok 4.1智商情商双提升,团队华人力量引关注

   时间:2025-11-21 07:00 作者:唐云泽

马斯克旗下人工智能公司xAI近日推出全新大模型Grok 4.1,以"双商在线"的定位向GPT-5.1发起挑战。这款模型分为Thinking(推理版)和标准版两个版本,现已在Grok官网、X平台及移动端应用全面开放免费体验。

在权威评测平台LMArena的最新榜单中,Grok 4.1 Thinking以1483分登顶全球大模型排行榜,较第二名Gemini 2.5 Pro高出31分。其标准版同样表现亮眼,直接占据榜单次席。更引人注目的是,该模型在情商专项测试EQ-Bench3中延续强势表现,Thinking版本以1586分刷新纪录,标准版与国产模型Kimi K2分列二三位。

实测显示,新模型在交互体验上实现质的飞跃。相比前代产品,Grok 4.1展现出更强的共情能力,不仅会耐心倾听用户诉求,还能在回复结尾添加爱心符号增强情感表达。创作能力方面,其文本生成评分较前代提升600分,生成内容兼具逻辑性与画面感。通过优化训练架构,模型幻觉率从12.09%降至4.22%,信息准确性显著提升。

技术团队披露,此次突破源于对强化学习框架的深度革新。xAI在既有大规模强化学习基础设施上,开发出利用智能体推理模型作为奖励机制的新方法,实现自主评估与迭代响应。后训练负责人Dustin Tran透露,团队通过分析数百万条真实对话数据,结合智能体评分系统,将强化学习规模扩大10倍,同时将RLHF(基于人类反馈的强化学习)技术推向新高度。

值得关注的是,xAI近期因团队构成引发讨论。社交平台流传的合影显示,其核心研发团队以华裔科学家为主。有消息称,公司近期调整了人员结构,但官方尚未对此作出回应。这种人才聚集现象,某种程度上反映出全球AI领域的技术竞争格局。

关于备受期待的Grok 5,马斯克在最新访谈中透露,这款参数规模达6万亿的模型将推迟至明年发布。他解释称,作为通向通用人工智能(AGI)的重要里程碑,Grok 5需要更强大的计算资源支持,目前团队正进行极端严格的测试验证。这一表态与此前报道中提到的"资源限制与测试需求"形成呼应。

行业观察人士指出,Grok 4.1的发布既是技术迭代成果,也彰显了马斯克的AI战略野心。不过随着谷歌Gemini 3.0等竞品即将入场,今年大模型领域的竞争格局仍存变数。这场由科技巨头主导的AI竞赛,正在不断刷新人类对智能边界的认知。

 
 
更多>同类内容
全站最新
热门内容