在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,向全球展示了其在大模型技术、软硬一体化解决方案及多模态交互领域的最新突破,并宣布启动“星火点亮全球”计划,旨在推动AI技术红利的全球共享。

发布会上,科大讯飞董事长刘庆峰指出,AI红利的实现需攻克四大核心挑战:自主可控、软硬一体、行业纵深与个性化。目前,这一路径已取得显著进展,例如在讯飞与头部企业联合打造的300多个“开箱即用”智能体中,已涌现出多个优秀“AI员工”。其中,“星火行业分析师”成为国内首个通过工信部认证的行业分析AI应用,在《大数据分析师技术水平考试》中以92分超越85%的人类考生。
深度推理大模型讯飞星火X1.5的亮相成为全场焦点。该模型采用MoE架构,总参数量达293B,激活参数量30B,推理效率较前代提升100%。其语言理解、文本生成、逻辑推理等六大核心能力全面对标国际主流,数学能力持续领先,多语言能力覆盖超130个语种,整体性能达GPT-5的95%以上,尤其在拉美、东盟等14个重点语言场景中表现优异。更值得关注的是,星火X1.5在自主可控的全国产算力平台上攻克了两大技术难题:长思维链强化学习训练效率从30%提升至84%以上,MoE模型全链路训练效率实现质的飞跃,为AI技术的自主可控奠定了坚实基础。
在原创技术层面,科大讯飞全球首发非自回归语音大模型架构,通过并行输出文本序列,推理效率较同尺寸自回归模型提升16%,成本下降520%。这一突破为语音交互领域带来了新的可能性。
软硬一体化解决方案的发布,标志着AI技术向真实场景的深度渗透。科大讯飞推出了融合AI与麦克风阵列、扬声器阵列、摄像头阵列及视觉呈现技术的软硬件一体方案。例如,讯飞智能办公本X5搭载上4下4环八麦克风阵列,抗噪能力远超iPhone 17 Pro,高噪环境下识别准确率达95.08%;讯飞AI翻译耳机首创单耳三麦多感融合降噪系统,复杂噪声下识别准确率高达97.1%;讯飞双屏翻译机2.0的强降噪模式在90dB噪音下仍能保持98.69%的识别率。业界首个软硬一体同传麦克风实现自动翻译免切换,同传播报首响延迟低于2秒,支持私有化部署。
在视觉与健康领域,讯飞AI黑板搭载全球首款圆偏类自然光护眼大屏,视觉疲劳降低50%,130度超宽域显示确保教室每个角落的学生都能清晰观看;讯飞AI学习机集成微纳米类纸屏等技术,获得国内外10余项权威护眼认证,为青少年视力保护提供了创新方案。

多模态交互能力的升级是本次发布的另一亮点。数字人导览“小飞”展示了其支持多人多语种对话、个性化推荐及任务执行的能力,其背后的技术突破包括麦克风远场识别、3D视觉感知、视听觉融合理解等八项核心能力。刘庆峰强调,这些技术的联动使AI从软件工具升级为具备情感深度的伙伴。发布会还首发了两大核心技术:个性化记忆能力通过构建用户记忆库,实现长期画像、近期反馈与短期对话的综合理解;百变声音复刻技术基于星火语音大模型,仅需一句录音即可复刻音色,并支持任意风格声音创造。
在应用场景层面,科大讯飞展示了AI在教育、医疗、汽车、办公及情感陪伴领域的深度落地。教育领域,星火大模型构建了由3大类、3层级、4000+标签组成的错因体系,通过智能批阅机和教师助手实现“小时级闭环”教学范式变革;医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同将基层诊断合理率从87%提升至96%,病历书写时间减半;汽车领域,星火智慧座舱2.0通过54维记忆锚点记住用户偏好,提供体征实时监测,打造“第三空间”;办公领域,讯飞智能办公本X5和听见APP支持基于说话人识别的会议纪要生成,办公本X5的手写纪要还能与AI纪要深度融合;情感陪伴领域,“AI星朋友”以高保真声音克隆和160种人设模型,通过自学习情感模型主动互动,让科幻场景成为现实。
为推动AI生态繁荣,科大讯飞宣布全面开源首个原生支持RPA的智能体平台Astron,该平台将Agent与RPA结合,提供八大行业智能体,助力开发者跨越AI应用鸿沟。截至2025年10月底,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。同时,科大讯飞携手多国合作伙伴启动“星火点亮全球”计划,依托星火的多语言与自主可控技术,为全球提供AI发展的“第二种选择”,加速技术红利共享。












