在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,推出讯飞星火大模型最新技术升级及系列创新产品,为AI产业红利兑现描绘出清晰路径。此次发布不仅展现了技术突破,更通过多领域应用场景的落地,展现了AI如何深度融入人类生活。

科大讯飞董事长刘庆峰在演讲中指出,AI技术要想真正惠及大众,需攻克四大核心挑战:自主可控的技术底座、软硬一体的系统融合、行业纵深的应用能力以及个性化服务体验。目前,这一路径已取得实质性进展。例如,科大讯飞联合头部企业打造的300余个“开箱即用”智能体中,涌现出多个标杆案例。其中,“星火行业分析师”成为国内首个通过工信部认证的行业分析AI应用,在《大数据分析师技术水平考试》中以92分的成绩超越85%的人类考生,展现了AI在专业领域的深度赋能能力。
技术层面,深度推理大模型讯飞星火X1.5的发布成为焦点。该模型采用MoE架构,总参数量达293B,激活参数量30B,推理效率较前代提升100%。其语言理解、文本生成、逻辑推理等六大核心能力全面对标国际主流,数学能力持续领先。更引人注目的是,星火X1.5的多语言能力覆盖130余个语种,整体性能达到GPT-5的95%以上,尤其在拉美、东盟等14个重点语言市场表现突出,为全球AI发展提供了“中国方案”。
在自主可控领域,科大讯飞攻克了两大技术瓶颈:长思维链强化学习训练效率从30%提升至84%以上,MoE模型全链路训练效率实现质的飞跃。全球首发的非自回归语音大模型架构通过并行输出文本序列,推理效率提升16%,成本下降520%,展现了原创技术的突破性价值。
软硬一体化解决方案的推出,标志着AI从“云端”走向“真实世界”。科大讯飞融合AI与麦克风阵列、扬声器阵列、摄像头阵列等技术,打造了多款创新产品。例如,讯飞智能办公本X5搭载上4下4环八麦克风阵列,抗噪能力远超iPhone 17 Pro,高噪环境下识别准确率达95.08%;讯飞AI翻译耳机首创单耳三麦多感融合降噪系统,复杂噪声下识别准确率高达97.1%;讯飞双屏翻译机2.0在90dB噪音下识别率达98.69%。业界首个软硬一体的讯飞同传麦克风支持自动翻译免切换,首响延迟低于2秒,可私有化部署。

在视觉与健康领域,科大讯飞同样创新不断。讯飞AI黑板搭载全球首款圆偏类自然光护眼大屏,视觉疲劳降低50%,130度超宽域显示确保教室每个角落的学生都能清晰观看;AI学习机集成微纳米类纸屏技术,获得国内外10余项护眼认证。智能座舱音响方案iFLYSOUND通过立体空间声场重构技术,车内音效媲美百万豪车,已在19家车企量产,出货量超100万台。
多模态交互能力的升级,让AI更懂用户需求。数字人导览“小飞”展示了八项技术突破:麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆与情感语义。其中,个性化记忆能力通过构建用户画像库,综合理解长期偏好、近期反馈与短期对话;百变声音复刻技术仅需一句录音即可复刻音色,并支持自定义声音风格。刘庆峰表示:“超拟人多模态交互将成为未来AI进入家庭的标配。”
应用场景的拓展进一步印证了AI的价值。在教育领域,星火大模型首创错因体系,通过智能批阅机和教师助手实现“作业批改-课堂因材施教”的小时级闭环;医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使诊断合理率从87%提升至96%,病历书写时间减半;出行领域,星火智慧座舱2.0融合13个摄像头与54维记忆锚点,提供个性化服务与健康监测;办公领域,智能办公本X5与讯飞听见APP升级后,可自动生成会议纪要与待办事项;情感陪伴方面,“AI星朋友”通过高保真声音克隆与160余种人设模型,主动提供情感支持。
生态建设层面,科大讯飞启动“星火点亮全球”计划,与多国合作伙伴共建AI生态。2025年AI开发者大赛吸引17国3.6万余个团队参与,涌现出4622个垂类智能体。截至10月底,讯飞开放平台开发者达968万,近一年新增200万,大模型企业开发者增长125%。面向开发者,科大讯飞开源原生支持RPA的智能体平台Astron,结合Agent与RPA技术,提供八大行业智能体,助力中国开发者打造全球创新引擎。











