在第八届世界声博会暨2025科大讯飞全球1024开发者节上,科大讯飞以“更懂你的AI”为主题,向全球展示了讯飞星火大模型的最新技术突破与系列创新产品。这场科技盛会不仅展现了AI技术的深度演进,更通过多领域应用场景的落地,勾勒出AI赋能千行百业的清晰路径。
科大讯飞董事长刘庆峰在会上指出,AI技术的普及需跨越四大核心挑战:自主可控的技术底座、软硬一体的系统整合、行业纵深的应用场景,以及个性化的用户体验。目前,这一战略已取得实质性进展——由科大讯飞与行业头部企业联合开发的300余个“即插即用”智能体中,已涌现出多个具备行业标杆意义的“AI员工”。例如,“星火行业分析师”通过工信部认证考试,在《大数据分析师技术水平考试》中以92分超越85%的人类考生,成为国内首个获此殊荣的行业分析AI工具。
发布会上,深度推理大模型“讯飞星火X1.5”的亮相成为焦点。该模型采用MoE架构,总参数量达293B,激活参数量30B,推理效率较前代提升100%。其语言理解、数学推理等六大核心能力全面对标国际主流,数学能力持续保持领先,多语言支持覆盖130余种语言,整体性能达GPT-5的95%以上,尤其在拉美、东盟等14个重点语言场景中表现突出。更值得关注的是,科大讯飞在国产算力平台上攻克了两大技术瓶颈:长思维链强化学习训练效率从30%跃升至84%,MoE模型全链路训练效率实现质的飞跃,为自主可控的AI发展奠定了坚实基础。
在原创技术领域,科大讯飞全球首发的非自回归语音大模型架构引发行业震动。该架构通过并行输出文本序列,推理效率较同尺寸自回归模型提升16%,成本降低520%,标志着语音技术进入“高效低耗”的新阶段。
软硬一体化解决方案的推出,标志着AI技术从实验室走向真实场景的关键跨越。科大讯飞发布的“AI+麦克风阵列”“AI+扬声器阵列”等融合方案,通过硬件与算法的深度协同,重新定义了智能设备的交互体验。例如,搭载环八麦克风阵列的讯飞智能办公本X5,在高噪环境下识别准确率达95.08%,超越iPhone 17 Pro;独创单耳三麦系统的AI翻译耳机,在复杂噪声中识别准确率高达97.1%;而智能座舱音响方案iFLYSOUND已落地19家车企,出货量突破100万台,车内音效媲美百万级豪车。
多模态交互技术的突破,让AI真正具备“类人”能力。数字人导览“小飞”在发布会现场展示了八项核心能力:远场语音识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人生成、个性化记忆库构建,以及情感语义分析。其中,个性化记忆技术通过构建用户画像与对话历史库,使AI能够精准理解用户需求;而百变声音复刻功能仅需一句录音即可复刻任意音色,并支持指令式风格创造,为情感交互开辟了新维度。
在应用层面,科大讯飞展示了AI技术如何深度融入教育、医疗、汽车、办公等场景。教育领域,星火大模型构建的错因体系包含3大类、3层级、4000余个标签,通过智能批阅机与教师助手实现“作业批改-课堂反馈”小时级闭环;医疗领域,星火医疗大模型专科诊疗能力达主任级医师水平,人机协同使基层诊断合理率从87%提升至96%,“智医助理医院版1.0”与个人健康助手“讯飞晓医”已累计完成1.6亿次健康咨询;汽车领域,星火智慧座舱2.0通过13个摄像头与54维记忆锚点,实现用户偏好记忆与体征监测,打造“第三生活空间”;办公领域,智能办公本X5与讯飞听见APP支持说话人识别与手写纪要融合,提升会议效率;情感陪伴方面,“AI星朋友”以4.35MOS高保真声音克隆与160余种人设模型,通过自学习情感模型主动交互,让科幻场景成为现实。
生态建设层面,科大讯飞宣布全面开源首个原生支持RPA的智能体平台Astron,将“大脑”(Agent)与“手脚”(RPA)深度结合,提供八大行业智能体,助力开发者跨越AI应用鸿沟。截至2025年10月,讯飞开放平台开发者总数达968万,近一年新增200万,大模型企业开发者增长125%。发布会最后,科大讯飞携手多国合作伙伴启动“星火点亮全球”计划,依托多语言技术与自主可控优势,推动AI技术红利全球共享,为世界提供AI发展的“中国方案”。












