标贝科技构建超130万小时语音数据集，驱动AI技术高效落地多场景-网界

在人工智能技术加速向实际应用场景渗透的背景下，标贝（青岛）科技有限公司依托自主研发的"多源采集+生成增强+智能管线"技术体系，成功构建覆盖全球30余种语言及方言的130万小时级端到端语音大模型数据集。该成果由青岛市大数据发展管理局推荐，通过突破传统数据集的语言单一性和场景局限性，为跨模态语音交互提供了高覆盖度、强场景化的数据支撑。

在数据处理环节，企业自主研发的多模态数据平台构建了全流程智能化生产管线。通过AI预标注与人工校对的协同机制，结合动态数据增强技术，实现了从数据采集到模型调优的全链路优化。该平台支持管线灵活配置，可根据不同场景需求快速调整数据生产参数，使交付效率提升3倍的同时，资源利用率达到行业领先水平。这种创新模式有效解决了传统数据处理中效率与质量的矛盾问题。

产业化应用方面，标贝科技在青岛、长春、天津等地建立标注基地，同步开放标准化API接口，形成"基地+API"的双重服务模式。这种布局既保证了大规模数据处理能力，又通过标准化接口实现了与各类语音应用系统的无缝对接。目前，该数据集已广泛服务于智能客服、车载语音、医疗问诊等多个领域，推动语音技术从实验室走向规模化商用。特别是在方言识别和跨语言交互场景中，其表现出的高适配性获得行业广泛认可。

技术专家指出，该成果的核心价值在于构建了数据与模型协同优化的良性循环。通过建立"训练-验证-优化"的闭环体系，使模型能够持续吸收实际应用中的反馈数据，形成自我迭代的增强机制。这种端到端的闭环训练体系，不仅提升了模型在复杂场景下的表现力，更为人工智能技术的工程化落地提供了可复制的解决方案。随着5G、物联网等技术的普及，高质量语音数据集将成为智能交互系统的关键基础设施。

今日，阿里旗下通义App今日发布更新，名称正式变更为千问App，版本号为5.0.0。在版本 5.0.0中，千问强调其核心能力包括：“对话问答”“智能写作”“全能相机”三大模块。据知情人士透露，阿里巴巴计…

WisdomAI面向企业客户推出了AI驱动的对话式商业智能（BI）平台，提供AI数据分析业务，用户只需用自然语言提问便可获取分析后的答案。 WisdomAI称：“过去的BI只提供被动的、静态的仪表板，而Ag…

李彦宏在大会上表示，“我们用AI重构搜索结果页，不是简单地在搜索结果中插入AI摘要，而是把搜索从一个以文字内容和链接为主的互联网应用，转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来，AI数字…

“非洲互联网之父”、加纳科网董事长尼·奎诺表示，像乌镇峰会这样的平台为发展中国家提供了宝贵的发声机会和参与空间；世界知识产权组织总干事邓鸿森表示，乌镇峰会为我们提供全球对话与合作的契机，这种对话与合作不仅是…

禾赛科技（NASDAQ: HSAI; HKEX: 2525）近日发布2025年第三季度财务报告，数据显示其营收与利润均实现突破性增长。本季度公司营收达8.0亿元人民币，同比增长47.5%，延续了连续六个季度的正增长态势。净利润方面，公司以2.6亿元人民币创下历史新高，较预期提前一个季度完成全年盈利目标。