在百度AI开发者大会上,李彦宏提出"日活智能体数"(DAA)作为衡量AI应用价值的核心指标,引发行业对AI产品评估体系的深度思考。这一概念将AI发展比照移动互联网时代的DAU(日活跃用户数),强调从技术投入转向实际产出的评估逻辑。但业内专家指出,不同场景下智能体的"活跃"质量存在本质差异,单纯统计打开次数难以反映真实价值。
以独立聊天类AI应用为例,用户需要切换工作界面、组织语言输入问题、人工校验结果并整合到原文档中。这种"活跃"存在显著断点:上下文割裂导致信息损耗,结果可用性高度依赖用户二次加工。某政务部门测试显示,此类应用处理公文时,格式错误率高达32%,用户实际节省时间不足15%。
与之形成鲜明对比的是嵌入式智能体。在金山办公的实践案例中,AI深度集成于文档编辑界面,能够自动识别红头文件、发文字号等38项政务格式规范。当用户编辑到特定段落时,系统自动触发符合GB/T 9704标准的排版建议,将公文起草时间从3小时压缩至40分钟,格式错误率下降75%。这种"无感化"服务使AI真正融入工作流,而非增加操作负担。
中山市政务平台的部署案例具有典型意义。该系统基于60万份本地政务文档构建知识库,涵盖行政审批、公文流转等核心场景。通过解析历年真实公文数据,AI不仅掌握通用写作规范,更理解"中山市发文字号编码规则""特定部门红头文件字体要求"等地域化特征。这种深度适配使智能体在政务场景的渗透率达到92%,远超通用型产品。
金山办公2025年报数据显示,其AI功能日均调用量突破2000亿次,月活用户超8013万。这些调用全部发生在文档编辑、表格处理等生产场景中,与独立AI应用的"好奇型"使用形成鲜明对比。QuestMobile报告证实,WPS Office在办公商务领域保持月活第一,其AI功能用户日均使用时长达到47分钟,是行业平均水平的3.2倍。
行业分析师指出,AI价值评估正在经历三重转变:从模型参数竞争转向场景落地能力,从技术指标炫耀转向商业价值验证,从用户规模比拼转向使用深度测量。在政务、金融等专业领域,智能体的"含金量"取决于其与工作流的耦合程度,而非简单的打开次数。这种转变正在重塑AI产品的设计逻辑——不是让用户适应AI,而是让AI适配用户的工作方式。
当前技术演进呈现明显分化:通用大模型继续追求参数规模突破,而垂直领域智能体转向知识工程深耕。以公文处理为例,需要解析数十年积累的格式规范、业务术语和审批流程,这远非单纯的语言模型训练能够解决。金山办公积累的38年文档处理经验,正在转化为AI落地的关键壁垒。
这种转变在用户行为数据中得到印证。在某省级政务平台测试中,嵌入式AI使公文处理效率提升65%,而独立型AI仅提升18%。更关键的是,前者用户留存率达到89%,后者不足40%。这表明,当AI真正解决工作痛点时,用户会形成持续使用习惯,而非尝鲜式体验。
随着AI技术进入深水区,行业评估体系面临重构。DAA概念的提出具有里程碑意义,但其有效实施需要建立场景化分级标准。在政务、金融等专业领域,或许应该引入"任务完成率""流程优化度"等更精细的指标。毕竟,对基层公务员而言,AI的价值不在于被打开多少次,而在于能否让每天处理的百份公文全部符合规范。






