苹果公司正对语音助手Siri进行全面革新,计划将其升级为具备多模态交互能力的AI平台。据知情人士透露,苹果将在全球开发者大会上发布新版iOS系统,其中包含重新设计的Siri界面、引入谷歌Gemini技术的底层模型、AI驱动的网页搜索功能,以及一款独立Siri应用。此次更新被视为Siri近十五年来规模最大的重构,预计最早于秋季面向消费者推出,恰逢新款iPhone及首款折叠屏设备发布前夕。
新版Siri将深度融入iPhone硬件架构,以"常驻代理"形式内嵌于灵动岛区域。用户可通过两种方式启动:传统语音唤醒或长按电源键触发动画效果,适用于语音查询场景;或从屏幕顶部中央向下滑动唤出"搜索或提问"界面,支持打字与语音双模操作。这一设计调整使通知中心入口移至屏幕左上角,形成更清晰的交互分区。独立Siri应用将提供对话历史、多轮会话及附件上传功能,用户下滑结果界面即可进入完整对话视图。
技术层面,苹果采用谷歌Gemini大模型对本地小模型进行蒸馏训练,实现设备端推理能力。但由于完整Gemini模型参数规模庞大,部分AI查询仍需依赖谷歌云基础设施处理。为平衡云端计算与隐私保护,苹果引入英伟达机密计算技术,通过加密处理中的数据与模型来保障用户信息安全。同时,公司正在评估收购剑桥初创企业Liquid AI等小型公司,以进一步压缩模型体积,提升本地处理效率。
相机与照片应用同步迎来AI升级。Siri将作为独立模式整合进相机界面,支持对拍摄内容进行第三方AI分析或图片反向搜索。相机控制面板新增可定制化小组件,用户可调整快捷操作栏优先级,将景深调整、夜间模式等专业控件置于显眼位置。相册应用则引入"重构"与"拓展"工具:前者可调整照片视角,后者能通过AI生成图像延伸内容,例如补全被截断的建筑下半部分。这些功能旨在追赶谷歌等竞争对手在视觉AI领域的领先优势。






