OpenAI近日宣布为ChatGPT赋予全新功能,用户上传表单文件后,可通过语音指令或文字描述直接完成信息填写。系统能够自动识别表单字段,并根据用户输入的内容智能补全信息,彻底改变了传统逐项手动录入的交互模式。
在官方演示场景中,用户上传健身俱乐部会员申请表后,仅需口头说明"姓名张三""住址朝阳区""健身目标减脂增肌",ChatGPT便自动识别表单结构并完成填写。整个过程如同与智能助手对话般自然流畅,无需反复切换输入界面或手动定位填写区域。
这项突破性功能整合了多模态技术能力,实现图像理解、语音交互与内容生成的协同工作。系统可同步解析上传图片中的文字信息,接收语音指令并生成符合上下文的填写内容。演示中更展示表单填写完成后,系统自动生成配套的会员卡设计图,展现多任务处理能力。
技术团队指出,当前版本生成的表单内容以静态图片形式输出,暂不支持直接编辑PDF或交互式文档格式。这意味着在法律文件签署等正式场景中,用户仍需将图片内容转录为可编辑格式。文件清晰度直接影响信息提取准确率,模糊或倾斜的表单可能导致字段识别错误。
该功能支持中英文等主流语言,可处理各类结构化表单,包括但不限于会员注册、问卷调查、订单确认等场景。OpenAI表示将持续优化图像解析算法,未来计划增加对复杂表格、手写字体及多页文档的支持能力。






