法国人工智能领域迎来新突破,当地知名初创企业Mistral AI近日正式发布了其最新研发的文档内容识别模型——OCR 4。这一模型凭借其强大的多语言支持能力,迅速吸引了业界的广泛关注。
OCR 4模型在语言支持方面表现出色,能够横跨10个语族,覆盖多达170种语言,无论是主流语言还是小众语言,都能实现精准识别。在性能评估中,该模型在OmniDocBench基准测试中取得了93.07分的优异成绩,其输出结果相较于GPT 5.5 Pro、Gemini 3.1 Pro Preview等竞争对手,更受人类评估者的青睐。
Mistral AI强调,OCR 4不仅是一个功能强大的识别工具,更是一个小型、高度聚焦的模型。它在输出文本内容的同时,还能提供边框定位、区域分类以及置信度评分等附加信息,为后续的文档处理和分析提供了极大便利。该模型还支持RAG语义分块、智能体结构化基本单元以及连接器结构化内容等多种下游工作负载,进一步拓展了其应用场景。
在定价策略上,Mistral AI也展现出了其市场竞争力。OCR 4基础API的调用费用为每千页4美元,若采用批处理方式,用户还可享受高达50%的优惠。同时,针对文档人工智能服务,公司也设定了每千页5美元的合理价格,为不同需求的用户提供了灵活的选择。






