在人工智能领域竞争日益激烈的当下,当众多企业仍在聚焦大模型参数规模的比拼时,360公司另辟蹊径,在AI视觉识别能力上实现了重大突破。其最新推出的FG-CLIP2视觉语言模型,凭借对图像细节的精准捕捉与深度理解,在全球同类模型中脱颖而出,多项测试成绩超越谷歌、meta等国际科技巨头的同类产品,成为当前全球性能最强的视觉语言模型。
FG-CLIP2模型的核心优势在于攻克了“细粒度识别”这一技术难题。该模型能够精准识别图像中的微小差异和复杂细节,例如区分不同品牌、型号的电子产品,或识别人物面部表情、服饰配饰等细微特征。这一突破为具身智能和商业智能化应用开辟了新的可能性。以家庭服务机器人为例,搭载FG-CLIP2的机器人可以准确理解“拿起茶几上屏幕有裂痕的手机”这类复杂指令;在安防领域,系统能够通过“寻找戴黑色鸭舌帽的可疑人员”的描述快速锁定目标,大幅提升实际应用效率。
这一成果的取得,源于360公司在AI领域的长期积累。作为国内较早布局人工智能的企业,360依托搜索、浏览器等核心业务,积累了超过百亿级的图文数据资源。同时,公司自主研发了大规模高质量数据集FineHARD,为模型训练提供了丰富的素材支持。通过持续深耕AI底层技术,360不仅推动了自身技术能力的提升,更为中国构建自主可控的AI技术体系作出了重要贡献。
在中文benchmark综合排名中,FG-CLIP2模型的表现尤为突出。其超越国际竞争对手的成绩,标志着中国企业在视觉语言模型领域已达到世界领先水平。这一突破不仅提升了中国AI技术的国际影响力,也为相关行业的智能化转型提供了强有力的技术支撑。












