2026年全国高考期间,一场别开生面的“人机对决”引发社会广泛关注。六家中外知名人工智能企业携旗下大模型参与上海卷作文测试,最终DeepSeek与谷歌Gemini凭借出色表现并列榜首,这场科技与人文的碰撞为教育领域带来全新思考。
本次测试选用上海卷作文题,要求探讨科技发展对人类想象力的影响。参与评测的AI包括DeepSeek V4、字节跳动豆包13.6、阿里Qwen3.7、月之暗面Kimi2.6、OpenAI GPT-5.5及谷歌Gemini 3.5 Flash。评测团队由资深媒体人与中学语文教师组成,从审题精准度、论证逻辑性、知识广度、文采表现及人文温度五个维度进行综合评分。
夺冠作品《想象:拒绝驯服》展现惊人思辨力。DeepSeek以“科技祛魅与文学复魅”为核心论点,通过赫胥黎《美丽新世界》与乔布斯“Stay hungry”的对比,揭示算法推荐对想象空间的压缩。文中“科技能模拟星空壮丽,却难复制古人观星时的壮阔情怀”等表述,将科技理性与人文感性碰撞展现得淋漓尽致。评委特别指出,该文跨学科引用本雅明机械复制理论,展现出超越普通考生的知识储备。
并列冠军Gemini的《虚实之间,边界何在》以诗意语言构建思辨框架。文章通过“信息茧房”概念,指出AI绘图技术对文学想象力的消解作用,引用木心“从前慢”的诗句,呼吁保留“科技无法计算的浪漫”。评委盛赞其“将《红楼梦》的留白美学与赛博朋克进行时空对话”,展现出独特的文化洞察力。
季军作品Kimi的《望远镜与显微镜之间》构建双重隐喻体系。通过泰勒斯寓言切入,将科技发展具象化为观测工具的进化。文中“当AI可以生成诗歌时,人类想象应转向算法幽暗之地”的论断,引发评委对技术时代人文价值的深度思考。尽管部分段落稍显学术化,但其提出的“双重视力”理论仍获高度认可。
豆包与Qwen的作品虽未跻身前三,却展现出不同特色。豆包《被重塑的想象》通过凡尔纳科幻预言与现代科技成就的对照,论证想象力的迭代过程;Qwen《守护想象灯塔》则借用《周易》“穷则变”理念,强调人文精神对技术异化的抵御作用。这两篇作品均因结尾稍显模板化而影响评分。
令人意外的是,国际知名模型GPT-5.5仅获53分。评测报告指出,该文虽能完整论述科技与想象的辩证关系,但存在“世界观塑造”与“想象改造”的主题偏移,且“思想的翅膀”等表述缺乏新意。这暴露出通用大模型在特定文体训练上的不足。
评测团队负责人透露,今年AI作文质量显著提升,去年常见的逻辑断裂、事例重复等问题基本消失。所有作品均在30秒内生成,且未进行任何人工润色。这种进化速度令教育专家担忧:“当AI能完美模仿高考满分作文,语文教育的本质是否需要重新定义?”
这场特殊测试在社交媒体引发热议。有网友认为AI已具备冲击人类创作领域的实力,也有人指出“机器缺乏生命体验,永远写不出‘但愿人长久’的深情”。教育界则开始探讨如何将AI评测纳入写作教学体系,培养兼具技术素养与人文情怀的新时代人才。






