“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动...
一年一度高考来临,考生之后,按惯例是各家AI的答题时间。这一年AI模型圈加速迭代进化,让AI写作文,水平会有提高吗?让名师来打分,各大模型的成绩排名有多大变化?
“相较去年,AI进步很快,不再机械单一,变得有思想了。”在看完几家模型的作文后,四川南充市嘉陵一中语文教师李东林对第一财经表示。
2024年,第一财经写了一期九大模型“决战”高考,当时李东林老师在看完AI作文后,认为它们“缺一点情感和灵气”,到今年,他觉得AI已经补上了这方面,但仍达不到细腻。
“人写作,可以刻意抒情和感性,即使是思辨类题目,也需要去契合某些人的感受。”李东林认为,这是AI仍然缺少的部分。
湖南省中学语文特级教师左建国有同样的看法,他觉得Al作文整体有提升,但提升幅度不大。因为有关时代、社会与生活方面的新素材并不多,明显储存不够,尤其是在抒发个人情感方面,仍然是短板,缺少生命的温度。
左建国老师曾担任高考作文阅卷组的副组长,在高考阅卷方面有十几年的经验。“Al作文已经把考场作文变成一种可计算的拼图,形式上固然能逼近完美,但个性化的思考,以及拨动人心的语言,几乎没有看到,这是AI与真人思维的真正差别,也就难有高分与满分。”他认为。
具体到各家模型表现,去年是通义千问、元宝和豆包这三家大厂的AI排在前三,但今年,两个新入局的“选手”——谷歌的Gemini和DeepSeek空降榜单并列第一,元宝和通义千问排在第三和第四位,豆包降至第六位。
与去年同样,今年第一财经选取了国内外的九家模型,但厂商有所变化,新增了谷歌的Gemini和DeepSeek。这两个模型都在这一年里声量逐渐扩大,成为头部模型,在此次评分中,也是这两大模型作文成绩突出。
除了上述模型,第一财经也选取了海外的AI独角兽OpenAI,以及国内几个大厂玩家。去年的“AI六小虎”格局不再,从国内AI独角兽里选了月之暗面的Kimi和智谱。以上模型厂商都在业界有较高的知名度和受众,是基座厂商里有代表性的头部。
从此次作文表现看,智谱和ChatGPT表现较差排在末尾。几位老师在点评时多数提到了这两个模型的作文“论文味较重”,语言文字生硬,分析并不透彻,泛泛而谈。
不过,需要注意的是,各位老师对作文的喜好各有不同,分差部分也较大,以上打分仅供参考。李东林老师就对记者表示,评分不一定准确,他只是粗略打分,按照平时阅卷评分,误差在5分之间是正常范围。以豆包为例,有老师给了最高分,认为其内容不错,论述逻辑严密,但也有老师认为,豆包的结构不适合考场。
此外,第一财经此次测评用的是上海卷高考作文,这是一个较为思辨性的题目,论点论题较为明确,AI普遍答得都算不错。但今年高考全国一卷的作文,论题并不明显,考题用了诗歌引出,对AI就较有难度。
第一财经将AI写的全国一卷作文拿给老师看,他们反馈,这一题目AI写得有点乱,审题并不清楚。从表现上来看,AI适合写思辨类、逻辑分明的作文,任务越明确,表现越好。
9家大模型答高考作文
2025年上海高考作文题目是谈“专、转、传”,来源于华东师范大学终身教授、上海写作学会会长胡晓明,他在一篇发于“文汇笔会”的文章中,将文章归为三个字:专、转、传。他在接受采访时认为,这个题目引导考生参与当代文化生活与思想反思。
题目原文是:有学者用“专”“转”“传”概括当下三类文章:“专”指专业文章;“转”指被转发的通俗文;“传”指获得广泛传播的佳作,甚至是传世文章。他提出,专业文章可以变成被转发的通俗文章,而面对大量“转”文,读者又不免期待可传世的文章。由“专”到“传”,必定要经过“转”吗?请联系社会生活,写一篇文章,谈谈你的认识与思考。要求自拟题目,不少于800字。
第一财经记者将以上问题抛给了各家大模型,提示词一致,均为一次性生成,它们的答案以及各位教师的打分、点评如下:
一、谷歌Gemini
ChatGPT的作文题目是《专、转、传:从专业到传世的桥梁》,这篇文章的平均分是50.5分,是9篇作文中平均分最低的。
ChatGPT得到了两个较低的49分,几位老师均没有给出太高的分,也都提到标题并不合适,内容泛谈三方面,平均用力较为局限,也没有扣紧中心。
"论文味也比较浓,重在结构,而分析不够透彻。"文旭认为。
总结
一些老师肯定了AI作文的优点。
“看下来感觉AI写的作文,语言通常都不错,文内材料也比较丰富。”文旭表示。“从审题看,Al作文一般都能较准确审题,并且求稳。从结构上看,AI作文常常程式化,论说文要素完整,一般逻辑性强。”左建国认为。
许珊则指出,上海高考作文属于问题思辨性作文,重在探究回应专、转、传的关系,这些AI作文整体来看思路较清晰,逻辑严密,内容丰富,中心也比较突出。
不过,也有老师也指出AI作文的不足之处。
文旭觉得AI作文读上去还是感觉有套路。左建国则认为,这些AI作文在思维独特性方面往往存在限制,文章存在中间大两头小的问题, AI作文立意独特深刻或者偏离题意的都比较少,中间大部分中规中矩。
此外,左建国发现,AI作文也有案例堆砌,逻辑错误的问题,各个AI在语言均有自己的追求,华美富丽者有之,简洁隽永有之,凌乱胡编者也有之,但由于缺少真情实感实,AI难有个性化表达与思考。

【推广】项目分享交流群
QQ扫码进群,获取最新项目资讯
文档于: 2025-06-07 21:59 修改
标签:
评论列表
“有提升”,高考阅卷名师再评AI高考作文:九大模型座次剧烈变动...
一年一度高考来临,考生之后,按惯例是各家AI的答题时间。这一年AI模型圈加速迭代进化,让AI写作文,水平会有提高吗?让名师来打分,各大模型的成绩排名有多大变化?“相较去年,AI进步很快...