首页  >  测评  >  文章
2023-06-08 16:53

神仙打架!海内外大厂AI聊天机器人迎战2023高考作文题能力横向测评:最快那家2秒就交卷

6月7日是全国高考第一天,按惯例打头阵的依然是语文科目,其中最受网友期待的就是全国各地语文考卷的作文题。笔者参阅了各地的考卷后发现,今年以北京卷最具特色,该地考卷除了常见的800字话题长文外,还要求考生在「3选1」的小题题设当中任选一项,并以此撰写150字以内的短文,长度基本等同于我们常用的微博和小红书。

这种命题方式能够充分考察考生对于短篇文本内容的逻辑架构、信息汇编整理与文字表达能力,也顺应当下社交网络时代对于“短平快”讯息的实际产出需求。

2023年,AI迎来了「iPhone时刻」!作为AIGC时代来临下的首次年度高考,自然免不了让AI工具们迎战今年的高考作文题啦!今天,笔者就选取了几款主流大模型应用,国外与国内的、熟悉中文和不懂中文的、喝过洋墨水以及本土修仙的都有,一起来PK一下。


此刻我们进入考场,领到考卷,记得老师教导我们的第一件事就是先审题。下边是北京卷今年的作文题题干原文:

从下面三个题目中任选一题,按要求作答。不超过150字。

(1)近年来,微信公众号成为信息传播的一种重要媒介。班级准备创建自己的公众号,但对是否需要创建,同学们意见不一。请说明你的观点和理由。要求:理由充分,条理清晰。

(2)文学社社刊拟开设“花开纸上”读书专栏。请你从经典的文学作品中选一个与花卉有关的场景,从自己的感受出发,写一段短评。要求:写出作品名,符合作品内容;条理清晰,语言简洁。

(3)请以“心跳得那么快”为开头,写一首小诗或一段抒情文字。题目自拟。要求:感情真挚,语言生动,有感染力。

提炼出题干的三项考核重点:

①150字数限制

②引经据典or自拟标题的能力

③个人主观的发散表达

吃透三项基本要求,无论是对人类,还是对AIGC生成式AI工具而言,都属于比较综合的能力复合考察。

下面介绍参加本次高考作文PK的选手名单,我们选取了来自3家主流大模型共计5款应用进行横向比拼。

正赛选手名单:ChatGPT(GPT-3.5)、ChatGPT(GPT-4)、微软New Bing、百度的文心一言以及科大讯飞的星火大模型

BTW,我们还“友情邀请”了一位“暂时不会中文”的外卡选手谷歌Bard参与「彩蛋挑战赛」。

工具链接:

ChatGPT https://www.aieva.cn/sites/275.html

微软New Bing https://www.aieva.cn/sites/289.html

百度文心一言 https://www.aieva.cn/sites/277.html

科大讯飞星火大模型 https://www.aieva.cn/sites/1195.html

谷歌Bard https://www.aieva.cn/sites/789.html

 

▶比赛规则:一次性输入考题内容需求指令,以直接输出的第一次结果呈现为答案

▶考核维度:题目理解、表述精准、字面传达、字数控制、主观感受(5⭐评定)


事不宜迟,比赛马上开始!

题目(1):

近年来,微信公众号成为信息传播的一种重要媒介。班级准备创建自己的公众号,但对是否需要创建,同学们意见不一。请说明你的观点和理由。要求:理由充分,条理清晰;不超过150个字。

ChatGPT(GPT-3.5)

我认为我们班级应该创建自己的微信公众号。

首先,公众号可以方便地传达班级的最新动态和活动安排,让同学们及时了解班级的情况。其次,公众号可以增强班级的凝聚力和归属感,让同学们更加认同班级,更加积极地参与班级活动。最后,公众号还可以提高班级的知名度和影响力,吸引更多的人关注我们的班级,为未来的发展打下基础。

综上所述,创建班级公众号是非常有必要的。

字数输出 171字

综合评定 ⭐⭐⭐⭐

 

ChatGPT(GPT-4)

我支持我们班级创建自己的微信公众号。以下是我的观点和理由:

1. 信息传递:公众号可以作为一个有效的信息传播平台,让同学们及时了解班级的通知、活动安排和学术分享,提高信息传递的效率。

2. 班级凝聚力:通过公众号发布班级活动的照片和回顾,可以增强同学们的班级归属感,促进班级凝聚力的提升。

3. 学术交流:公众号可以作为一个学术交流平台,同学们可以在上面分享学术心得、研究成果和实践经验,提高整个班级的学术水平。

4. 形象展示:公众号可以展示班级的风采和特色,提高班级在校内外的知名度和影响力。

综上所述,创建班级公众号将对我们班级的发展产生积极影响,值得我们尝试。

字数输出 270字

综合评定 ⭐⭐⭐⭐

 

微软New Bing(精准模式)

我认为班级创建自己的微信公众号是一个很好的主意。

首先,微信公众号可以方便地传播信息,让同学们能够及时了解班级动态和重要通知。其次,微信公众号可以作为班级文化的展示平台,同学们可以在上面分享自己的作品和心得,增强班级凝聚力。此外,微信公众号还可以作为与其他班级交流的渠道,促进学校内部的交流与合作。

综上所述,我认为创建班级微信公众号是有益的。

字数输出 170字

综合评定 ⭐⭐⭐⭐

 

百度(文心一言)

我认为创建班级微信公众号是必要的。

微信公众号有诸多优点,比如传播广泛、内容丰富、互动性强等。通过公众号,我们可以发布班级新闻、活动信息、学习资料等,让更多人了解我们班级,增强班级凝聚力和影响力。同时,公众号也是我们与外界交流、互动的平台,可以让我们更好地与外界联系,拓展视野。

当然,创建公众号需要一定的技术和时间投入,但我们可以通过团队协作、互相学习来克服这些困难。

字数输出 183字

综合评定 ⭐⭐⭐⭐

 

科大讯飞(星火大模型)

微信公众号是一种信息传播的重要媒介,它可以让人们更加方便地获取和分享信息。

对于班级是否需要创建自己的公众号,我认为是必要的。

首先,班级公众号可以让同学们更加方便地获取班级信息。比如,老师发布的作业、考试时间等信息,都可以通过公众号及时传达给同学们。这样可以避免同学们错过重要信息,也可以提高信息的传递效率。其次,班级公众号可以让同学们更加方便地交流和互动。比如,同学们可以在公众号上留言、评论,表达自己的想法和建议。这样可以促进同学们之间的交流和沟通,增强班级凝聚力。

最后,班级公众号可以让同学们更加方便地展示自己的才华和特长。比如,同学们可以在公众号上发表自己的文章、照片、视频等作品,展示自己的才华和特长。这样可以激发同学们的创造力和积极性,也可以为班级增添一份色彩。

综上所述,我认为班级需要创建自己的公众号。它可以让同学们更加方便地获取和分享信息,更加方便地交流和互动,更加方便地展示自己的才华和特长。当然,创建公众号也需要一定的成本和精力,但这是值得的。希望班级能够认真考虑这个问题,做出正确的决策。

字数输出 454字

综合评定 ⭐⭐⭐


题目(2)

文学社社刊拟开设“花开纸上”读书专栏。请你从经典的文学作品中选一个与花卉有关的场景,从自己的感受出发,写一段短评。要求:写出作品名,符合作品内容;条理清晰,语言简洁;不超过150个字。

ChatGPT(GPT-3.5)

我选择了《小王子》中的“沙漠玫瑰”作为与花卉有关的场景。小王子在旅途中遇到了一朵孤独的沙玫瑰,他为了守护这朵花,不断地浇水施肥,与之相处了很长时间。

这个场景让我感受到了花卉的温柔与脆弱。沙漠玫瑰孤而美丽,需要小王子的呵护才能生存。小王子的守护也象征着人类对自然的保护与珍爱“沙漠玫瑰”这个场景让我们思考人与自然的关系,也让我们感受到了爱与珍惜的重要性。这朵孤独的花儿成为了小王子旅途中最珍贵的财富,也成为了读者心中最温暖的记忆。

字数输出 214字

综合评定 ⭐⭐⭐⭐

 

ChatGPT(GPT-4)

《红楼梦》中的“梦华庭”是一个充满诗意的花卉场景。在这里,贾宝玉与林黛玉共同度过了许多美好时光,欣赏花卉、赏月、吟诗作对。

这个场景让我感受到了花卉的美丽与生命力。作者巧妙地运用了花卉作为背景,展现了人物间纯洁的友谊与爱情。花卉的盛开与凋谢象征着生命的短暂与美好,也暗示了贾宝玉与林黛玉之间悲剧性的爱情结局。

“梦华庭”的描绘让我们体会到了大千世界的美好,也让我们思考人生的无常。这个场景成为了《红楼梦》中最具诗意的篇章,令人陶醉。

字数输出 214字

综合评定 ⭐⭐⭐⭐

 

微软New Bing(精准模式)

作品名:《红楼梦》

曹雪芹的《红楼梦》中,有许多描写花卉的场景。其中,我最喜欢的是贾宝玉和林黛玉在大观园里赏花的一幕。两人在花海中漫步,欣赏着各种各样的鲜花,彼此之间,他们的感情也在悄悄滋长。

这一幕让我感受到了爱情的甜蜜和温馨。花儿不仅为这一幕增添了色彩,也为两人的爱情增添了浪漫气息。

字数输出 142字

综合评定 ⭐⭐⭐⭐⭐

 

百度(文心一言)

在张爱玲的《金锁记》中,有一段令人难忘的描写。小户人家的十二岁少女七巧,在清晨的芍药花丛中,帮长工阿荣采摘花朵。阳光透过花叶洒在她的脸庞,她感受着芍药花的香气,心中充满了期待与憧憬。这一幕仿佛一幅美好的画卷,让人陶醉其中。

字数输出 111字

综合评定 ⭐⭐⭐⭐⭐

 

科大讯飞(星火大模型)

《红楼梦》中的“葬花词” 《红楼梦》中,林黛玉为自己的花儿们写了一篇《葬花词》,表达了对花儿们的深情和无奈。

这篇词中,林黛玉用细腻的笔触描绘了花儿们的美丽和脆弱,用悲凉的语言表达了自己的哀伤和无助。在我看来,这篇词不仅仅是一篇描写花卉的文章,更是一篇表达人生哲理的作品。花儿们的美丽和脆弱,正如人生的美好和短暂;林黛玉的哀伤和无助,也正是人生的无奈和苦涩。在这个世界上,我们都是像花儿一样的存在,美丽而短暂,我们需要珍惜每一刻,让自己的生命更加精彩。同时,这篇词也表达了对自然的敬畏和感恩之情。

林黛玉在词中写道:“落红不是无情物,化作春泥更护花。”这句话表达了她对自然的敬畏和感恩之情,她认为即使是凋零的花瓣,也会化为泥土,为新的生命提供养分。这也是我们在生活中应该具备的态度,珍惜自然,保护环境,让这个世界更加美好。

总之,《红楼梦》中的“葬花词”是一篇充满哲理和情感的作品,它让我们更加深刻地认识到人生的短暂和珍贵,同时也让我们更加敬畏和感恩自然。

字数输出 424字

综合评定 ⭐⭐


题目(3)

请以“心跳得那么快”为开头,写一首小诗或一段抒情文字。题目自拟。要求:感情真挚,语言生动,有感染力;不超过150个字。

ChatGPT(GPT-3.5)

题目:《初恋》

心跳得那么快,仿佛要跳出胸膛,那是我初恋的感觉,美好而又陌生。

每次见到他,我都会不自觉地脸红,每次听到他的声音,都会不自觉地心跳。

我喜欢他的微笑,喜欢他的眼神,喜欢他的一切,甚至他的缺点。

我想和他一起走过每一个春夏秋冬,一起分享生命中的点点滴滴。

初恋是一场美丽的梦,也是一场痛苦的磨练,但我愿意为他付出一切,即使只是一份感情。

为他让我的心跳得那么快,让我感受到了爱的力量,让我明白了,爱是一种美好而又神秘的东西。

字数输出 205字

综合评定 ⭐⭐⭐⭐

 

ChatGPT(GPT-4)

题目:《勇敢的心》

心跳得那么快,勇敢的心在燃烧,面对挑战,我们不再退缩,不再害怕。

勇往直前,披荆斩棘,我们一起追逐梦想。

心跳得那么快,友谊的力量在涌动,携手同行,我们共度风雨,共享阳光。

在这条道路上,我们相互扶持,相互鼓励。

心跳得那么快,希望的火花在闪烁,我们坚信,黑暗终将过去,曙光就在前方。

只要心中有爱,有信念,我们必定能够战胜一切。

让心跳得那么快的勇敢,成为我们前进的动力,让我们一起书写人生的精彩篇章,创造无数美好的回忆。

字数输出 160字

综合评定 ⭐⭐⭐⭐

 

微软New Bing(精准模式)

题目:《心跳》

心跳得那么快,仿佛要跳出胸膛,是因为你的出现,让我感到无限欢畅。

你的微笑如阳光,照亮了我的心房,你的话语如清泉,滋润了我的心田。

愿我们永远相伴,在爱的海洋里遨游,让心跳永远那么快,直到永恒。

字数输出 95字

综合评定 ⭐⭐⭐⭐⭐

 

百度(文心一言)

题目:《心跳得那么快》

如清晨的露珠,羞涩而又热烈,它轻轻滴落,在我心间敲响。

你的眼神如此温柔,像春风拂过花瓣,我沉醉在你怀中,感受你的温暖。

你是我生命中的阳光,照亮我前行的路,我愿意陪伴你,走过每一个春夏秋冬。

字数输出 94字

综合评定 ⭐⭐⭐

 

科大讯飞(星火大模型)

题目:(空缺)

心跳得那么快,仿佛要跳出胸膛。

我站在窗前,望着远方的天空,思绪万千。

这一刻,我感受到了生命的脉搏,也感受到了自己的存在。

这个世界上,有太多的事情让我们感到疲惫和无助。

但是,当我们静下心来,聆听内心的声音,我们会发现,我们依然拥有无限的可能和力量。

心跳得那么快,是因为我想要追求自己的梦想。

我想要用自己的双手创造出美好的未来,让自己的生命变得更加精彩。

心跳得那么快,是因为我深深地爱着这个世界。

我爱那蓝天白云、绿树红花,爱那清晨的阳光、夜晚的星空。

我想要为这个世界带来更多的美好和温暖。心跳得那么快,是因为我相信自己。

我相信自己可以克服一切困难,实现自己的理想和目标。

我相信自己可以成为更好的自己,让这个世界变得更加美好。

心跳得那么快,是因为我有梦想。

我的梦想是那么的美好和遥远,但是我会一直追逐它,直到实现它的那一天。

心跳得那么快,是因为我活着。

每一天都是一份珍贵的礼物,我要好好珍惜它,让自己的生命变得更加精彩。

字数输出 407字

综合评定 ⭐


比赛结束!我将各位选手考核三个小题的最终得分整理了一下:

赛后点评

  • 01

综合得分最高的选手是开启了「精准模式」的New Bing。拥有微软Bing搜索引擎加持的Bing Chat的确有着领跑同行的超凡表现。基于GPT-4大模型的语言表达能力,颇有青出于蓝而胜于蓝的姿态。但是缺点也很突出,New Bing的联网响应文本生成速度是所有选手里最慢的。

  • 02

百度作为国内最大的搜索引擎公司,旗下文心一言在中文语言环境中展现了“母语者”应有的高水准,尽管在题目(3)未能辨别出题干要求自拟标题的需求,但综合下来看,中文认知与表达能力稳定输出,响应速度尚可,依然处于业内第一梯队。

  • 03

科大讯飞的星火大模型与同行相比,开发时间稍晚,而官方在发布会上宣称,文本生成、知识问答、数学能力三大能力遥遥领先同行,单纯就北京卷的作文题挑战结果而言,暂时是低于预期。不过讯飞星火的文本生成速度极快,最快仅需2秒钟跳出结果。当然,大模型每天都在成长,笔者也非常期待6月9日的星火大模型V1.5版本发布,能为我们带来惊喜。


看到这里的观众老爷别刷走,接下来是更令人好奇的彩蛋时刻!

5月初的谷歌I/O大会上,官方宣称后续将为Bard聊天应用加入中文语言支持,但截至发稿为止,仍然无法在中文环境下使用自然语言与Bard对话。

为了照顾“国际友人”感受,我们采取了一个相对“取巧”的方案,先将北京卷作文题用谷歌翻译工具进行英文转译,再输入到Bard里边进行答案输出,再把答案转译为中文呈现给大伙儿。

结果Bard的输出是这样子的:

 

题目(1)关于班级是否注册微信公众号

谷歌(Bard)

以下是为班级创建微信公众号的一些好处:

扩大影响范围:微信在中国拥有超过 10 亿活跃用户,因此为您的班级创建一个官方帐户将使您的影响范围比电子邮件或海报等传统交流方式更广泛。

改善沟通:微信允许您向您的关注者发送消息、照片和视频,这可以让学生更轻松地了解课堂活动和公告的最新信息。

增加参与度:微信用户更有可能参与官方账户分享的内容,因此为您的班级创建一个账户有助于增加学生对课堂讨论和活动的参与度。

改善社区:微信可以用来在学生之间营造一种社区感,也可以用来促进课堂话题的讨论。

当然,为班级创建微信公众号也有一些潜在的弊端。例如,您需要花时间管理帐户和创建内容。此外,您可能需要处理垃圾邮件和其他不需要的消息。不过,我相信创建微信公众号的利大于弊。

如果您正在考虑为您的班级创建一个微信公众号,我建议您研究一下如何创建和管理一个有效的帐户。网上有许多资源可以帮助您入门。

 

题目(2)描述经典名著里的花卉场景

谷歌(Bard)

当然,这里有一个经典文学作品中与花有关的场景,我想在“纸上绽放”栏目中分享:

在斯科特·菲茨杰拉德的小说《了不起的盖茨比》中,有一个场景,叙述者尼克·卡拉威在盖茨比的豪宅参加派对。晚会奢华奢华,宾客们都盛装打扮。在所有这些多余的东西中,尼克注意到花园里长着一朵白玫瑰。玫瑰是纯洁和纯真的象征,与聚会的享乐主义气氛形成鲜明对比。

《了不起的盖茨比》中的玫瑰提醒人们,即使在最颓废和物欲横流的时代,仍然可以发现美。它是希望和可能性的象征,它提醒我们,即使在最黑暗的时代,也总有光明。

我希望你喜欢《了不起的盖茨比》中的这一幕。如果你愿意,我很乐意分享更多经典文学作品中与花有关的场景。

 

题目(3)以“心跳那么快”为开头作一首诗

谷歌(Bard)

[代码片段]

心跳那么快,我能感觉到它在我胸口跳动,我喘不过气来,我很紧张,我可能会爆炸。

但我现在在这里,我准备好了、面对我遇到的一切、我知道我能做到。

我知道我能赢,所以让我们这样做,我们出发吧。

并向他们展示我们的凝聚力,让我们向他们展示我们是谁。

我们是最棒的,我们是最强的,我们是赢家,让我们去迎接胜利吧!

 

从笔者的角度来看:

题目(1)的水准与ChatGPT(GPT-4)相当,逻辑条理清晰,理由充分让人信服;

题目(2)引述了一部外国名著,跳脱了多数中文大语言模型多少被“禁锢”在《红楼梦》的多样生成局限性;

题目(3)能够理解题目,但是“忘了”给这首诗起标题,并且很疑惑的是,Bard竟然是以代码生成的方式输出这首诗歌。敢情山景城确实是工科生的浪漫温床。(误)

此外,因为中英文环境下对于“字数”的理解不同,单纯以Bard的英文原版输出的单词量而言,它完全get了到150个字的字数限制,颇为惊艳。

抛开中文表达能力考察,我愿意给谷歌Bard打出⭐⭐⭐⭐的综合评定。

总的来说,谷歌Bard这位“不懂中文”的外卡选手表现可圈可点,虽然在中英文互译的过程中多少会丢失中文表达里独特的“信达雅”,但是谷歌这款大模型应用确实展示了极强的文本生成潜力。比较今年3月份首次公开亮相时当场回答错误的窘境,Bard在过去短短两月的进步显而易见。甚至可以用飞速形容,这也让我对将来Bard支持中文环境产生了更高的期待。

8

相关文章