首页  >  资讯  >  文章
2023-08-15 18:54

GPT-4实锤变蠢:科大讯飞发布星火认知大模型V2.0,这次真有可能迎头赶上

AI聊天机器人:讯飞星火认知大模型

工具介绍:讯飞星火是科大讯飞自主研发的认知智能大模型,源自“星星之火可以燎原”之寓意,通过学习海量文本、代码和知识,具备了跨领域的知识和语言理解能力,能基于文本输入、语音交互等自然对话方式理解和执行任务。

工具链接:https://www.aieva.cn/sites/1195.html


编辑推荐:最近两个月以来,不少用户诟病OpenAI的GPT-4大模型正在逐渐变蠢。来自国外高校的研究团队通过测评发现,GPT-4的准确度与能力值对比前一个季度明显变差,突出表现在回答专业问题与代码能力上。逆水行舟,不进则退。这给了国内大模型开发商千载难逢的追赶机遇。


以下文章来源于智东西 ,作者程茜

智东西:智能产业新媒体!

作者 |  程茜

编辑 |  漠影

讯飞星火大模型又双叒更新了!8月15日,讯飞星火大模型迎来年内第二次重磅升级,V2.0来了!

代码、多模态交互两大能力重磅升级,文本生成、理解能力持续提升

一开场星火就写了份欢迎词。星火首先回顾了星火大模型前两次升级的内容,不同于之前的泛泛通用型介绍,而是有理有据的个人知识的学习。

在解决数学能力上也大幅升级,星火能综合运用三角函数、方程、等差数列方面的知识来解决数学问题。

诗句理解上,星火可以给出“与尔同消万古愁”的出处,并写出全诗。同时还能赏析《将进酒》中的诗句,并运用这两句诗写出一篇范例作文。

星火还能“立人设”,将它设定为“虚拟陪伴伙伴”,它就可以为聚会提出制作哪些美食、举办哪些活动的建议。

用户日常体验中,还可以通过语音直接对话,模拟真人“面对面”交流。

1️⃣五大代码能力升级,几分钟生成贪吃蛇

到了最重磅的代码能力展示环节,星火大模型包含代码生成、代码补齐、代码纠错、代码解释、单元测试生成五大代码能力。

在代码能力展示环节,星火都是现场写代码、现场运行。

刚开始,星火就快速展示了其使用python生成了“判断输入字符串是否符合密码规则”、画出“红色的心形线”等功能。

随后,演示人员还增加了指令,如果输入密码不符合规则时给出理由,生成的代码就会相应给出“不少于8位”等原因方便用户调整。

同时,星火还能快速将视频片段转化成GIF动图,也能快速生成经典的贪吃蛇小游戏,包含72行代码,并且每一段都给出了相关的注释。

基于OpenAI构建的代码能力公开测试集HumanEval和认知智能全国重点实验室构建的代码实用场景测试集iflyCT-py,星火在python语言下,代码生成和代码补齐能力超过ChatGPT。

2️⃣图像理解能力明显领先,数字人形象、音视频轨道一气呵成

当演示人员输入风景图、萌宠图、家庭场景图片时,星火都能对图片中的主要物体、人物进行描述,还辅以环境氛围的表述。如果用户想要配合图片发朋友圈,星火还能给出朋友圈文案。

此外,星火还支持用户现场拍照,将图片上传进行描述。

刘庆峰谈道,在国内业界公开可测的大模型中,星火对图像的理解能力明显领先。用户还可以追加在雪山图片中加入“一个小女孩在登山”的元素。

多模态合成能力中,星火一举撑起了文案、后期、剪辑、配音……的工作,当让它“创作一篇立秋抒情散文,并用一个短发民国风的女生形象生成视频”,讯飞小助手就可以快速生成视频,用户还能变更数字人的形象、声音、视频的背景。

整体来看,讯飞星火大模型各项能力表现优异,在国内主流大模型测评榜上,其“智商”排名也名列前茅。8月12日,新华社研究院发布的《人工智能大模型体验报告2.0》中,讯飞星火在智商指数和工具提效指数两个维度获得第一。

感兴趣的家人们可以点击?下方链接阅读测评全文。

新华社发布AI大模型测评,这家是冠军

星火化身资深代码工程师:剪辑师、口语老师、助教…

与此同时,科大讯飞正在将大模型的强大能力打造成用户快速可用的产品。

1️⃣iFlyCode:零代码基础也能编程

基于星火大模型的强大代码能力,讯飞推出智能编程助手iFlyCode,演示现场,iFlyCode接到的第一项任务就是“开发凌空手写的应用”。

首先,iFlyCode给出了一些实现的思路,开发者需要采集视频流、手部主要点位检测、侦测捏动手势、生成轨迹点。随后,它给出了具体的实现步骤,用户可以直接点击步骤,调用相关的代码、函数来辅助完成应用开发。

一开始,iFlyCode辅助生成的应用中,用户手部的关键帧是独立的点。基于星火的修改代码能力,用户可以选中整个代码,输入“将轨迹点颜色改为黄色,用线条连接”的修改代码命令。改完后,用户还可以快速比较修改前后的代码然后进行快速替换。

刘庆峰感慨,结合星火大模型的能力,用python代码完全实现凌空手写的应用开发只需要10分钟内,之前有经验的工程师可能需要半天才能完成。

2️⃣讯飞智作2.0:后期剪辑、配音演员、文案编辑,一个工具统统解决

基于星火大模型的多模态能力,讯飞升级了讯飞智作。

讯飞智作是讯飞2017年推出的虚拟形象配音产品,讯飞智作2.0升级了AI后期和创意视频两个功能。可以为视频生成文案、配音。

创意视频中,用户可以直接输入视频要求、上传相关的图片。当企业想要生成黄山毛峰的宣传视频时,讯飞智作能够基于用户上传的配图和讯飞智作使用AI生成的相关图片来生成视频。

3️⃣星火语伴2.0:随手拍就能口语对话,模拟真人雅思考官

星火语伴2.0全新升级,能让用户练习口语时实现更深入的交流,用户可以选择感兴趣的场景进行交流,对话结束后,星火语伴还会生成一个对话小结。

此外,还有大学生普遍需要的四六级、雅思、托福等,星火语伴可以模拟更加真实的人机互测,让用户与雅思考官模拟面对面对话。

4️⃣星火教师助手:帮老师做课件、布置作业,还能一键生成课堂思维导图

讯飞畅言智慧课堂已经落地到全国1200多万师生中,基于人工智能可以分析学生的情况,实现因材施教。

星火教师助手能快速生成相应主题的课堂设计文档,同时,教师还可以在已生成的环节中添加活动。AI助手能基于教学设计、大模型的理解能力,帮助老师一键生成课件,并根据教学内容自动填充相关多媒体内容,还会加入对应的图片、视频、表格。

星火教师助手还能生成思维导图,帮助学生提升结构化思维能力。

大模型深入行业应用,联合华为发布星火一体机

讯飞已经和汽车、金融等行业达成合作,汽车厂商奇瑞搭载星火大模型的产品即将发布。在教育领域,讯飞学习机的销量大幅上涨,今年5月至今同比增长了180%。

活动上,科大讯飞联合华为发布了帮助企业快速部署的星火一体机。这一设备既允许企业从头到尾训练大模型,也能基于讯飞星火大模型针对场景快速优化。

刘庆峰认为,通用人工智能时代的发展正在彻底改变当今社会的生产和生活方式,谁能率先推出拥有持续算力和最好的算法,就可以源源不断地汇聚数据,形成全球的“最强大脑”。

结语:大模型的新战场,应用落地正加速

站在今天的新节点上,国内大模型间的应用落地之战已经揭开帷幕,科大讯飞成为率先出手的厂家之一。这已经是讯飞星火大模型年内第三次升级,不论从大模型能力,还是星火的行业应用进展来看,星火大模型的影响正在辐射至各行各业,教育、金融、汽车行业的联合应用落地已经初见成效。

下一步,今年10月24日,讯飞星火大模型的能力将对标ChatGPT,明年将对标GPT-4,随着大模型能力的不断提升,其对于不同行业的实质影响也会愈发凸显出来。

9

相关文章