首页  >  测评  >  文章
2023-08-18 11:19

百度文心一言8月升级实测:技能树大爆发!一句话生成广告大片,海量插件正在路上

AI聊天机器人:文心一言

工具介绍:文心一言是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。

工具链接:https://www.aieva.cn/sites/277.html


8月16日,国家工程研究中心举办的WAVE SUMMIT深度学习开发者大会上,百度CTO王海峰介绍了文心大模型的最新产品开发进展。

据百度官方介绍,活动当天,文心一言已经对内测用户上线5款官方原生插件:百度搜索、览卷文档、E言易图、说图解画、一镜流影(延后上线)。

要说起来,文心一言推出小半年以来,一直被诟病「一直在内测」。这里边有AI大模型牌照核发的客观原因。

即日起,家人们登录到文心一言,可以一次性☑️勾选调用3款插件:览卷文档、E言易图与说图解画。步骤是:点击提示词输入框左上角的插件小菜单,勾选你想启用的插件。

下面EVA将会分别介绍这5款插件的功用。分别如下——

百度搜索:联网能力默认开启

即实时联网功能,能让文心一言AI聊天机器人从百度搜索上获取最新的资讯。该功能就不需要多说,简单测试一个今天刚刚发生的事件——8月17日的A股收盘价。

这个问题对AI来说轻松,没什么疑问。

不过当我询问关于近日视觉中国与星空摄影师戴建峰发生的版权纠纷事件时,文心一言开始出现“AI幻觉”,自编自导了一个“白狮王”的剧情出来,抛开这个关键词,其他部分的回复还是与事件吻合的。

通常来说,AI聊天机器人很善于回答关于体育赛事这类十分强时效性的即时消息。我尝试询问一个8月16日前天发生的比赛——女足世界杯哪两支队伍会师决赛?

在我的追问下,文心一言并没有掉入我的迷惑陷阱。不过,当我换了一个问法时,它还是露出了马脚——

真是又一次刺伤中国球迷,EVA默默滴在回复的右下角点了个?。

览卷文档:帮你总结各类文档内容

该插件原名ChatFile,因为之前的英文名不好记于是改成了中文名。该插件可基于10MB以内的Office或者PDF文档进行解析,并完成内容摘要生成、相关内容问答以及二创等任务。

比如EVA上传了一份腾讯8月16日公布的2023年第二季度财报,然后请AI帮我们总结一下财报的主要内容。

这时候AI就会直接调取刚刚我上传的这份PDF报告里边的内容,而不会自己“脑补”一些有的没的。

我们还可以就这份文档提问一些其他相关的问题,比如:腾讯第二季度是亏了还是赚了,什么原因产生的变化?

AI很清晰地给出了相关作答,并且提供了各项业务状态的一些具体的分析。这对于做价值投资的家人们有着相当友好的帮助。

EVA很想尝试一次“极限挑战”——我尝试上传《三体》第一部的PDF,文心一言花了1分钟时间分析了100页的小说故事,但全文多达300余页,说明AI无法分析全部内容。看看AI能否帮我们归纳故事的基本梗概。

我来提一个问题:请文心一言帮我归纳《三体》第一部大概说了什么?

文心一言不仅帮我梳理了这100页的故事,顺理的故事情节基本没问题,而且还明确指出了叶文洁拯救人类文明出现在第88页。不过EVA核实了一下,这里应该是“编的”。

随后我向AI咨询了一下故事中的具体人物关系:杨冬是叶文洁的什么人?

Emmm……EVA竟无言以对……看来“览卷文档”插件应付短文档无压力,面对超长文档的token能力还欠缺一点。

E言易图:一句话生成思维导图

基于Apache Echarts为您提供数据洞察和图表制作,目前支持7类图表?生成:柱状图、折线图、饼图、雷达图、散点图、漏斗图、思维导图(树图)。Apache Echarts是一个由百度前端技术部门开发,基于Javascript数据的可视化图表库。

既然如此,咱们就来考一考文心一言对于事情的分析与逻辑整理能力。还记得咱们昨天推送的钉钉个人版上线的文章吗,我当时请钉钉AI帮我生成了一张关于“如何开发一款新手机”的思维导图。

错过文章推送的家人们可以点击?下方的链接跳转阅读。

?你每天用来打卡的钉钉刚上架AI版本,助你消除失业焦虑丨附邀请码

EVA马上测试一下同样的提问方式,我使用的提示词口令是“请帮我生成思维导图,主题是XXX”,来看文心一言是如何作答的——

从结果来看,文心一言想到的方面更周全,加入前期调研与后期维护。但是在脉络梳理上没有钉钉那么注重逻辑分支整合,而是将优先级有先后的步骤简单地平铺,比如“后期维护”这一项,收集问题-修复问题-更新版本是独立的逻辑线。

在多次实际测试中,EVA发现这个提示词不太稳定,经常会出现判别概率性偏移,无法调用E言易图插件能力,而是直接以文本形式作答。

说图解画:看懂万物,读懂万物

该插件为文心一言多模态“图生文”能力,基于图片进行文字创作、回答问题,可帮助用户构思文案、撰写故事。

比如这张示例图片,文心一言准确识别了图中呈现的场景,并且在缺乏人物正脸的情况下,依然准确判别了性别。

换一张生活中不那么常见的场景,AI准确识别出特型车辆以及数量。

那能识别网络梗图么?EVA选了几个最近比较火的。比如调侃苹果Vision Pro头显的这张梗图,文心一言基本上能够解读清晰画面语言。

不过在面对小鸡子玩偶时,却怎么重试都只能识别成小鸭子。?

在实测中,EVA发现该插件禁止识别公众人物,比如李彦宏、马斯克等等;也无法识别带有©版权的商用图库的图片。

一镜流影:一句话生成广告大片变为现实

该插件提供AI文字生成视频,只需提供主题词、陈述介绍文案、段落篇章等文字描述内容,即可一键创作生成视频。该功能对于许多缺乏能力进行品牌开发的小微商户来说简直是福音。BTW,事物总有双刃剑,对于“营销号”亦如此。

比如说,我们先让文心一言帮忙起一个有创意的牛奶品牌,这个很轻松。

然后在给出的品牌名称基础上,我们再让文心一言写一段介绍广告文案。

最后,只需要求文心一言根据以上内容生成一则视频,“啪”一下敲回车,数十秒的时间,一则包含画面、转场和旁白、能打七八十分的广告短片就诞生了!

不过由于算力能耗较高,“文生视频”插件一镜流影尚未全面内测进行。未来,文心一言团队计划将开放更多第三方插件,目前已经开始在官方飞桨社区进行招募。

据官方介绍,文心一言的快速进步,得益于飞桨产业级深度学习开源开放平台和文心大模型的互相促进。在效率方面,通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署协同优化,文心大模型训练速度达到原来的3倍,推理速度达到30多倍。

百度希望打造个性化的AI助理能力。比如说,百度在现场演示,输入“我后天上午去上海研发中心开会,当天返回北京,请帮我规划行程”,AI可快速调用不同模块或平台的能力,自动为用户提交差旅申请、预定往返机票和酒店等操作,就像一名真正的人类助理一样。让以前的小时级工作流程,压缩至分钟级内。

7

相关文章