首页  >  测评  >  文章
2023-07-05 14:05

百度文心一言APP全面测评:国区上架王炸升级,更适合中国人体质的聊天机器人

AI聊天机器人:文心一言

工具介绍:文心一言是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。


中国互联网过去十余年几经辗转沉沦,整体格局还基本保持BAT为主导。其中,百度更是长年坐拥“国内最大搜索引擎”屹立不倒,尽管近几个月被融入GPT-4大模型的微软Bing搜索所冲击,但在中文世界的地位仍然稳如泰山。百度坐拥最海量的中文网络对话数据,于情于理,都应该做出一款优秀的大语言模型应用产品。

3月16日,百度CEO李彦宏带着文心一言初次登台。EVA注意到,最早发布通用大模型的百度,在生成式AI产业的布局,对比国内竞争对手还远远算不上最快。

比如说,科大讯飞比百度晚了一个多月推出自家的大模型,一个月后便实现iPhone、Android和PC全终端覆盖落地;在百度发布文心一言后,360创始人周鸿祎才宣称要跟进孕育自家的“孩子”,如今也已经实现了开发者衔接和360电脑管家、360浏览器等等形形色色的消费级应用落地,甚至率先拿到了工信部信通院授予的大模型官方认证。相比较李彦宏,周鸿祎在公开场合的露脸次数也更频繁。

尽管如此,EVA对于百度的“慢”愿意理解为「稳扎稳打」,信心来源于此前咱们的一篇横向评测:文心一言在国产大模型中取得了最高分,仅次于New Bing。伴随AI监管声音的不断加强,鉴于百度的社会影响力,牵一发而动全身,对于AI应用的探索十分谨慎,也让我们普通用户理应对其有着更高的期许。

文心一言自发布之后一直采取预约排队的方式。今年4月,文心一言团队首次对外发布Android平台的测试版App,继3月首秀后再次引发内测申请热潮,甚至引发了“山寨文心一言”抢滩登陆苹果App Store的戏码。7月4日,文心一言的官方App终于登陆苹果应用商店。这次不是李鬼or李逵,是“李彦宏”来了!

这款App是由文心一言的网页版封装而来,针对手机移动端的交互进行了改善。提供专属AI助理、提示词灵感激发、辅助内容创作、AI文生图绘画、情感陪伴聊天等几大核心功能。官方上架仅一天,就累计了300多条评价,可见其火热程度。需要注意的是,iOS版本目前仅支持iPhone,暂不支持iPad的宽屏界面。

EVA随手翻了一下,除了一部分“水军”给予了五星好评外。切换到“最新评价排序”,不乏对于文心一言的批评之声,主要集中在吐槽产品内测审核排队时间太长。平均分4.1也反映了部分用户心情的真实写照。

当然,除了负面反馈外,不少用户给予了好评。比如对比类GPT国外大模型,使用文心一言不需要「魔法」、文心一言的中文水平表现不错、文心一言解救用户的工作、带来了惊喜等等,也有用户在好评之余提出了一些建设性的意见,可谓损誉参半。

图片

“文心一言”App长啥样?

在上个月,EVA已经率先体验过Android版的文心一言,对于其体验的评价是:简单的网页端大模型封装,缺乏对小白用户的良性引导。时隔一个月,百度终于商用iOS客户端,让我们一起来看下百度取得了哪些进步与不足吧!

首先,启动App后会发现,没有广告!!!可能别的媒体没有提及这一点,EVA对于弹窗开屏广告可就太有感了。至于将来还会不会引入开屏广告,你们猜?

进入App后,整体的界面是非常的简约清爽,与PC网页端十分接近。点击左上角是“历史记录”,此处需要提请批评,竟然没有同步EVA在PC网页端的聊天记录。

点击右上角则是“个人中心”以及基本的功能设置,支持选择切换AI助理的性别,意味着聊天机器人是支持用男声or女声语音播送其生成的内容。此外,文心一言App还支持语音输入文字。

回到最重要的聊天窗口上,使用方法与其他AI聊天机器人无异,不过EVA惊喜地发现,iPhone端的文心一言竟然支持上传图片让AI辨析,意味着百度在手机端提供了跨模态“文生图”“图生文”的能力,这可是PC网页版都没有的功能。不过网页版近期加入的小插件功能,在手机上暂时也是没有的。

体验了几张图片,文心一言能够准确地判读图片的基本含义,并且根据用户提供的文本提示词做出对应的回答。

相信屏幕前已经有家人提前通过文心一言官网申请了内测资格,在这里就不展示多轮对话了。我们今天主要来看看文心一言的App版本与网页版有什么不同。

手指往左边滑动,或者点击顶部的“发现”二字,进入“对话”右侧的“发现”专页。

百度为App用户提供了比网页版更丰富的场景落地演示服务。提供了角色扮演、文本内容创作、各色网站评价、AI绘图、办公生产力服务、学习小助手、生活服务、高考毕业相关、笑话娱乐、论文参考和情感分析等等,总计11个大分类100多种细分应用场景的引导入口。

我随手划一下,大家轻度地感受一下这个Feel……但是体验上也有一个明显缺点,App没有提供“发现”栏目的检索入口,在查找具体的场景入口是比较麻烦的。

殊途同归,这种相似设定也出现在了科大讯飞星火大模型与360智脑大模型,主要面向刚刚接触AI聊天机器人的用户,以EVA观察,绝大多数萌新是不懂得如何去撰写提示词的,而提示词是AIGC生成内容是否精良的关键。以目前来看,文心一言App提供的场景化入口的数量,远远超过前边提到的两家竞品的机器人。

而最重要的是,文心一言App的聊天功能,目前对于用户是完全免费的,绝不夹带私货!

篇幅有限,在100多种应用场景当中,EVA挑几个有意思的为大家尝鲜。

场景入口千千万,写点评、写作文、写公文统统得心应手

比如我让文心一言帮我写一段关于“周杰伦海口演唱会”的朋友圈文案。

虽然一开始的文风比较诡异,但是经过两轮简单引导提示后,完全OK诶。

接下来再试试女生们最爱分享的小红书探店推荐文案。会发现,文心一言App在每一个场景下都会预设三句话的提示,帮助用户撰写提示词举一反三。

不需要太复杂的提示词,就能生成一篇小红书笔记,Emoji表情包、店名、地址、营业时间、餐品点评都没有落下。

疫情过后,今年新上的电影大片不少,EVA本人也跑豆瓣小组,再试试给《速度与激情10》写个豆瓣风格的影评。Emmm……总体差强人意,虽然逻辑保持AI固有的清晰,但满屏套话+评分信息错误,也从侧面反映出,文心一言App是没有与搜索引擎联网的。而我也特意去确认了一下……

EVA看到一个场景入口叫“B站标题优化”,人人都想当标题党的今天,能够提炼一个好标题的确不容易。

试了一下,文心一言把自己夸出花了可真有你的。不过EVA不是很推崇在视频标题里边出现【大括号】。

恰巧写到这,EVA点的外卖到了,我尝试让文心一言帮我写一段电商风格的评价。

不喜欢某个菜色?你甚至可以让AI帮你写差评!当然,首先是不能完全领悟我提出的文案长度需求,其次是AI的逻辑味和中立客观语气挺浓的……

2023高考和中考刚刚结束,趁着还有点余温,EVA让文心一言再写一篇命题作文吧。我选择的是2014年天津卷的高考作文,当年的这道立意超前的作文题,正好涉及人工智能领域相关的,看看AI会怎么写。

也许将来有这么一天,我们发明了一种智慧芯片,有了它,任何人都能古今中外无一不知,天文地理无所不晓。比如说,你在心里默念一声物理,人类有史以来有关物理的一切公式、定律便纷纷浮现出来,比老师讲的还多,比书本印的还全。你逛秦淮河时,脱口一句旧时王谢堂前燕,旁边卖雪糕的老大娘就接茬说飞入寻常百姓家,还慈祥地告诉你,这首诗的作者是刘禹锡,这时一个金发碧眼的外国小女孩抢着说,诗名《乌衣巷》,出自《全唐诗》365卷4117页……这将是怎样的情形啊!

读了上面的材料,你有怎样的联想或思考?请就此写一篇文章。

感觉下来,文心一言写出来的文章还是比较偏“理工男”,类似“综上所述”“总的来说”这种词汇是AI写作的基本特征,AI更擅长写议论文。不知道这样的行文能不能打动语文阅卷老师的芳心?

明天就是星期四,正好试一下,结合最近蔡先生的热度,给每周少不了的“KFC疯四”文案整个活儿。

EVA乐了,虽然AI给出的文案很长,但是还蛮能Get到「鸡你太美」的精髓。不过AI没有结合到“打胎”这个关键词,否则会更传神。

这周没两天就要过去了,相信屏幕前的各位打工人最着急的相信莫过于马上就要交周报了。让文心一言帮我生成一段周报看看能不能成功忽悠领导。

赞~看起来,相当深刻相当的能吹呢!领导一定会给我竖起大拇哥~?

EVA发现除了各种应用场景生成各类文案之外,还可以让文心一言进行角色扮演,我就挑几位大佬让大家感受感受。

在角色扮演方面,尤其是针对当代的公众人物,EVA认为扮演马斯克距离真人还有比较明显的差异,而“AI孔子”的扮演则相当传神。通常来说,孔夫子的著作数量要远远多于马斯克在公开场合发表的观点。可见,参数训练量的确会影响AI的表达能力。

百度AI生图上热搜,多模态能力在补足

下边再来试试文生图功能,估计不少家人对于百度文心一言的文生图能力还停留在“驴肉火烧”“夫妻肺片”等等经典名场面的阶段。而事实上,李彦宏在得知自家上了热搜头条后,很快就召集团队针对性进行了改善。

正好时隔三月,我们来看看进步了多少?

不知道家人们对于生成的画作质感如何?EVA觉得勉强够用,在同业横评里边还称不上优秀,还不能画“Lora小姐姐”。

EVA看到文心一言App提示我,可以在提示词加入#创意图#这个字段,能解锁更多新发现,那我再测一个“赛博朋克头像”的创意灵感设计。

学习工作生活场景全覆盖,萌新不怕玩不转

除此之外,文心一言App还为打工人开设了“职场”专栏。我发现里边有一个“PPT大纲生成”。写PPT应该是每位项目策划人的必备修养了,咱们来试一下AI能帮我们到哪一步。

PPT大纲看起来比较的套路化,不过通常来说,大多数的项目策划方案都有一些既定的方法论与套路,因此这个大纲算得上及格。

如今年轻人的失业率超过了20%,一份出色的简历能够让你马上脱颖而出。EVA来试一下AI帮我写一份简历和求职信。

你甚至可以开启一场AI HR模拟面试,这个还真的绝绝子,AI提出的问题比我遇见的绝大多数HR提问还要专业。最近想要求职的家人们可以为即将到来的真正面试提前打个预防针。

往后还有许多不同的玩法,比如针对学生的各种应用场景:演讲稿、课业复习助手、论文翻译、文章总结、思想汇报等等;针对生活场景,还有教你怎么锻炼减肥、生活居家小知识、怎么修电脑等等,在这里就不一一展开体验了。

最后总结一下,就文心一言App以终端化应用这个角度来看,EVA认为第一版App的完成度还是蛮高的。对比竞品,它有以下几点特征:

优点:

  • 服务器在国内,回复响应速度较快
  • 所有功能完全免费
  • 无植入广告
  • 对萌新用户比较友好,回复品质较高

缺点:

  • 交互不够人性化有待改善
  • 体验需要申请内测排队
  • 回复表达有明显的AI味
  • 不支持iPad

综上所述(EVA说话也越来越像AI了),文心一言依然延续了在中文表达能力上的优异表现,在国内大模型梯队里边位居第一集团。文心一言App在对比其他竞品的类似产品的体验,以到目前为止看,是有过之而无不及。

1

相关文章