华为抢发AI智慧助理“小艺”，小米AI模型测评怒刷第一：手机江湖掀起新一轮「跑分大战」3.0时代-AI奇点网

首页 > 资讯 > 文章

2023-08-14 14:16

华为抢发AI智慧助理“小艺”，小米AI模型测评怒刷第一：手机江湖掀起新一轮「跑分大战」3.0时代

伴随着AI大模型的风起云涌，手机江湖又有了新的故事可讲。

今年上半年，国内企业一个接着一个发布大模型，大厂之间上演了一轮堪比围棋车轮战的「百模大战」。最近两个月，大模型之争似乎有些冷却，取而代之的是「应用争霸赛」。

无论是各种大模型App，还是最近刚刚火了一轮的“秒鸭相机”，真真切切地让更多的家人们能够接触到AI的无穷力量。同时，应用层的崛起，也在指引终端硬件迈向变革新方向。

众所周知，手机是应用终端侧最容易被感知的终端设备之一，大模型在端侧以及云侧能力的加持，正在推动着其加速体验上的革新。许多人预言，AIGC将重塑千行百业，自然包括智能手机产业。

EVA大胆预测，今天我们熟悉的智能手机，将会在不久的将来成为真正的“智慧型手机”。大模型将在应用生态、唤醒体验与效率能力方面重塑手机市场的竞争格局。

AI大模型打响手机“跑分大战”3.0时代

回首十年载的智能手机之争，一句话形容便是“选手越来越少，对抗越来越卷”。

其中又一小米最先发难，以「不服跑个分」开辟了全新的竞争赛道，这种感官冲击性极强的竞争手段，让这支互联网新贵异军突起，杀得老玩家们措手不及，逼迫“中华酷联”等老牌企业纷纷效仿。

当群雄适应小米的打法之后，华为巧妙地选择与知名相机大厂徕卡强强联合，凭借“爵士味十足”的旗舰机型，率先开启了“相机跑分”的新格局。这种新打法很快实现了弯道超车，不仅让自己成为国产高端手机的唯一代表，还一举挑落了一水的国际厂商。

有人的地方就有江湖，有江湖的地方就会孕育新的故事。伴随着“后疫情时代”引发的全球经济危机，2022年整个3C消费电子迈入下行通道，融合今年大夯的AI大模型概念，既是手机厂商之间的又一次“跑分博弈”，也是全产业链的主动求变与自救，江湖终于有了新的故事脉络。

华为率先交卷，“小艺”成为全球首个移动智慧助理

8月4日，华为发布新一代鸿蒙4操作系统HarmonyOS 4，大模型赋能“小艺”手机助理，在智慧语音交互、高效生产力和用户个性服务三个方面获得短板补足。

首先，华为“小艺”的对话交互更加自然流畅。基于盘古AI大模型技术，“小艺”能够直接识别家人们的自然语言唤醒与交流，能听懂并理解用户更为口语化的表达，并且记得刚刚聊过的一切内容，支持多轮对话。类似于桌面端的Windows Copilot，华为“小艺”可以帮助你在手机上以自然语言需求进行一切设置操作。

基于多模态的大模型能力，“小艺”还可以直接智慧识别图片中的文字、物体，比如手机号、地址信息、网址、二维码、邮箱、日期、快递单号等，无需调用第三方APP就可以直接提供多种，比如从一张活动海报上直接调用地图APP为你开启导航。

其次，在生产力效率方面，不管是灵光一现的想法，还是重要事件和重要日程，直接唤醒“小艺”帮家人们进行记录，创建日历提醒。

不仅如此，“小艺”还能够通过从与用户的对话当中进行逻辑推理，感知不同场景下应有的合理自动化流程。例如，用户只需要告诉小艺“每天7点叫我起床，如果下雨的话，提前半个小时叫醒我，并播报去公司的路况”，“小艺”就能心领神会，为家人们创建“工作日闹钟”。

针对特定的复合型场景，“小艺”还能提供一站式的智慧组合建议。例如，当商旅人士出国前，“小艺”会为用户抓取机票信息、实时最新汇率、兑换外币服务指南以及目的地的旅游攻略等。

此外，“小艺”还拥有更精准、更丰富的本地搜索能力。家人们无需记住文档标题，只需大概的信息点，“小艺”就能帮你找出文档。把文档、网址链接发给“小艺”可以帮你提炼内容梗概。通过会议纪要功能，“小艺”能帮助打工人实现语音转文本记录，并支持多角色识别，大大提升工作效率。

最后，“小艺”能够为用户提供个性化的服务体验。比如常见场景的文案撰写，写祝福语、商品点评、邀约文案甚至安慰用语都不在话下。“小艺”的语音播报也更具个性化，支持自定义音色与声音模仿等。“小艺”还允许通过一张肖像照快速生成AI贺卡，照片自动生成多种数字人二创形象，为家人们创建独一无二的贺卡。

华为“小艺”诞生于2018年，是华为手机终端智能语音助理。鸿蒙4加持全新“小艺”令华为成为全球首个商用移动AI终端助理的厂商。而华为的野心不仅限于手机，未来必将拓展到车机领域。华为终端CEO、智能汽车解决方案CEO余承东表示：“AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验。”

小米大模型露出水面，同参数级中文测评能力第一

华为的死对头——小米公司尽管暂未宣布推出终端侧的AI消费级应用。但EVA了解到，小米的64亿参数量AI大模型MiLM-6B已经悄然出现在C-Eval和CMMLU两个大模型测评榜单上。

C-Eval是由清华、上海交大与英国爱丁堡大学合作构建的中文语言模型综合测评体系；CMMLU是由穆罕默德·本·扎耶德人工智能大学、上海交大，微软亚洲研究院合作打造的中文大模型测评基准。

小米大模型在C-Eval取得了总榜排行第10、同参数量排名第1；CMMLU榜单中文方向大模型排名第1的不俗成绩，既展示了小米在人工智能领域的积极探索，也符合小米一贯「不服跑个分」的个性。

在具体的测试科目中，MiLM-6B模型在计量、物理、化学、生物多个科目获得高分；在一些文科领域展示还不错的准确度，但涉及抽象性学科，例如法学、数学、编程、概率论、离散数学等科目则表现一般。

10个社会科学测试科目中，除了教育学和地理外，该模型在其余8个科目中获得较为理想的准确率。在人文科学领域，历史与法律有着不错的准确率表现。

今年4月，小米正式组建AI实验室大模型团队，研发人员超过1200人。小米AI大模型MiLM-6B首次曝光即呈现较高的完成度。预计将会应用于“小爱同学”手机语音助理以及小爱音箱等智能AIoT产品线上。

8月14日晚间7点，小米创始人雷军将进行主题为《成长》的发布会演讲，并在活动上推出新一代小米MIX折叠手机。雷军日前接受《人物》杂志采访时透露，（AI比人类干得还好）这一天可能还需要很漫长的时间。小米在AI上也有一些新进展，今晚的演讲上将和大家说一说。

荣耀OV跃跃欲试，暗示正在打磨大模型

除了华为、小米外，其它国产手机厂商在大模型上或多或少也有一些动作。今年6月底的MWC 2023上海展上，荣耀CEO赵明就曾表示，未来将把AI大模型引入终端侧，赋能荣耀的“YOYO”智慧助手，荣耀将围绕个性化、人性化、隐私保护等方面打磨更周全的端侧个人AI模型，在线模型将与互联网科技大厂合作，目前已有接触。

8月初，“蓝绿”两家大厂OPPO、vivo也借数码KOL传出正在开发AI大模型，但落地会稍微晚一点。