华为抢发AI智慧助理“小艺”,小米AI模型测评怒刷第一:手机江湖掀起新一轮「跑分大战」3.0时代
伴随着AI大模型的风起云涌,手机江湖又有了新的故事可讲。
今年上半年,国内企业一个接着一个发布大模型,大厂之间上演了一轮堪比围棋车轮战的「百模大战」。最近两个月,大模型之争似乎有些冷却,取而代之的是「应用争霸赛」。
无论是各种大模型App,还是最近刚刚火了一轮的“秒鸭相机”,真真切切地让更多的家人们能够接触到AI的无穷力量。同时,应用层的崛起,也在指引终端硬件迈向变革新方向。
众所周知,手机是应用终端侧最容易被感知的终端设备之一,大模型在端侧以及云侧能力的加持,正在推动着其加速体验上的革新。许多人预言,AIGC将重塑千行百业,自然包括智能手机产业。
EVA大胆预测,今天我们熟悉的智能手机,将会在不久的将来成为真正的“智慧型手机”。大模型将在应用生态、唤醒体验与效率能力方面重塑手机市场的竞争格局。
AI大模型打响手机“跑分大战”3.0时代
回首十年载的智能手机之争,一句话形容便是“选手越来越少,对抗越来越卷”。
其中又一小米最先发难,以「不服跑个分」开辟了全新的竞争赛道,这种感官冲击性极强的竞争手段,让这支互联网新贵异军突起,杀得老玩家们措手不及,逼迫“中华酷联”等老牌企业纷纷效仿。
当群雄适应小米的打法之后,华为巧妙地选择与知名相机大厂徕卡强强联合,凭借“爵士味十足”的旗舰机型,率先开启了“相机跑分”的新格局。这种新打法很快实现了弯道超车,不仅让自己成为国产高端手机的唯一代表,还一举挑落了一水的国际厂商。
有人的地方就有江湖,有江湖的地方就会孕育新的故事。伴随着“后疫情时代”引发的全球经济危机,2022年整个3C消费电子迈入下行通道,融合今年大夯的AI大模型概念,既是手机厂商之间的又一次“跑分博弈”,也是全产业链的主动求变与自救,江湖终于有了新的故事脉络。
华为率先交卷,“小艺”成为全球首个移动智慧助理
8月4日,华为发布新一代鸿蒙4操作系统HarmonyOS 4,大模型赋能“小艺”手机助理,在智慧语音交互、高效生产力和用户个性服务三个方面获得短板补足。
首先,华为“小艺”的对话交互更加自然流畅。基于盘古AI大模型技术,“小艺”能够直接识别家人们的自然语言唤醒与交流,能听懂并理解用户更为口语化的表达,并且记得刚刚聊过的一切内容,支持多轮对话。类似于桌面端的Windows Copilot,华为“小艺”可以帮助你在手机上以自然语言需求进行一切设置操作。
基于多模态的大模型能力,“小艺”还可以直接智慧识别图片中的文字、物体,比如手机号、地址信息、网址、二维码、邮箱、日期、快递单号等,无需调用第三方APP就可以直接提供多种,比如从一张活动海报上直接调用地图APP为你开启导航。
其次,在生产力效率方面,不管是灵光一现的想法,还是重要事件和重要日程,直接唤醒“小艺”帮家人们进行记录,创建日历提醒。
不仅如此,“小艺”还能够通过从与用户的对话当中进行逻辑推理,感知不同场景下应有的合理自动化流程。例如,用户只需要告诉小艺“每天7点叫我起床,如果下雨的话,提前半个小时叫醒我,并播报去公司的路况”,“小艺”就能心领神会,为家人们创建“工作日闹钟”。
针对特定的复合型场景,“小艺”还能提供一站式的智慧组合建议。例如,当商旅人士出国前,“小艺”会为用户抓取机票信息、实时最新汇率、兑换外币服务指南以及目的地的旅游攻略等。
此外,“小艺”还拥有更精准、更丰富的本地搜索能力。家人们无需记住文档标题,只需大概的信息点,“小艺”就能帮你找出文档。把文档、网址链接发给“小艺”可以帮你提炼内容梗概。通过会议纪要功能,“小艺”能帮助打工人实现语音转文本记录,并支持多角色识别,大大提升工作效率。
最后,“小艺”能够为用户提供个性化的服务体验。比如常见场景的文案撰写,写祝福语、商品点评、邀约文案甚至安慰用语都不在话下。“小艺”的语音播报也更具个性化,支持自定义音色与声音模仿等。“小艺”还允许通过一张肖像照快速生成AI贺卡,照片自动生成多种数字人二创形象,为家人们创建独一无二的贺卡。
华为“小艺”诞生于2018年,是华为手机终端智能语音助理。鸿蒙4加持全新“小艺”令华为成为全球首个商用移动AI终端助理的厂商。而华为的野心不仅限于手机,未来必将拓展到车机领域。华为终端CEO、智能汽车解决方案CEO余承东表示:“AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验。”
小米大模型露出水面,同参数级中文测评能力第一
华为的死对头——小米公司尽管暂未宣布推出终端侧的AI消费级应用。但EVA了解到,小米的64亿参数量AI大模型MiLM-6B已经悄然出现在C-Eval和CMMLU两个大模型测评榜单上。
C-Eval是由清华、上海交大与英国爱丁堡大学合作构建的中文语言模型综合测评体系;CMMLU是由穆罕默德·本·扎耶德人工智能大学、上海交大,微软亚洲研究院合作打造的中文大模型测评基准。
小米大模型在C-Eval取得了总榜排行第10、同参数量排名第1;CMMLU榜单中文方向大模型排名第1的不俗成绩,既展示了小米在人工智能领域的积极探索,也符合小米一贯「不服跑个分」的个性。
在具体的测试科目中,MiLM-6B模型在计量、物理、化学、生物多个科目获得高分;在一些文科领域展示还不错的准确度,但涉及抽象性学科,例如法学、数学、编程、概率论、离散数学等科目则表现一般。
10个社会科学测试科目中,除了教育学和地理外,该模型在其余8个科目中获得较为理想的准确率。在人文科学领域,历史与法律有着不错的准确率表现。
今年4月,小米正式组建AI实验室大模型团队,研发人员超过1200人。小米AI大模型MiLM-6B首次曝光即呈现较高的完成度。预计将会应用于“小爱同学”手机语音助理以及小爱音箱等智能AIoT产品线上。
8月14日晚间7点,小米创始人雷军将进行主题为《成长》的发布会演讲,并在活动上推出新一代小米MIX折叠手机。雷军日前接受《人物》杂志采访时透露,(AI比人类干得还好)这一天可能还需要很漫长的时间。小米在AI上也有一些新进展,今晚的演讲上将和大家说一说。
荣耀OV跃跃欲试,暗示正在打磨大模型
除了华为、小米外,其它国产手机厂商在大模型上或多或少也有一些动作。今年6月底的MWC 2023上海展上,荣耀CEO赵明就曾表示,未来将把AI大模型引入终端侧,赋能荣耀的“YOYO”智慧助手,荣耀将围绕个性化、人性化、隐私保护等方面打磨更周全的端侧个人AI模型,在线模型将与互联网科技大厂合作,目前已有接触。
8月初,“蓝绿”两家大厂OPPO、vivo也借数码KOL传出正在开发AI大模型,但落地会稍微晚一点。
现如今,手机换机周期正在拖长,其中一项原因便在于创新功能匮乏上,传导至整个产业链,使得上下游都经历了大滑坡。EVA认为,目前手机移动端的大模型体验,受限于模型参数量与CPU算力还不足,尚不足以与桌面端相提并论。
各大人工智能企业正在着手改变这一现状。通过模型体积缩小、改善本地运算方式等途径,加之各家终端厂商在AI模型与底层系统上的融合、算法分配和优化、功耗控制,对“智慧型手机”的理解差异,最终会让产品在体验上拉开差距。
正如多年前的“CPU跑分大战”和“相机跑分大战”类似,国内的手机厂商们正在摩拳擦掌,试图利用AIGC这个新卖点拓展新的故事线。届时,手机市场格局或许将会被重构,拥有更成熟应用能力的品牌将会占据上风,AI能力将成为未来争夺客户的关键。