苹果WWDC 2023开发者大会上只字未提“AI”,库克和他的伙伴有着自己的独特思考
AI奇点网6月9日报道丨最近科技圈最令媒体人“困惑”的一件事,莫过于全球科技领军巨头苹果公司,竟然对AI人工智能“不闻不问”。在本周刚刚落幕的WWDC 2023开发者大会上,苹果只字未提“人工智能(AI)”,也没有提及ChatGPT或者通用大语言模型等等科技圈目前最夯的关键词。
苹果公司CEO库克在WWDC活动后单独接受了外媒的专访表示,他对人工智能聊天机器人ChatGPT的“独特体验”感到很兴奋,并且很开心看到OpenAI已经将ChatGPT的生态带进iOS。该公司在刚刚结束的WWDC2023开发者大会上,发布了一款基于虚拟现实增强技术的超级算力MR头显设备Vision Pro,该设备也融入了包括空间测算、3D智能建模等多项AI技术。
在今年WWDC大会开始之前,国内外不少媒体都在猜测“AI”这个词会被苹果公司提及几次,然而最后一次都没有。苹果公司似乎更喜欢使用“机器学习”这个词汇,这让不少吃瓜群众感到一点意外。WWDC整个Keynote演讲里,有好事者进行了统计,苹果公司总共提及7次“机器学习(Machine Learning)”。
在介绍七年磨一剑的Vision Pro头显的时候,演讲人更喜欢将其表述为“使用了先进的编码-解码神经网络”算法生成。
而事实上,苹果公司的大量产品都有融入各色的AI应用体验,比如我们用的最多的相册,系统会根据相册里边的图片内容自动生成专辑性质的视频,并给出合理的配乐。但是苹果官方似乎并不喜欢将这种能力称之为“AI人工智能”。
在我个人来看,目前的AIGC人工智能生成技术,距离真正意义上的AGI(通用人工智能)确实存在较远距离,苹果公司倾向于使用“机器学习”一词更符合技术底层逻辑。
在本次发布会后,库克接受了外媒的采访表示,虽然苹果已经将AI人工智能技术的应用集成到其产品中,但一般大众可能并不一定认为这些功能属于人工智能范畴,比如最新发布的MR头显,就采用了AI自动生成的3D建模人像,作为使用MR与他人线上通话时的第一人称形象。虽然有不少媒体在试戴MR之后表示多少有点“恐怖谷”效应。
这与微软、谷歌等一众科技大厂在当前大语言模型浪潮中的高调做法截然不同。苹果已经在这次 AI 竞赛中掉队了?或者说他们依然在观望投资风口?
实际上,并非如此。在采访中库克对此补充说,苹果正在密切关注ChatGPT这个工具的发展与变化。他承认,自己在办公室的Mac上会登录ChatGPT的官网进行体验。
尽管苹果没有在WWDC上高谈阔论的聊起大模型,但他们介绍了一些基于 AI 的新功能,如改进的 iPhone 自动更正功能,当你按下空格键时,它可以完成一个单词或整个句子。该功能基于使用 Transformer 语言模型的 ML 程序,使自动更正比以往任何时候都更加准确,而 Transformer 是支持 ChatGPT 的重要技术之一。
苹果表示,希望iOS系统能够通过机器学习不断改进,学习用户如何发短信和打字,从而变得更好更人性化。
“当你想输入一个 Ducking word(敏感词)的时刻,键盘也会自己进行机器学习。”苹果软件工程高级副总裁Craig Federighi表示。更早一些时候,苹果公司在迭代版本里边为电池功能加入了机器学习能力,会根据用户使用手机的强度进行充电功率变频调配,以延长iPhone手机的电池寿命。
另一个例子,是苹果对于智能主动降噪耳机 AirPods Pro 的改进,即“当耳机检测到用户对话时会自动关闭降噪功能”。苹果没有把它作为一个机器学习功能,但这是一个很难解决的问题,而解决方案是要基于 AI 训练模型的。
此外,苹果在去年的WWDC为iPhone加入了相机识物与识字(OCR)能力,这种在相机取景框内识别图片里边的文字、识别文稿并生成PDF、识别你的宠物和你的自拍照,然后将所有照片归纳在一个文件夹中等新功能,都基于苹果公司对于神经网络的长期研究与训练。
在今年的WWDC上,苹果公司只字未提AI大模型和如何训练,而是简单地提到了“这些功能背后有着很酷的技术支持”。在笔者看来,苹果是一家非常优秀的消费电子产品公司,他的面向受众是广大消费者,浅显易懂的介绍方式更符合落地营销的思考。而不是将口舌花在介绍自己的大模型如何“先进”。
此外,与其他竞争对手不同的是,苹果公司更希望在iPhone终端上建立AI运算模型,采集更少的数据进行运算,而不是建立大型的服务器集群、超级计算机和 TB 级数据中心。这一切,也是基于产品给用户的体验考量,试想一下,要是你在手机上运行一个APP,然后响应速度慢得就像ChatGPT生成文本,该是多么痛苦的一件事。而且,这样做的好处是,运行在设备上的 AI 绕过了很多基于云的 AI 面临的数据隐私问题,更容易让苹果的产品进入各国的消费市场,符合当地的法律法规。
值得关注的是,苹果此次也公布了 M2 芯片家族的最新成员——M2 Ultra。它采用第二代 5 纳米工艺制造,拥有多达 24 个 CPU 内核、76 个 GPU 内核和 32 个内核的神经引擎,每秒可进行 31.6 万亿次运算。苹果表示,这种能力可能会在训练“大型 Transformer 模型”时派上用场。
“M2 Ultra 可以支持高达 192GB 的统一内存,比 M1 Ultra 多 50%,这使其能够完成其他芯片无法完成的任务。例如,在一个单一系统中,它可以训练庞大的 ML 工作负载,如大型Transformer模型,这类模型即使是最强大的离散 GPU 也无法处理,因为其内存不足。”
芯片的算力是AI人工智能训练里边永远绕不开的话题,M2 Ultra 的问世,让一些人工智能专家感到兴奋。
“苹果统一内存架构意味着高端 Mac 现在真的是运行大型 AI 模型和进行 AI 研究的惊人机器。”苹果公司前高管、知名计算机安全信息专家佩里·梅兹格(Perry E. Metzger)在推特上表示,“在这个价位上,确实没有多少其他系统能提供 192GB 的 GPU 可访问内存。”
更大的内存意味着更大、能力更强的 AI 模型可以装入内存中,这可能使得许多人有机会在个人电脑上训练 AI 训练。尽管目前尚未有 M2 Ultra 与A100(甚至 H100)的性能评估,但至少从目前看来,苹果公司在硬件算力能力的准备层面,已经有一定的实力进入生成式AIGC训练的下一阶段。