谷歌惨变汪峰!I/O开发者大会掏空家底:14款AI新品震撼大井喷,且惨遭Ilya离职逆转新闻头条
从今天起,请叫OpenAI CEO奥特曼「营销大神」!
2024年,奥特曼“重伤”谷歌两次……
第一次是今年春节,谷歌这头官宣Gemini 1.5 Pro,那头奥特曼就放出了Sora,震惊全网!
第二次正是今天,预期到谷歌举办一年一度的I/O开发者大会,OpenAI昨天抢先一步推出GPT-4o多模态大模型,让谷歌人彻底坐不住了。
昨夜大爆发,谷歌I/O大会一口气足足推出了14款产品线的上新or更新。我们替大家整理了一图读懂:
这真的称得上是“狂轰滥炸”,谷歌依托自身的海量产品线,几乎拿出了看家的本事。
下边挑几个亮点新品给大伙细说一下——
首先是备受瞩目的多模态视觉AI助理:Project Astra。不得不吐槽,谷歌每次起的名字都那么难念…
与OpenAI的GPT-4o类似,Astra同样能听??会看?还会表达?。因为与GPT-4o的能力过于相似,因此新鲜感大打折扣。
谷歌展示了一个一镜到底的视频案例演示,通过摄像头,AI助理Astra可以轻松表达自己“看”到的一切,并且还能为用户解决疑问,甚至直接从电脑屏幕上读取代码片段:
据了解,Project Astra这个项目基于Gemini大模型开发。
谷歌希望能够开发一款AI助理软件,能真正帮助人们在日常生活中解决各种问题。
似乎觉得发布会上展示的案例还不够丰富,在会后,谷歌DeepMind CEO还在个人社交账号上传了一段短视频,展示多模态认知能力。
未来,人手一个AI助理不再是幻想。
遇到不懂的问题,打开手机的相机,直接将书面的问题照给AI助理看,答案信手拈来~!
单身狗们还有隐藏版福利!
只见DeepMind的员工干脆和AI助理一起同步收看谷歌I/O大会。
设想一下,将来单身狗们人手一个“虚拟女友”,啧啧啧?
不少网友认为,这是谷歌对OpenAI的GPT-4o最直接的正面回应。
客观说,今天的开发者大会,谷歌的确是做了充足的准备。
谷歌CEO甚至直接贴出全场发布活动一共提及121次「AI」,就可见这家科技大厂提前彩排了多少遍。
接下来,我们看谷歌出品的原生AI视频大模型「Veo」。
为了报春节被Sora阻击之“仇”,「虽迟但到」的谷歌也释出了一款AI视频生成大模型,直接对标OpenAI,生成的时长还更长,超过了一分钟。
支持生成长度超过1分钟、分辨率1080P的高质量视频,并且支持多种视觉和电影风格,可以理解诸如“延时拍摄”和“航拍视角”这种专业的摄像术语。
谷歌对外展示了不少的「Veo」生成视频的案例,其中最具代表性的当属下面这辆赛车在城市霓虹夜景中狂飙的视频,长度为1分23秒,作为视频主体的赛车?整体一致性表现较好。
从现阶段谷歌与OpenAI对标来看,两家的文生视频模型基本在一个水平线上,接下来就PK看谁能更快地将大模型应用于商业化。
接下来,谷歌宣布将春节发布的Gemini 1.5 Pro再次升级。
最核心的变化是,上下文窗口吞吐从100万提高到了200万,一口气能读1500页PDF。这么看起来,现在「长文本」的卖点已经没有护城河了。
但,一下放出这么多的震撼弹,就一点槽点没有吗?
有网友们也关注到了某些细节问题。比如,名为Project Astra的AI助理,延迟似乎明显比GPT-4o更长,在演示中也没有体现能打断AI助理说话的能力。
此外,Project Astra这个名字就包含了两层含义:
Anyway,我们看到了谷歌在追赶OpenAI做出的努力。据我了解,谷歌的员工为了能够在最短时间内赶上竞争对手,那些已经习惯了摸鱼的老部门都开始加班了。
言归正传,与此同时,谷歌的文生图模型也迎来了更新:Imagen 3发布。
作为迭代版本,与上一代Imagen 2相比,Imagen 3的视觉伪影更少,生成的图像细节拉满,并且可以更准确地在画面中生成英文单词。
比如这张图:一张庄严的图书馆入口的照片,刻有「中央图书馆」(Central Library)字样。
在本场I/O开发者大会上,我们欣喜地看到,谷歌要用AI重塑产品线的决心。
作为一家「披着科技外衣的广告公司」,谷歌终于下定决心要打破搜索业务的内核。
基于Gemini,谷歌搜索首度推出了AI概述(AI Overview)新功能,在传统搜索排名之上,将AI搜索与回复放在了更高的层级上。
用户在搜索框输入问题,马上就能得到AI生成的简洁答案,以及回复引用的具体文章链接。?
而且是任何复杂超长问题都能一键处理的那种,比如:
请查找波士顿辖区内最好的瑜伽或普拉提工作室,并提供他们的入门优惠详情以及从灯塔山出发步行所需的时间。
AI概述(AI Overview)在几秒钟内就帮你标记好了所有的最优选择,以后出门还需要提前查阅什么小红书吗?
对于这种复杂问题的搜索,谷歌表示采用了多步推理技术,可以将复杂问题拆解成一个个小问题,然后自动对问题进行排序回答。
尽管很多早期搜索引擎的开发者批评称,AI搜索将会破坏原有的搜索引擎排名商业体系。
——也就是竞价排名。
但是我想说,一个老的商业模式萎缩,也会带来新形态的商业机遇。
比如,可以往「AI内容电商」方向发力。我们使用谷歌AI概述(AI Overview)制定一个为期三天且易于执行的餐饮计划。
AI一键给出了方案,每个方案都可以点击修改,下方还可以一键将食材加入购物车,完整的商业链路闭环。
这还不是全部,AI概述(AI Overview)可以轻而易举地领悟用户比较笼统的需求,比如提问:在达拉斯找一个餐厅庆祝周年纪念日。
AI搜索给出的结果涵盖音乐餐厅、电影院、酒店、购物广场推荐等等不同的场所分类,在一页内完整呈现多样化的个性推荐。
最后,谷歌也秀了一下AI视频实时搜索能力。
在现场演示中,用户对着手机讲“为什么唱片机无法播放”,只需一边拍摄指定的对象,一边提出问题,AI概述(AI Overview)就可以马上给出分析结论并给出处置建议。
最后,谷歌AI概述(AI Overview)服务目前仅在美国地区IP上线,后续开放给其他国家与地区,相信大家知道怎么操作。
今天一早,当地时间5月14日下午,「OpenAI宫斗」之后久未露脸的OpenAI首席科学家Ilya Sutskever突然现身!
这一露脸,就是大新闻——他从OpenAI请辞了。
Ilya被认为是CEO奥特曼被董事会罢免一案当中的关键性人物(罢免提案的致命一票)。
Ilya与奥特曼一同官宣他的离开,并且表示已经有了下一个人生大计,但目前还不能透露细节。
这则消息,简直是对谷歌的头号暴击!!BOOM!
自从去年的高层内斗风波后,这是OpenAI的高层首次同框。
但没想到,再一次合影便是Ilay的“毕业照”。
对于这件大事,CEO奥特曼转发了Ilay Sutskever的推文,表示“感到非常难过”。
网友评价?「我真的哭死」。只能说,Ilya真的太爱这家公司了。作为联合创始人的他,也给OpenAI送出了最后一波助攻与流量——
就在OpenAI刚刚发布的旗舰模型GPT-4o的官方介绍页上,Ilya Sutskever的名字被写入了「其他贡献者」一栏。
这可能是他为这个团队做出的最后一项技术贡献了。
此外,他本人宣布离开OpenAI的时机也非常讲究,刚好就在谷歌开完I/O大会,媒体还没有来得及发稿之际,就把全世界的目光再次集中到OpenAI这边。
这真的不是跟奥特曼商量好的??
看到这则突发消息,关注AI圈的朋友们似乎松了口气:“很高兴看到Ilya还活着”。?