首页  >  资讯  >  文章
2024-05-15 16:37

谷歌惨变汪峰!I/O开发者大会掏空家底:14款AI新品震撼大井喷,且惨遭Ilya离职逆转新闻头条

图片

从今天起,请叫OpenAI CEO奥特曼「营销大神」!

2024年,奥特曼“重伤”谷歌两次……

第一次是今年春节,谷歌这头官宣Gemini 1.5 Pro,那头奥特曼就放出了Sora,震惊全网!

第二次正是今天,预期到谷歌举办一年一度的I/O开发者大会,OpenAI昨天抢先一步推出GPT-4o多模态大模型,让谷歌人彻底坐不住了。

昨夜大爆发,谷歌I/O大会一口气足足推出了14款产品线的上新or更新。我们替大家整理了一图读懂:

图片

这真的称得上是“狂轰滥炸”,谷歌依托自身的海量产品线,几乎拿出了看家的本事。

下边挑几个亮点新品给大伙细说一下——

追赶Sora、长文本、多模态助理一个不能少

首先是备受瞩目的多模态视觉AI助理:Project Astra。不得不吐槽,谷歌每次起的名字都那么难念…

图片

与OpenAI的GPT-4o类似,Astra同样能听??会看?还会表达?。因为与GPT-4o的能力过于相似,因此新鲜感大打折扣。

谷歌展示了一个一镜到底的视频案例演示,通过摄像头,AI助理Astra可以轻松表达自己“看”到的一切,并且还能为用户解决疑问,甚至直接从电脑屏幕上读取代码片段:

据了解,Project Astra这个项目基于Gemini大模型开发。

谷歌希望能够开发一款AI助理软件,能真正帮助人们在日常生活中解决各种问题。

似乎觉得发布会上展示的案例还不够丰富,在会后,谷歌DeepMind CEO还在个人社交账号上传了一段短视频,展示多模态认知能力。

未来,人手一个AI助理不再是幻想。

遇到不懂的问题,打开手机的相机,直接将书面的问题照给AI助理看,答案信手拈来~!

单身狗们还有隐藏版福利!

只见DeepMind的员工干脆和AI助理一起同步收看谷歌I/O大会。

设想一下,将来单身狗们人手一个“虚拟女友”,啧啧啧?

不少网友认为,这是谷歌对OpenAI的GPT-4o最直接的正面回应。

客观说,今天的开发者大会,谷歌的确是做了充足的准备。

谷歌CEO甚至直接贴出全场发布活动一共提及121次「AI」,就可见这家科技大厂提前彩排了多少遍。

图片

接下来,我们看谷歌出品的原生AI视频大模型「Veo」。

为了报春节被Sora阻击之“仇”,「虽迟但到」的谷歌也释出了一款AI视频生成大模型,直接对标OpenAI,生成的时长还更长,超过了一分钟。

支持生成长度超过1分钟、分辨率1080P的高质量视频,并且支持多种视觉和电影风格,可以理解诸如“延时拍摄”和“航拍视角”这种专业的摄像术语。

谷歌对外展示了不少的「Veo」生成视频的案例,其中最具代表性的当属下面这辆赛车在城市霓虹夜景中狂飙的视频,长度为1分23秒,作为视频主体的赛车?整体一致性表现较好。

从现阶段谷歌与OpenAI对标来看,两家的文生视频模型基本在一个水平线上,接下来就PK看谁能更快地将大模型应用于商业化。

接下来,谷歌宣布将春节发布的Gemini 1.5 Pro再次升级。

图片

最核心的变化是,上下文窗口吞吐从100万提高到了200万,一口气能读1500页PDF。这么看起来,现在「长文本」的卖点已经没有护城河了。

但,一下放出这么多的震撼弹,就一点槽点没有吗?

有网友们也关注到了某些细节问题。比如,名为Project Astra的AI助理,延迟似乎明显比GPT-4o更长,在演示中也没有体现能打断AI助理说话的能力。

图片

此外,Project Astra这个名字就包含了两层含义:

  • 只是实验性项目
  • 上线要鸽到下半年了

Anyway,我们看到了谷歌在追赶OpenAI做出的努力。据我了解,谷歌的员工为了能够在最短时间内赶上竞争对手,那些已经习惯了摸鱼的老部门都开始加班了。

言归正传,与此同时,谷歌的文生图模型也迎来了更新:Imagen 3发布。

作为迭代版本,与上一代Imagen 2相比,Imagen 3的视觉伪影更少,生成的图像细节拉满,并且可以更准确地在画面中生成英文单词。

图片

比如这张图:一张庄严的图书馆入口的照片,刻有「中央图书馆」(Central Library)字样。

谷歌重塑旗下产品,AI搜索自我革命

在本场I/O开发者大会上,我们欣喜地看到,谷歌要用AI重塑产品线的决心。

作为一家「披着科技外衣的广告公司」,谷歌终于下定决心要打破搜索业务的内核。

基于Gemini,谷歌搜索首度推出了AI概述(AI Overview)新功能,在传统搜索排名之上,将AI搜索与回复放在了更高的层级上。

图片

用户在搜索框输入问题,马上就能得到AI生成的简洁答案,以及回复引用的具体文章链接。?

图片

而且是任何复杂超长问题都能一键处理的那种,比如:

请查找波士顿辖区内最好的瑜伽或普拉提工作室,并提供他们的入门优惠详情以及从灯塔山出发步行所需的时间。

AI概述(AI Overview)在几秒钟内就帮你标记好了所有的最优选择,以后出门还需要提前查阅什么小红书吗?

图片

对于这种复杂问题的搜索,谷歌表示采用了多步推理技术,可以将复杂问题拆解成一个个小问题,然后自动对问题进行排序回答。

图片

尽管很多早期搜索引擎的开发者批评称,AI搜索将会破坏原有的搜索引擎排名商业体系。

——也就是竞价排名。

但是我想说,一个老的商业模式萎缩,也会带来新形态的商业机遇。

比如,可以往「AI内容电商」方向发力。我们使用谷歌AI概述(AI Overview)制定一个为期三天且易于执行的餐饮计划。

AI一键给出了方案,每个方案都可以点击修改,下方还可以一键将食材加入购物车,完整的商业链路闭环。

图片

这还不是全部,AI概述(AI Overview)可以轻而易举地领悟用户比较笼统的需求,比如提问:在达拉斯找一个餐厅庆祝周年纪念日。

AI搜索给出的结果涵盖音乐餐厅、电影院、酒店、购物广场推荐等等不同的场所分类,在一页内完整呈现多样化的个性推荐。

图片

最后,谷歌也秀了一下AI视频实时搜索能力。

在现场演示中,用户对着手机讲“为什么唱片机无法播放”,只需一边拍摄指定的对象,一边提出问题,AI概述(AI Overview)就可以马上给出分析结论并给出处置建议。

图片

最后,谷歌AI概述(AI Overview)服务目前仅在美国地区IP上线,后续开放给其他国家与地区,相信大家知道怎么操作。

谷歌惨变汪峰,头条惨遭Ilay截胡

今天一早,当地时间5月14日下午,「OpenAI宫斗」之后久未露脸的OpenAI首席科学家Ilya Sutskever突然现身!

图片

这一露脸,就是大新闻——他从OpenAI请辞了。

Ilya被认为是CEO奥特曼被董事会罢免一案当中的关键性人物(罢免提案的致命一票)。

Ilya与奥特曼一同官宣他的离开,并且表示已经有了下一个人生大计,但目前还不能透露细节。

图片

这则消息,简直是对谷歌的头号暴击!!BOOM!

自从去年的高层内斗风波后,这是OpenAI的高层首次同框。

但没想到,再一次合影便是Ilay的“毕业照”。

图片

对于这件大事,CEO奥特曼转发了Ilay Sutskever的推文,表示“感到非常难过”。

网友评价?「我真的哭死」。只能说,Ilya真的太爱这家公司了。作为联合创始人的他,也给OpenAI送出了最后一波助攻与流量——

就在OpenAI刚刚发布的旗舰模型GPT-4o的官方介绍页上,Ilya Sutskever的名字被写入了「其他贡献者」一栏。

这可能是他为这个团队做出的最后一项技术贡献了。

图片

此外,他本人宣布离开OpenAI的时机也非常讲究,刚好就在谷歌开完I/O大会,媒体还没有来得及发稿之际,就把全世界的目光再次集中到OpenAI这边。

这真的不是跟奥特曼商量好的??

看到这则突发消息,关注AI圈的朋友们似乎松了口气:“很高兴看到Ilya还活着”。?

10
查看相关话题: #谷歌 #Gemini #AI大模型 #AI视频

相关文章