谷歌惨变汪峰！I/O开发者大会掏空家底：14款AI新品震撼大井喷，且惨遭Ilya离职逆转新闻头条-AI奇点网

首页 > 资讯 > 文章

2024-05-15 16:37

谷歌惨变汪峰！I/O开发者大会掏空家底：14款AI新品震撼大井喷，且惨遭Ilya离职逆转新闻头条

从今天起，请叫OpenAI CEO奥特曼「营销大神」!

2024年，奥特曼“重伤”谷歌两次……

第一次是今年春节，谷歌这头官宣Gemini 1.5 Pro，那头奥特曼就放出了Sora，震惊全网！

第二次正是今天，预期到谷歌举办一年一度的I/O开发者大会，OpenAI昨天抢先一步推出GPT-4o多模态大模型，让谷歌人彻底坐不住了。

昨夜大爆发，谷歌I/O大会一口气足足推出了14款产品线的上新or更新。我们替大家整理了一图读懂：

这真的称得上是“狂轰滥炸”，谷歌依托自身的海量产品线，几乎拿出了看家的本事。

下边挑几个亮点新品给大伙细说一下——

追赶Sora、长文本、多模态助理一个不能少

首先是备受瞩目的多模态视觉AI助理：Project Astra。不得不吐槽，谷歌每次起的名字都那么难念…

与OpenAI的GPT-4o类似，Astra同样能听??会看?还会表达?。因为与GPT-4o的能力过于相似，因此新鲜感大打折扣。

谷歌展示了一个一镜到底的视频案例演示，通过摄像头，AI助理Astra可以轻松表达自己“看”到的一切，并且还能为用户解决疑问，甚至直接从电脑屏幕上读取代码片段：

据了解，Project Astra这个项目基于Gemini大模型开发。

谷歌希望能够开发一款AI助理软件，能真正帮助人们在日常生活中解决各种问题。

似乎觉得发布会上展示的案例还不够丰富，在会后，谷歌DeepMind CEO还在个人社交账号上传了一段短视频，展示多模态认知能力。

未来，人手一个AI助理不再是幻想。

遇到不懂的问题，打开手机的相机，直接将书面的问题照给AI助理看，答案信手拈来~！

单身狗们还有隐藏版福利！

只见DeepMind的员工干脆和AI助理一起同步收看谷歌I/O大会。

设想一下，将来单身狗们人手一个“虚拟女友”，啧啧啧？

不少网友认为，这是谷歌对OpenAI的GPT-4o最直接的正面回应。

客观说，今天的开发者大会，谷歌的确是做了充足的准备。

谷歌CEO甚至直接贴出全场发布活动一共提及121次「AI」，就可见这家科技大厂提前彩排了多少遍。

接下来，我们看谷歌出品的原生AI视频大模型「Veo」。

为了报春节被Sora阻击之“仇”，「虽迟但到」的谷歌也释出了一款AI视频生成大模型，直接对标OpenAI，生成的时长还更长，超过了一分钟。

支持生成长度超过1分钟、分辨率1080P的高质量视频，并且支持多种视觉和电影风格，可以理解诸如“延时拍摄”和“航拍视角”这种专业的摄像术语。

谷歌对外展示了不少的「Veo」生成视频的案例，其中最具代表性的当属下面这辆赛车在城市霓虹夜景中狂飙的视频，长度为1分23秒，作为视频主体的赛车?整体一致性表现较好。

从现阶段谷歌与OpenAI对标来看，两家的文生视频模型基本在一个水平线上，接下来就PK看谁能更快地将大模型应用于商业化。

接下来，谷歌宣布将春节发布的Gemini 1.5 Pro再次升级。

最核心的变化是，上下文窗口吞吐从100万提高到了200万，一口气能读1500页PDF。这么看起来，现在「长文本」的卖点已经没有护城河了。

但，一下放出这么多的震撼弹，就一点槽点没有吗?

有网友们也关注到了某些细节问题。比如，名为Project Astra的AI助理，延迟似乎明显比GPT-4o更长，在演示中也没有体现能打断AI助理说话的能力。

此外，Project Astra这个名字就包含了两层含义：

只是实验性项目
上线要鸽到下半年了

Anyway，我们看到了谷歌在追赶OpenAI做出的努力。据我了解，谷歌的员工为了能够在最短时间内赶上竞争对手，那些已经习惯了摸鱼的老部门都开始加班了。

言归正传，与此同时，谷歌的文生图模型也迎来了更新：Imagen 3发布。

作为迭代版本，与上一代Imagen 2相比，Imagen 3的视觉伪影更少，生成的图像细节拉满，并且可以更准确地在画面中生成英文单词。

比如这张图：一张庄严的图书馆入口的照片，刻有「中央图书馆」(Central Library)字样。

谷歌重塑旗下产品，AI搜索自我革命

在本场I/O开发者大会上，我们欣喜地看到，谷歌要用AI重塑产品线的决心。

作为一家「披着科技外衣的广告公司」，谷歌终于下定决心要打破搜索业务的内核。

基于Gemini，谷歌搜索首度推出了AI概述(AI Overview)新功能，在传统搜索排名之上，将AI搜索与回复放在了更高的层级上。

用户在搜索框输入问题，马上就能得到AI生成的简洁答案，以及回复引用的具体文章链接。?

而且是任何复杂超长问题都能一键处理的那种，比如：

请查找波士顿辖区内最好的瑜伽或普拉提工作室，并提供他们的入门优惠详情以及从灯塔山出发步行所需的时间。

AI概述(AI Overview)在几秒钟内就帮你标记好了所有的最优选择，以后出门还需要提前查阅什么小红书吗?

对于这种复杂问题的搜索，谷歌表示采用了多步推理技术，可以将复杂问题拆解成一个个小问题，然后自动对问题进行排序回答。

尽管很多早期搜索引擎的开发者批评称，AI搜索将会破坏原有的搜索引擎排名商业体系。

——也就是竞价排名。

但是我想说，一个老的商业模式萎缩，也会带来新形态的商业机遇。

比如，可以往「AI内容电商」方向发力。我们使用谷歌AI概述(AI Overview)制定一个为期三天且易于执行的餐饮计划。

AI一键给出了方案，每个方案都可以点击修改，下方还可以一键将食材加入购物车，完整的商业链路闭环。

这还不是全部，AI概述(AI Overview)可以轻而易举地领悟用户比较笼统的需求，比如提问：在达拉斯找一个餐厅庆祝周年纪念日。

AI搜索给出的结果涵盖音乐餐厅、电影院、酒店、购物广场推荐等等不同的场所分类，在一页内完整呈现多样化的个性推荐。

最后，谷歌也秀了一下AI视频实时搜索能力。

在现场演示中，用户对着手机讲“为什么唱片机无法播放”，只需一边拍摄指定的对象，一边提出问题，AI概述(AI Overview)就可以马上给出分析结论并给出处置建议。

最后，谷歌AI概述(AI Overview)服务目前仅在美国地区IP上线，后续开放给其他国家与地区，相信大家知道怎么操作。

谷歌惨变汪峰，头条惨遭Ilay截胡

今天一早，当地时间5月14日下午，「OpenAI宫斗」之后久未露脸的OpenAI首席科学家Ilya Sutskever突然现身！

这一露脸，就是大新闻——他从OpenAI请辞了。

Ilya被认为是CEO奥特曼被董事会罢免一案当中的关键性人物（罢免提案的致命一票）。

Ilya与奥特曼一同官宣他的离开，并且表示已经有了下一个人生大计，但目前还不能透露细节。

这则消息，简直是对谷歌的头号暴击！！BOOM！

自从去年的高层内斗风波后，这是OpenAI的高层首次同框。

但没想到，再一次合影便是Ilay的“毕业照”。

对于这件大事，CEO奥特曼转发了Ilay Sutskever的推文，表示“感到非常难过”。

网友评价?「我真的哭死」。只能说，Ilya真的太爱这家公司了。作为联合创始人的他，也给OpenAI送出了最后一波助攻与流量——

就在OpenAI刚刚发布的旗舰模型GPT-4o的官方介绍页上，Ilya Sutskever的名字被写入了「其他贡献者」一栏。

这可能是他为这个团队做出的最后一项技术贡献了。

此外，他本人宣布离开OpenAI的时机也非常讲究，刚好就在谷歌开完I/O大会，媒体还没有来得及发稿之际，就把全世界的目光再次集中到OpenAI这边。

这真的不是跟奥特曼商量好的？?

看到这则突发消息，关注AI圈的朋友们似乎松了口气：“很高兴看到Ilya还活着”。?

10

查看相关话题： #谷歌 #Gemini #AI大模型 #AI视频

相关文章

AI奇点网打杂的

作者已发布 648 篇文章

近期文章

更多

OpenAI发布「SearchGPT」AI搜索服务丨OpenAI今年全年亏损将达到50亿美元丨百川智能完成新一轮50亿元融资

OpenAI发布「SearchGPT」AI搜索服务丨OpenAI今年全年亏损将达到50亿美元丨百川智能完成新一轮50亿元融资

快手「可灵AI」全面开放内测，国际版上线丨Mistral发布1230亿Large 2旗舰模型丨OpenAI免费提供GPT-4o微调

快手「可灵AI」全面开放内测，国际版上线丨Mistral发布1230亿Large 2旗舰模型丨OpenAI免费提供GPT-4o微调

Meta发布Llama 3.1开源大模型丨巴黎奥运会与阿里通义达成AI技术合作丨马斯克完成全球最强AI算力集群

Meta发布Llama 3.1开源大模型丨巴黎奥运会与阿里通义达成AI技术合作丨马斯克完成全球最强AI算力集群

「宫斗」余波：OpenAI首席科学家Ilya Sutskever宣布离职，未来或将开启创业

上一篇

字节跳动发布豆包大模型，火山引擎推出全栈AI服务，发布一系列ToB企业AI应用

下一篇