首页  >  资讯  >  文章
2024-05-15 09:07

一大筐AI新产品:谷歌举行I/O 2024开发者大会丨谷歌推出AI搜索服务丨OpenAI首席科学家Ilya Sutskever离职创业

AI奇点网2024年5月15日报道丨AI资讯早报

谷歌举行I/O 2024开发者大会,放出大一波AI新产品

当地时间5月14日,谷歌举办一年一度的I/O开发者大会。经过昨夜OpenAI的“科幻级”演示,所有人都在等着今晚来自谷歌的反击。本次开发者全程两个小时,谷歌CEO在活动上据统计共提及「AI」121次。

此次开发者大会,谷歌将搜索业务做了最彻底的AI改造,还更新升级了Gemini 1.5 Pro版本,同时推出Gemini 1.5 Flash轻量化小模型。此外,推出自称效果超过Sora的生成视频模型Veo。

与OpenAI的仅半个小时的发布活动不同,谷歌摆出了拼死一战的意思。在持续两个小时的超级发布会上,一口气拿出来十来款新品及升级,量大管饱,全面对标OpenAI在AI各领域上的发展。

因为产品太多,我们把他们做了个简单表格整合,连带发布和新升级的AI相关产品足足有14项:

图片

尽管如此,但是外界的普遍评价反响不突出。和GPT-4o半个小时左右的GPT-4o发布会相比,谷歌的表现“缺乏惊喜”,产品组合繁多且记忆点不深刻。

谷歌改进搜索业务,推出AI搜索服务AI Overviews

当地时间5月14日,谷歌举办了一年一度的I/O开发者大会。作为主业,谷歌自然会大力将AI融进其主导全球的搜索引擎之中。从本周开始,谷歌搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,搜索引擎会直接归纳总结搜索结果。

谷歌表示,将开始测试AI搜索服务,推出一个新版本的搜索引擎,其中包括人工智能撰写的搜索结果。谷歌表示,本周将向美国用户推出这个具有AI Overviews功能的新搜索引擎,并在未来几个月向更多国家的用户推出,在今年年底前将覆盖超过10亿用户。

根据产品部门在现场的演示,AI搜索引擎具备多步骤推理的能力,例如:寻找一个瑜伽教室,同时展示新手优惠报价,和距离特定位置的步行时间。这个AI搜索引擎助手,还能介绍食谱、安排行程,以及接受视频形式的提问。

谷歌Gemini大模型家族增加新成员:高速版大模型Gemini 1.5 Flash

当地时间5月14日,谷歌举行I/O开发者大会,在会上宣布扩充旗下最强大模型 Gemini 的家族成员,推出了全新的 Gemini 1.5 Flash 模型,正如其名字「Flash」,重点优化了该模型的速度和效率。

谷歌 DeepMind 首席执行官 Demis Hassabis 在官网的博文中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。

谷歌之所以创建 Gemini 1.5 Flash,是因为开发部门认为,谷歌需要一个比今年 2 月春节期间发布的 Gemini 1.5 Pro 更轻便、执行任务性价比更高的大模型,可以用于更广泛的互联网应用领域。

Gemini 1.5 Flash 的参数量介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之间。谷歌表示,这是通过大模型“蒸馏”过程实现的,将 Gemini 1.5 Pro 中最基本的知识和技能转移到体量更小的模型上,以实现更高效的人物执行能力。

这意味着,Gemini 1.5 Flash 与 Gemini 1.5 一样,上限支持 100万 的Tokens 上下文窗口吞吐,将能够一次性分析 1500 页的文档或超过 30000 行的代码库。

谷歌版Sora发布:Veo文生视频模型可生成超过1分钟视频

当地时间 5月 14日消息,OpenAI 在今年春节发布了文生视频模型 Sora,引发了业内的广泛讨论与热议。谷歌意识到不能就此落后,连着三个月加码推出了类似的产品。在今天举行的 I/O 开发者大会上,谷歌发布了对标产品「Veo」,可以生成长度超过 1 分钟,分辨率最高 1080P 的“高质量”视频,并具有多种视觉和电影风格。

根据谷歌官方新闻稿,Veo 具备对自然语言有先进的理解能力,能够理解“延时摄影”、“航拍风景”等电影术语。

用户可以使用文本、图像或视频提示来指导他们所需的输出,谷歌表示,这样产生的视频“更加连贯一致”,在整个镜头中人物、动物和物体的动作也更加逼真。

在发布会上,谷歌展示了不少的 Veo 视频生成案例,其中最具代表性的就是这一条赛车在城市夜晚中狂飙的视频,长度为1分23秒,视频主体的赛车整体一致性表现较好。

谷歌发布新版文生图大模型Imagen 3

当地时间 5月14日,谷歌举行今年的 I/O 2024 开发者大会,在会上宣布了新一代的文生图大模型,AI在线绘图工具 Imagen 3。新版的大模型进一步增强了文本生成图片的技术能力。

谷歌人工智能研究部门 DeepMind 负责人 Demis Hassabis 说,与去年12月推出的前代产品 Imagen 2 相比,Imagen 3 能更准确地理解文字提示,并将其转化为图像,而且其生成的图像更具“创造性和细节”,且模型产生的干扰元素和错误也更少。

为了打消人们对 Deepfake 深度伪造 AI 换脸技术的可能性担忧,谷歌表示,Imagen 3 将使用 DeepMind 开发的 SynthID 方法,在媒体上应用隐形加密水印。

OpenAI首席科学家Ilya Sutskever宣布离职创业

去年11月,OpenAI爆发了令圈内震惊的「宫斗罢免大剧」,现如今持续半年的OpenAI高层斗争风波,终于迈向了最终的尾声。

当地时间5月14日,OpenAI 联合创始人兼首席科学家 Ilya Sutskever 在推特(X)发文宣布,正式辞职离开 OpenAI 这家自己一手联合创办的企业。

在去年,Ilya Sutskever 是 OpenAI 董事会的组成成员之一,曾投票推动罢免 OpenAI CEO 奥特曼的行动,并且成为了罢免案里边的关键角色。

Ilya Sutskever首先肯定了OpenAI今天所取得的成绩,离不开创业团队的共同努力,他还在推文中还预告了下一步的职业动作,他将开启自主创业,并在后期与网友分享自己的创业计划细节。

6

相关文章