首页  >  资讯  >  文章
2024-12-17 09:00

ChatGPT AI搜索服务向用户全面开放丨谷歌版SORA:Veo 2视频生成模型发布丨月之暗面Kimi上线视觉思考模型k1

AI奇点网2024年12月17日报道丨AI资讯早报

ChatGPT AI搜索服务向用户全面开放

当地时间12月16日,OpenAI 办公室内漫长的系列新品发布会继续进行。在 OpenAI 的第八场发布会上 ,宣布向全球用户免费开放旗下的 AI 搜素服务 ChatGPT Search。

本次更新的主要亮点包括:

  • 高级语音模式现已支持实时网页搜索,并支持多语言实时翻译
  • ChatGPT 能够智能判断是否需要执行网页搜索,用户也可通过点击 🌐 图标手动触发搜索
  • 搜索结果中的视频可直接在 ChatGPT 聊天窗口中播放
  • 支持将 ChatGPT Search 设为默认浏览器,提升网页导航效率
  • 移动端搜索结果优化显示,包含完整商业信息描述和丰富视觉内容
  • iOS 设备集成原生苹果地图体验

就在 11 月,外媒 The Information 披露,OpenAI 正在筹划一款新产品,旨在将 AI 聊天机器人和网络浏览器相结合,为旅游、餐饮和房地产等领域的网站提供搜索功能。

谷歌发布Veo 2视频生成模型,支持4K画质

当地时间 12 月 16 日,谷歌旗下人工智能研究室 Deepmind 推出了全新升级的 AI 视频模型 Veo 2 和图像生成模型 Imagen 3。

根据官方博文发布的介绍,新一代的 Veo 2 带来了多项重要突破:

  • 支持制作高达 4K 分辨率的视频
  • 能够识别指令中的摄像机控制,例如广角、第一人称视角和无人机拍摄
  • 能更真实地模拟物理现象和人类表情变化
  • 相比其他视频模型经常容易出现的 BUG 问题,比如多余手指或者物体。新一代的 Veo 2 显著降低了出现错误的频率

此外,谷歌还针对 Imagen 3 图像生成模型进行了全面升级,现在该模型的生成效果更加明亮、构图更精美,并支持更多样化的艺术风格,从写实主义到印象派,从抽象风格到动漫风格,能够涵盖从写实到抽象的多种风格,生成更丰富的纹理。

月之暗面Kimi上线视觉思考模型k1

12月16日,国内AI大模型开发商月之暗面发布消息称,旗下Kimi智能助手上线了一款视觉思考模型 k1。

官方介绍,这款 k1 视觉思考模型真正意义上实现了端到端的图像理解和思考能力。

据介绍,在数学、物理、化学等基础科学学科的基准能力测试中,初代 k1 模型的表现超过了全球标杆模型 OpenAI o1、GPT-4o以及 Claude 3.5 Sonnet。

k1 推理模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。

新的 k1 视觉思考模型,借助端到端的图像理解能力,解锁了包括几何图形题在内更加全面的数学能力。在不同阶段的几何和图形题专项基准能力测试中,k1-preview 成绩追平或超过了 OpenAI 的 o1 模型。

该模型可以直接处理用户输入的图像信息并进行思考得出答案,不需要借助外部的OCR或额外视觉模型进行信息处理,用户体验和效果都达到了新的高度。

Grok-2面向所有用户免费开放

近日,马斯克旗下的人工智能研发公司 xAI 宣布,将面向所有的推特(X)平台用户免费推出目前最新商用运营版本的 Grok-2 大模型。

与以往一样,Premium 和 Premium + 用户将拥有更高级的功能使用,并能优先访问未来的任何新功能。

据官方介绍,Grok 聊天机器人可通过推特(X)平台用户每时每刻发送的数以万计的数据,来实时了解世界范围内正在发生的事情。

近期,Grok 还推出了两个新功能:网页 AI 搜索和数据来源引用,增强了 Grok 的使用体验。

OpenAI计划推出2000美元/月的代理机器人服务

据彭博社报道,OpenAI 的首席财务官 Sarah Friar 近日对外表示,OpenAI 正在开发一款定价高达 2000 美元/月订阅费用的会员制服务,这跨产品可以达到「博士级的智能」,该产品可以作为人类职员的「替代品」。

Sarah Friar 表示,OpenAI 即将发布的这款产品是一款 AI Agent(AI 智能体产品),并且 Sarah Friar 认为软件可能会由此转向基于价值的定价模型,通过订阅这个 AI Agent 来让 AI 自主完成一些复杂任务,例如预定旅行,或者进行科研任务。

6
查看相关话题: #OpenAI #chatgpt #谷歌 #AI视频 #Kimi #Grok

相关文章