ChatGPT AI搜索服务向用户全面开放丨谷歌版SORA:Veo 2视频生成模型发布丨月之暗面Kimi上线视觉思考模型k1
AI奇点网2024年12月17日报道丨AI资讯早报
当地时间12月16日,OpenAI 办公室内漫长的系列新品发布会继续进行。在 OpenAI 的第八场发布会上 ,宣布向全球用户免费开放旗下的 AI 搜素服务 ChatGPT Search。
本次更新的主要亮点包括:
就在 11 月,外媒 The Information 披露,OpenAI 正在筹划一款新产品,旨在将 AI 聊天机器人和网络浏览器相结合,为旅游、餐饮和房地产等领域的网站提供搜索功能。
当地时间 12 月 16 日,谷歌旗下人工智能研究室 Deepmind 推出了全新升级的 AI 视频模型 Veo 2 和图像生成模型 Imagen 3。
根据官方博文发布的介绍,新一代的 Veo 2 带来了多项重要突破:
此外,谷歌还针对 Imagen 3 图像生成模型进行了全面升级,现在该模型的生成效果更加明亮、构图更精美,并支持更多样化的艺术风格,从写实主义到印象派,从抽象风格到动漫风格,能够涵盖从写实到抽象的多种风格,生成更丰富的纹理。
12月16日,国内AI大模型开发商月之暗面发布消息称,旗下Kimi智能助手上线了一款视觉思考模型 k1。
官方介绍,这款 k1 视觉思考模型真正意义上实现了端到端的图像理解和思考能力。
据介绍,在数学、物理、化学等基础科学学科的基准能力测试中,初代 k1 模型的表现超过了全球标杆模型 OpenAI o1、GPT-4o以及 Claude 3.5 Sonnet。
k1 推理模型基于强化学习技术打造,原生支持端到端图像理解和思维链技术,并将能力扩展到数学之外的更多基础科学领域。
新的 k1 视觉思考模型,借助端到端的图像理解能力,解锁了包括几何图形题在内更加全面的数学能力。在不同阶段的几何和图形题专项基准能力测试中,k1-preview 成绩追平或超过了 OpenAI 的 o1 模型。
该模型可以直接处理用户输入的图像信息并进行思考得出答案,不需要借助外部的OCR或额外视觉模型进行信息处理,用户体验和效果都达到了新的高度。
近日,马斯克旗下的人工智能研发公司 xAI 宣布,将面向所有的推特(X)平台用户免费推出目前最新商用运营版本的 Grok-2 大模型。
与以往一样,Premium 和 Premium + 用户将拥有更高级的功能使用,并能优先访问未来的任何新功能。
据官方介绍,Grok 聊天机器人可通过推特(X)平台用户每时每刻发送的数以万计的数据,来实时了解世界范围内正在发生的事情。
近期,Grok 还推出了两个新功能:网页 AI 搜索和数据来源引用,增强了 Grok 的使用体验。
据彭博社报道,OpenAI 的首席财务官 Sarah Friar 近日对外表示,OpenAI 正在开发一款定价高达 2000 美元/月订阅费用的会员制服务,这跨产品可以达到「博士级的智能」,该产品可以作为人类职员的「替代品」。
Sarah Friar 表示,OpenAI 即将发布的这款产品是一款 AI Agent(AI 智能体产品),并且 Sarah Friar 认为软件可能会由此转向基于价值的定价模型,通过订阅这个 AI Agent 来让 AI 自主完成一些复杂任务,例如预定旅行,或者进行科研任务。
近期文章
更多