首页  >  资讯  >  文章
2024-05-30 09:14

GPT-4o多模态能力向所有用户免费开放丨百度将在2025年发布文心大模型5.0丨快手正式上线AI绘图大模型“可图”

AI奇点网2024年5月30日报道丨AI资讯早报

GPT-4o多模态能力向所有用户免费开放

当地时间5月30日,OpenAI在推特(X)平台宣布,GPT-4o 多模态能力向所有用户免费开放,这些功能此前是ChatGPT Plus付费订阅用户才可以使用的功能。不过,在免费用户的使用次数上并没有明确提及,预计还是会是有一定次数限制。

图片

当地时间 5 月 13 日,OpenAI 举办新品发布会,对外宣布了旗舰大模型 GPT-4o。该模型打通了文本、图片、视频和语音输入,无需中间转换,互相之间就可以直接生成。此次发布会还带来了更智能的实时语音助手,以及适用于 macOS 平台的 ChatGPT 桌面应用程序。

当时,OpenAI 宣布向 ChatGPT Plus 和 Team 用户推出 GPT-4o,很快就会向企业用户推出。同时,也向所有人开放 GPT-4o 多模态能力,但有使用次数限制。

中国石油、中国移动、华为、科大讯飞共建昆仑大模型

图片

近日,昆仑大模型建设研讨会暨合作共建签约仪式在京举行。

中国石油集团董事长、党组书记戴厚良出席并讲话,中国移动董事长、党组书记杨杰,华为公司常务董事、华为云 CEO 张平安,科大讯飞董事长刘庆峰参加研讨并见证签约。

此次签约由中国石油集团总经理、党组副书记侯启军主持。此次签约标志着昆仑大模型建设正式启动,对于推动人工智能在能源化工行业的大模型开发建设和高水平应用,发展新质生产力,具有重要意义。

随着昆仑大模型的研发与应用,未来在能源化工行业将涌现出更多智能化、数字化的创新应用,带动产业高质量转型升级,形成百花齐放的人工智能产业应用生态。

百度计划在2025年发布文心大模型5.0

5月29日,来自新浪科技的消息称,有知情人士透露,百度公司最早将在 2025 年的百度世界大会期间发布新一代的文心大模型 5.0 版本。

图片

当前的文心大模型最新版本为 4.0 版本,该版本于 2023 年举办的百度世界大会上由百度创始人李彦宏发布,具备理解、生成、逻辑和记忆四大核心能力。在发布 4.0 版本时,李彦宏介绍,文心大模型 4.0 发布后相比 GPT-4 便已毫不逊色。

商汤发布粤语版“商量”大模型,可深入理解粤语地区的俚语文化

5月39日,据商汤科技官方公众号发布消息称,5 月 29 日香港举办的“商量粤语版发布会暨商汤科技十周年志庆启动礼”上,商汤宣布将免费向粤语区用户推出粤语大模型 Web 版及 App 版,“商量语言大模型粤语版”及“商量多模态大模型粤语版”即日起向企业用户开放 API。

商汤科技董事长兼 CEO 徐立表示,“商汤科技十年前于香港成立,在这个地方推出商量粤语版,对我们来说有着重大的意义。凭借日日新大模型 5.0 系列的创新产品及其巨大潜力,我们致力推动香港人工智能生态系统的发展。”

据介绍,商汤“日日新5.0”大模型针对粤语环境进行了多项本地化设置,对粤语俚语及粤文化理解深入,官方更称可为大湾区等粤语地区用户提供更优质且更贴合使用习惯的语言模型。

除了文字交互,商量粤语版 App 还可以通过粤语语音识别能力及粤语文字转语音功能,为用户提供语音交互功能。此外,“商量多模态大模型粤语版”整合了多模态数据和超长文理解、思考、生成的能力,支持上传 50 个文档,并可短时间内对财报数据、复杂图表等予以对比分析、输出结果。

官方表示,面向粤语区用户推出的粤语大模型 Web 版及 App 版将“很快问世”。

快手正式上线自研AI绘图大模型“可图”,支持文生图/图生图

据国内媒体报道,快手自研文生图大模型“可图”已于近日正式对外开放,其目前支持文生图和图生图两类功能,可用于 AI 创作图像以及 AI 形象定制。用户可通过在微信客户端通过“可图”的微信小程序和网页版使用。这也是快手首次将其自研的系列大模型对外开放。

报道援引知情人士消息称,“可图”大模型的参数规模达十亿级,这些数据来自开源社区、快手内部构建和自研 AI 技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。

以“可图”的微信小程序版本为例,目前提供的功能包括“文生图”,以及多款动漫主题、写实人像风格,包括本世纪早期流行的“红钻贵族”、近期较为热门的“粘土世界”风格,以及多种不同风格的“绘画”样式,用户一次可生成最多 4 张图片。

据报道,快手内部今年明确了大模型应用策略,主要包含理解、互动和生成三个方向,具体的应用场景包括全域大模型内容理解、AI 互动、商业场景的数字人与 AIGC 等。

Opera浏览器内置AI助手Air接入谷歌Gemini大模型

国内出海软件龙头企业昆仑万维旗下的海外信息分发与元宇宙平台 Opera 浏览器宣布与谷歌云 Google Cloud 合作,将谷歌 Gemini 大模型整合至原生浏览器 AI 助手 Aria 中。

据介绍,Opera 原生浏览器 AI 助手 Aria 由 Opera multi-LLM Composer AI 引擎驱动。该引擎可为用户提供多种大模型进行选择使用。

此次集成谷歌 Gemini 大模型,将增强 Aria 的图像生成、文本到语音转换等能力。目前,Opera 所有浏览器均已接入 AI 助手 Aria。

Opera 浏览器始创于 1995 年,总部位于挪威奥斯陆,2016 年 2 月被奇虎 360 和昆仑万维收购。Opera 在冰岛凯夫拉维克建设一个新的 AI 服务器集群,该集群采用英伟达 DGX SuperPOD 方案,由纯绿色能源驱动。

3

相关文章