「青春版」GPT-4o mini零元砸场：OpenAI发布性比价最高的大模型，GPT-3.5功成身退-AI奇点网

首页 > 资讯 > 文章

2024-07-19 10:48

「青春版」GPT-4o mini零元砸场：OpenAI发布性比价最高的大模型，GPT-3.5功成身退

AI奇点网7月19日报道丨今天一早，ChatGPT再度上新。

当地时间7月18日，OpenAI发布一款「GPT-4o mini」的新模型——是目前旗下最强的GPT-4o的小参数量简化版，用中国人的话讲便是「青春版」，而且是完全免费的。?

从OpenAI分享的基准测评结果来看，GPT-4o mini在推理能力上超越了谷歌Gemini Flash和Anthropic Claude 3 Haiku等竞争对手的“中杯”版本。

GPT-4o mini 在数学推理和编程任务方面也同样表现出色，远超市场上的其他小型模型。

在 MGSM 数学推理能力基准测试中，GPT-4o mini 得分达到了 87.0%，而 Gemini Flash 的得分为 75.5%，Claude Haiku 的得分为 71.7%。

GPT-4o mini 在 HumanEval 基准测试中同样再次展现优势，得分达到 87.2%，而 Gemini Flash 的得分为 71.5%，Claude Haiku 的得分为 75.9%。

图片

而在多模态推理 MMMU 中，GPT-4o mini 也表现出色，得分为 59.4%，而 Gemini Flash 得分为 56.1%，Claude Haiku 得分为 50.2%。

值得注意的是，作为上一代的大模型，GPT-3.5 Turbo 在这些基准测试中的得分均不如 GPT-4o mini。OpenAI表示，GPT-4o mini是「目前功能最强大、性价比最高的小参数模型」，这款新模型支持50种语言，将替代陈旧的GPT-3.5。

GPT-4o mini支持128K长文本输入，与完全版无异，主打低成本的API调用和快速响应能力，适用于多种多模态应用场景。

单价方面，每100万Tokens仅为15美分，还不到一毛钱，比GPT-3.5 Turbo降价60%，是目前同级参数下性价比最高的大模型。

「GPT-4o mini」即日起上线ChatGPT并无偿向网友提供使用，而GPT-3.5直接下线。

而其完整版的GPT-4o则是今年5月OpenAI发布的最新旗舰大模型，继续以限量对话的方式免费向用户提供服务。

GPT-4o mini的推出，意味着OpenAI正试图直面市场越来越多竞争对手的局面，包括微软Phi、谷歌Gemma、Anthropic Claude 3 Haiku在内的产品，都主打小参数。所谓「以小博大」，在新式训练与蒸馏手段下，小参数模型并不比大参数的模型表现差，反而十分接近。

外媒CNBC对此评价，GPT-4o是OpenAI首个多模态模型，「GPT-4o mini」是OpenAI尝试面向更多的用户群体提供多模态应用能力，让ChatGPT可以驾驭文本、图像、音频和视频等不同的媒介，同时继续确保自己在行业内的领导地位。

查看相关话题： #OpenAI #GPT-4o #AI聊天机器人

AI奇点网打杂的

作者已发布 649 篇文章

近期文章

OpenAI发布「SearchGPT」AI搜索服务丨OpenAI今年全年亏损将达到50亿美元丨百川智能完成新一轮50亿元融资

快手「可灵AI」全面开放内测，国际版上线丨Mistral发布1230亿Large 2旗舰模型丨OpenAI免费提供GPT-4o微调

Meta发布Llama 3.1开源大模型丨巴黎奥运会与阿里通义达成AI技术合作丨马斯克完成全球最强AI算力集群

OpenAI深夜发动价格战，GPT-4o mini暴跌99%丨清华同济校友立功，GPT-3.5退役

断网也能用！贾扬清团队推出端侧模型Chrome插件，arXiv/B站/吃瓜轻松总结