字节豆包大模型升级，综合能力提升20.3%丨微软发布Phi-3.5系列迷你模型丨IDC发布中国大模型应用份额报告：百度居首-AI奇点网

首页 > 资讯 > 文章

2024-08-22 09:00

字节豆包大模型升级，综合能力提升20.3%丨微软发布Phi-3.5系列迷你模型丨IDC发布中国大模型应用份额报告：百度居首

AI奇点网2024年8月22日报道丨AI资讯早报

字节豆包大模型升级，综合能力提升20.3%

8 月 21 日，字节跳动旗下的大数据运营商火山引擎 AI 创新巡展在上海举办。在此次会议上，火山引擎发布了豆包大模型的一系列产品升级。

5月15日正式对外发布以来，豆包大模型的日均 Tokens 使用量已经超过5,000亿，平均企业客户使用量增长了22倍。

基于内外客户广泛、真实的业务需求，豆包大模型在关键能力上不断迭代优化。公开及内部测评集显示，最新版豆包大语言模型相比发布初期综合能力提升了20.3%。其中，角色扮演能力提升了38.3%，具备了更强的上下文感知，让对话情境更连贯、角色更拟人化。

语言理解能力提升了33.3%，让豆包大模型在信息分类、抽取、摘要、理解和问答等 NLP 方面都有了显著提升，能够在更多生产力场景中得到应用。此外，模型在长文任务、数学、专业知识、代码能力上也有不同程度的增强。

本次活动上，字节方面还公布了多个豆包大模型的垂类模型的最新升级情况，包括：

其中，豆包·文生图模型对长文本有更精准的图文匹配能力，多主体、多位置、手部结构等复杂场景的生图能力更强，更善于理解中国特色元素，创造更具美感的中国风图片。

豆包·语音识别模型基于大语言模型丰富的知识和推理能力，通过上下文感知，提升语音识别准确性，在多个公开测试集中，与国内公开发布的语音识别大模型相比，错误率最高降低40%；支持一个模型识别普通话和粤语、上海话、四川话、西安话、闽南语等方言。豆包·语音合成模型升级了流式语音合成能力，能够实时响应、精准断句，支持“边想边说”。

字节火山引擎联合多家零售商成立大模型商业化联盟

8 月 21 日，火山引擎 AI 创新巡展在上海举办。在此次会议上，火山引擎发布了豆包大模型的一系列产品升级，并携手多点 DMALL 成立零售大模型生态联盟，基于豆包大模型打造零售 AI 解决方案，提升消费者购物体验。

火山引擎总裁谭待认为，大模型应用落地不仅需要技术成熟度，还要有适配的商业组织和商业生态。为此，火山引擎与商超、餐饮、食品、服装等众多行业领军企业合作，共同成立零售大模型生态联盟。

火山引擎总裁谭待表示，豆包大模型获得众多行业客户青睐，本次大模型生态联盟的首批成员包括：物美集团、抖音电商、抖音生活服务、百胜、麦当劳、中国飞鹤、海底捞、居然之家等知名企业。

微软发布Phi-3.5系列迷你模型，首次引入混合专家模型

当地时间8月20日晚间，微软公司今天发布了三款小参数尺寸的 Phi-3.5 系列 AI 大模型，其中最值得关注的是推出了该系列首个混合专家模型（MoE）版本的 Phi-3.5-MoE。

Phi-3.5-vision 共有 42 亿个参数，使用 256 个 A100 GPU 在 500B 标记上进行训练，现在支持多帧图像理解和推理。

本次发布的 Phi-3.5 系列包括 Phi-3.5-MoE、Phi-3.5-vision 和 Phi-3.5-mini 三款轻量级针对端侧设备提供的 AI 大模型，基于合成数据和经过过滤的公开网站构建，上下文窗口为 128K，所有模型现在都可以在大模型在线体验社区 Hugging Face 上以 MIT 开源许可的方式获取。

Phi-3.5-MoE 是 Phi 系列中首个利用混合专家（MoE）技术的模型。该模型在 16 x 3.8B MoE 模型使用 2 个专家仅激活了 66 亿个参数，并使用 512 个 H100 在 4.9T 标记上进行了训练。

微软研究团队声称，这次 Pin-3.5 版本乃从零开始设计的新模型，以进一步提高其性能。在标准人工智能基准测试中，Phi-3.5-MoE 的性能超过了 Llama-3.1 8B、Gemma-2-9B 和 Gemini-1.5-Flash，并接近目前在小尺寸模型领域的领头羊 GPT-4o mini。

玩家自创AI人物，《逆水寒》手游上线“自捏江湖友人”玩法

8月20日，《逆水寒》手游官方发布通告称，在即将到来的 V2.1.3 版本里，名为「自捏江湖友人」玩法即将上线，《逆水寒》手游将是“业界首个可以自捏 AI 智能生命体”的游戏。

新版本上线后，玩家可以点开【呼吸-自捏江湖友人】界面，输入姓名，即可一键完成捏人工作。

此外，玩家可以为江湖友人打造独一无二的外貌与声音。如果心中已有理想形象，可以选择扫码导入装扮站的现有外观；也可以在征得他人的同意后，通过扫码复制他人分享的门客的形象和人物特征为己所用。

IDC发布中国大模型应用份额报告：百度、商汤、智谱TOP3

8月21日，国际数据公司IDC首次对外发布了针对 2023 全年的《中国大模型平台市场份额，2023：大模型元年 —— 初局》市场调研报告。

数据显示，2023 年中国大模型平台及相关应用市场规模达 17.65 亿元人民币。在过去的一年中，行业对于大模型更多的是早期投入，甚至观望而不重投入，因此 2023 年整体市场规模并不显著；并且市场格局也主要还是由早期投入者，比如百度、商汤、智谱、百川智能等公司构成。

进入 2024 年，头部的互联网公司加大对大模型的投入且发起价格战，为早期的大模型初创企业带来一定的竞争压力。预计未来两到三年，市场格局将发生多轮巨变。

2023 年中国大模型平台及应用市场份额如下：

受益于多年来在 AI 领域的大力投入以及大模型的早期投入，百度智能云在 2023 年大模型市场规模达 3.5 亿元人民币，位居市场第一，市场份额达 19.9%
商汤科技也受益于其对大模型的专注投入，以及其所建设的上海 AIDC 能够为客户提供一体化的大模型计算与应用解决方案，位居市场第二，市场份额达 16.0%
智谱 AI 则是 2023 年初创企业中的胜出者，位居市场第三
其次是百川智能、第四范式等

Meta部署新的网络爬虫，为大模型训练收集数据

据外媒报道，今日 Meta 悄悄地发布了一款新的网络爬虫，用于搜索互联网并收集大量数据，为其人工智能模型提供支持。

据三家追踪网络抓取器的公司称，Meta 新网络爬虫机器人 Meta External Agent 于上月推出，类似于 OpenAI 的 GPTBot，可以抓取网络上的人工智能训练数据，例如新闻文章中的文本或在线讨论组中的对话。

新爬虫的存在表明 Meta 庞大的数据库可能已经不够用了，因为该公司继续致力于更新 Llama 和扩展 Meta AI，通常需要新的和高质量的培训数据来不断改进功能。

查看相关话题： #豆包 #字节跳动 #AI大模型 #微软 #百度 #Meta

Altman

工作人员

AI奇点网主编

作者已发布 426 篇文章

近期文章

OpenAI宣布企业架构重组丨可灵发布V1.5图像模型，推出「AI 模特」丨爱诗科技PixVerse V3.5版本上线

新“智”慧全国 AI 数字创意大赛颁奖盛典完美收官

深度求索发布DeepSeek-V3开源模型丨理想汽车转型 AI 公司丨雷军亲自招兵买马，小米开启自研大模型训练

不花一分钱！GPT-4o微调限时免费开放，每日附赠百万训练token

Midjourney官网在线生图限时免费丨Character.AI卖身谷歌丨360儿童手表智能问答功能出现争议言论，周鸿祎致歉