字节跳动发布豆包大模型,火山引擎推出全栈AI服务,发布一系列ToB企业AI应用
AI奇点网5月15日报道丨5月15日,2024春季火山引擎 FORCE 原动力大会在北京正式举办。会上正式发布了字节跳动豆包大模型家族、火山方舟2.0、AI 应用及 AI 云基础设施等最新产品。
企业要做好大模型落地,面临模型效果、推理成本、落地难度的三大关键挑战:既要有好的基础大模型做支撑,解决复杂难题,也要有低成本的推理服务让大模型被广泛应用,还要更多工具、平台和应用帮助企业做好场景落地。
模型效果是 AI 落地最关键的挑战。谭待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均处理1.200亿 tokens 文本、生成3.000万张图片。
为助力企业做好大模型场景落地,字节跳动自主研发的豆包大模型将通过火山引擎正式对外提供服务,企业可根据自身业务场景需求灵活选择、快速落地:
谭待介绍,早在去年,豆包大模型(原名:云雀)就在字节跳动内部完成了上线,也是首批通过大模型服务安全备案的大模型之一。字节跳动内部50多个业务已经大量使用豆包大模型进行 AI 创新,包括抖音、头条等数亿 DAU 产品。
基于豆包大模型同名打造的豆包 APP,在苹果 APP Store 和各大安卓应用市场,豆包 APP 的下载量在 AIGC 类应用中排名第一。
字节跳动产品和战略副总裁朱骏介绍了字节跳动基于豆包大模型打造 AI 原生应用的产品理念。他表示,技术在快速演化,但用户核心的需求没有改变,比如高效获取信息的需求、工作提效的需求、自我表达的需求、社交娱乐的需求等。字节跳动做了很多学习和探索,希望找到适合的大模型应用形态,以自然的交互形式服务用户,走入更多人的生活和工作。
豆包 APP 是字节跳动重点投入的大模型应用,据朱骏透露,豆包平台月度活跃用户达到2.600万,已有超过800万个智能体被创建。
豆包大模型在服务字节内部的同时,也在与火山引擎的众多企业客户合作共创。谭待认为,企业在不同业务场景中,需要不同特点的模型,从而实现最佳效果和性价比。为此,豆包大模型提供的是一个多模态模型家族,企业可根据自身业务场景需求灵活选择,实现模型使用及成本控制的正循环。
谭待认为,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。豆包主力模型在企业市场的定价只有0.0008元/千 tokens,0.8厘就能处理1.500多个汉字,比行业便宜99.3%。
以豆包通用模型pro-32k版为例,模型推理输入价格仅为0.0008元/一千字tokens。而市面上同规格模型的定价一般为0.12元/千 tokens,是豆包模型价格的150倍。大模型价格,进入“厘时代”。
谭待表示,大模型“卷”价格,将助力企业以更低成本加速业务创新。
去年,火山引擎发布了一站式大模型服务平台火山方舟,希望通过模型即服务的理念,帮助企业在高效、安全的环境里应用各类模型。今年,火山引擎对方舟平台进行了全面升级,升级后的火山方舟2.0将大幅提升模型效果、核心插件、系统性能以及平台体验,帮助企业推进大模型的价值创造。
在插件和工具链上,方舟2.0升级了联网插件,提供头条抖音同款搜索能力,实时连接海量优质数据,同时使用文本、图像、语音等多模态交互方式,并通过业内领先的意图识别能力,大幅提升模型的信息获取能力;升级内容插件,提供头条抖音同源海量内容,支持多模态交互,提供基于意图的垂类内容信息检索,内容时效检索更强,帮助大模型深入理解、检索和生成内容;升级知识库插件,提供毫秒级百亿规模的高性能检索,秒级流式知识库索引更新,内嵌豆包向量化模型,提高搜索的相关性和准确性。
除以上核心插件升级之外,火山方舟2.0也全面升级了系统承载能力、安全防护能力和算法服务能力。在系统承载力上,提供充沛的 GPU 算力资源,分钟级千卡扩缩容的超强弹性,保障业务稳定和成本可控;在安全防护上,通过安全沙箱构建可信的执行环境,多维度的安全架构,保障数据安全;此外,火山引擎提供专业的算法团队服务,帮助客户释放独有数据价值,让企业大模型应用轻松落地。
除了好的模型效果、便捷的插件、强劲的系统性能,还需要提供简单易用开发平台,才能让所有人都能成为 AI 应用的开发者。扣子产品经理潘宇扬介绍,扣子(coze)作为字节跳动推出的新一代 AI 应用开发平台,具备低门槛、个性化、实时性、多模态等优势,并集合海量的 AI 资源、丰富的发布渠道、一键自定义 API 服务,帮助填补大模型到用户场景的最后一公里。
火山引擎正式发布了扣子专业版。扣子专业版在扣子可视化灵活编排智能体的能力基础上,进一步提供企业级 SLA 和多种高级特性,使 AI 应用更易落地,让企业更专注于通过智能体创新,驱动业务增长。
谭待表示,火山引擎致力于成为 AI 时代最开放和领先的云服务平台。全新升级的火山方舟2.0将通过更强性能、更优插件、更好服务以及安全可信方案,助力大模型应用落地。
豆包大模型和火山方舟2.0目前已经在金融、汽车、智能终端、电商零售、教育科研等多个行业实践落地。招商银行、海底捞火锅、超级猩猩、携程旅游、飞常准、猎聘等企业也已经在扣子上搭建了智能体。复旦大学、浙江大学等名校也为课程和实验搭建了 “AI 助教”。
作为金融行业 AI 转型的践行者,招商银行正在智能外呼、数字人、智能数据助理等上百个 AI 服务场景探索和投入。招商银行数字金融发展办公室主任高旭磊表示,大模型将为银行全链条业务带来改造和升级。携手火山引擎,双方将共建大模型应用场景及高性能基础设施,改造现有系统和产品,催生大量以 AI 为核心的智能体应用。
蒙牛集团副总裁、集团首席数智官李琤洁从生产工具进化、生产方式进化、组织方式进化的三个方面介绍了蒙牛集团的数智化历程。蒙牛集团正与火山引擎合作夯实技术底座,并构建了 AI 营养专家、AI 育婴师、AI 数据分析师、产品创新助手、热点创意助手等智能体矩阵,提升前端消费者体验,助力后端运营人员决策。
会上,火山引擎与 OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。OPPO 小布助手、荣耀 MagicBook 的 YOYO 助理、小米“小爱同学”、华硕笔记本电脑的豆叮 AI 助手等应用,均已接入火山引擎的大模型服务。
同时,火山引擎联合中国电动汽车百人会与吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等20余家厂商,宣布成立汽车大模型生态联盟,致力于探索新一代人车交互新形态,提升汽车全场景 AI 新体验。
两大联盟企业 OPPO 和捷途汽车也分别就自身的大模型实践进行了分享:
OPPO 智能助理部部长,小布助手首席架构师万玉龙分享了 OPPO AI 手机的大模型应用实践,他表示,目前小布助手已经覆盖3.5亿终端设备,月活跃用户数超1.5亿。在火山方舟上,OPPO 通过意图识别大模型、联网总结大模型、个性化人物大模型和豆包大模型构建了通用问答、伶俐小妹、面试官等智能体,为终端用户带来了全新的 AI 体验。
捷途汽车数字化负责人刘航表示,捷途汽车希望通过大模型扩大自身服务能力、洞察用户真实需求,进而提升销售效率和能力。携手火山引擎,双方围绕客服场景进行了共创,所打造的智慧客服 AI 小捷,在节省人力的同时,还能帮助客服人员快速获取信息,服务客户。未来,捷途汽车还希望通过大模型进一步实现座舱、决策、营销的智能化升级。
除大模型服务平台以外,AI 应用也是火山引擎全栈 AI 服务的关键组成。
去年,火山引擎提出了企业数智化升级新模式——数据飞轮,该模式以数据消费为核心驱动力,使企业数据流充分融入业务流,实现数据资产和业务应用的飞轮效应。为了让企业数据消费更普惠、更便捷,火山引擎智能数据洞察 DataWind 正式发布 AI 助手 ChatBI,用户可通过自然语言交互生成指标,用于图表制作、数据查询,还可进行深度数据分析,且 ChatBI 支持 IM 交互,可多端应用,随时随地自助分析,这将大幅降低数据消费门槛,提升读数、用数效率,为数据飞轮加速运转提供动力。
面向营销场景,火山引擎进行了智能创作云2.0的升级,成为从内容创作、矩阵分发、广告投放到数据洞察一站式的企业内容营销增长方案;不仅提供多模态的理解与生成能力,助力视频创作效率提升25倍,更上线抖音话题、POI、小程序等营销工具,使门店页面曝光提升600%。目前已经有3.000+企业在火山引擎开启 AIGC 视频营销增长。
面向销售场景,火山引擎发布了销售 AI 助手 Sales Copilot,能够高效跟进客户需求,随时辅助销售解答复杂的产品问题。此外,它还能通过角色扮演的方式模拟不同风格的对客演练,并提供优秀话术学习,提升销售沟通质量。
火山引擎一直致力于构建开放共享的生态理念,自2021年发布万有计划以来,已经帮助100+家 SaaS 企业实现了业务增长,实现近万单客户签约。豆包企服联盟,是万有计划针对大模型落地的专项计划。万有计划·豆包企服联盟将提供一揽子支持规划,帮助 SaaS 企业实现 AI 升级,为行业客户提供更多开箱即用的 AI 应用。
大模型时代,集群管理复杂度、网络性能、稳定性是云基础的关键挑战。为应对上述挑战,火山引擎基于内外共池的资源规模优势和内部实践,围绕大集群建设、管理、性能优化、稳定性保障提供了一套业界领先的解决方案。
会上,火山引擎正式发布 veOmniverse,基于 NVIDIA Omniverse 为企业、开发者提供全新的云上开发平台,助力企业与开发者在互联的虚拟世界中,围绕工作流程展开高效的设计和协作,探索和打造智能逼真的虚拟世界。
除为客户提供高稳定性和高性能的云基础设施外,面对本地部署需求,火山引擎也全新发布了混合云 veStack 智算版,具有万卡集群组网,3.2T 高性能无损网络的超大规模优势;端到端工程化所支撑的极致性能,能够实现97.78%训练加速比和分钟级故障发现和自愈;拥有多元异构能力,可适配十余种 GPU,支持主流国产化 GPU。
完整的 AI 应用除 GPU 负责的密集计算外,存量 CPU 负载也需要持续降本增效,保障业务轻装上阵,加速创新。从计算、存储、网络、运维4个层面,火山引擎全力支持客户云上业务稳定运营。