百度云宣布开启“AI原生应用时代”:构建大模型-算力-AI原生应用三位一体,百度版「GPTs」正式上线
本文来自于丨36氪
12月20日,在2023百度智能云·智算大会上,百度集团副总裁侯震宇提出了建立繁荣AI原生应用生态的3个关键组件:大模型、智能计算、AI原生应用开发新范式。
他提到,在AI时代,应用技术、AI技术、IT基础设施三条平行的发展线终于交汇融合:
而百度云对模型服务的升级,也主要围绕大模型、智能计算、AI原生应用开发新范式三个层面。
1、在大模型层面,围绕建设模型服务生态、模型训练降本增效,千帆大模型平台做了一定的升级:
2、在智能计算等基础设施层面,百度发布了百舸异构计算平台3.0、智算网络平台,以及百度云原生数据库GaiaDB 4.0.
“以前传统和应用互联网应用都是基于CPU(中央处理器),现在AI原生应用还要用CPU,但是它的负载大量迁移到了异构或者GPU(图形处理器)上面来,从底层算力再到AI应用的核心能力都变成了模型,而不是基于某一个固化下来的逻辑能力。”在12月12日的媒体会上,侯震宇表示。
AI时代给云计算带来的变革在于,如何能更高效的利用模型成为核心能力。大会上发布的百舸异构计算平台3.0能够支持万卡级别的超大规模AI集群计算。相比自建智算基础设施,百舸能将模型训、推吞吐分别最高提升30%和60%。在资源利用层面,百舸3.0将集群有效训练时间占比提高到了98%,网络带宽有效利用率提高到了95%。
智算网络平台则支持百度和第三方智算节点的算力资源的灵活调配。而GaiaDB 4.0主要实现了数据的跨机查询,并针对不同的工作负载推出了列存索引(支持小规模数据的高效检索)和列存引擎(最大可支持PB级数据的复杂分析),可以提升不同规模数据的查询速度。
“对于模型而言,已经没有‘Bug’的概念了,而是全部基于数据库,比如怎么处理数据流、清洗数据,或者用新的一组数据集的分布去解决所谓的‘Bug’。数据库的重要性会变得更高。”侯震宇在媒体会上表示。
3、在AI原生应用研发范式层面,百度从即日起面向所有用户开放了AppBuilder。
AppBuilder是百度在2023年10月17日在世界大会上发布的AI应用开发平台。AppBuilder的服务主要由组件层和框架层构成。所谓的组件层,是将特定的底层能力封装到一个个组件中,再以组件的形式对外提供服务。框架层的作用,则是将封装好能力的组件进行串联,让串联的组件能完成特定的任务。
在组件层,AppBuilder提供了多模态AI能力组件(如文字识别、文生图等)、基于大语言模型的能力组件、基础组件(如向量数据库、对象存储)。在框架层,AppBuilder提供了检索增强生成(RAG)、智能体(Agent)、智能数据分析(GBI)等AI原生应用框架。
针对不同技术背景的开发者,AppBuilder分别提供了低代码态和代码态两种产品形态。低代码态产品适用于非技术背景的开发者以及通用的开发需求,用户只需要简单点选就可以定制和上线AI应用。针对具有深度开发需求的用户,AppBuilder也提供包括SDK、开发环境、调试工具、示例代码等各种代码化的开发套件和应用组件。
2024年,在侯震宇看来,是AI生态发展的关键一年。一方面,算力推理层和模型训练工具链的优化,将是2024年的重点。他表示:“2024年我觉得算力的整体供应不确定性或紧张程度较大,所以如何能够更有效使用算力资源,是一个大家都要面临的问题。”
另一方面,侯震宇将2024年视作AI原生应用的元年。他告诉36氪,2023年更像是模型训练的元年,所接触的客户还处于逐步理解大模型的阶段。“最终AI赋能应用在明年开始逐步能够出来,今年才刚刚开始。”他说,“现在也有很多创业公司想用大模型做很多事情,这类用户的体量也很大,是最早一波吃螃蟹的人。这一票人将来对模型、对算力的消耗,我们相信都是最大的。”
模型厂商的收入高点,也将随着AI应用的爆发而到来。侯震宇对36氪表示,模型的收入,与模型的调用联系在一起:“大模型赚钱或者是云计算通过大模型来赚钱,一部分是模型生产,另外更多还是在应用层面调用模型服务的收入和产生算力的钱——这在将来会是更大的规模。”