首页  >  资讯  >  文章
2023-06-27 09:36

百度文心大模型 V3.5 训练速度提升 2 倍 | 华为 7 月公布盘古大模型升级 | 360周鸿祎表示很多企业只需百亿级大模型

AI奇点网报道 【2023年6月27日早报】

百度文心大模型 V3.5 训练速度提升 2 倍

百度文心大模型已经迭代至3.5版本,与3.0版本相比,训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%。

文心大模型3.5版本,不仅是技术上的升级,更是安全上的升级。文心模型采用业界主流的大模型基础能力评估方法开展评估,结果显示,文心大模型3.5版本,在数据质量、生成效果和内容安全性上,都得到了明显提升。

华为 7 月公布盘古大模型重要升级

华为开发者大会2023(HDC.Cloud 2023 )将于7月7日在东莞举办。目前华为已经公布了此次会议的主题演讲议程,AI占据了不少内容,尤其是华为云盘古大模型将迎来重大升级。华为盘古系列基础大模型于 2021 年正式对外发布,包括 NLP(自然语言处理)、CV(机器视觉)和科学计算大模型。

据了解,华为云CodeArts Snap智能编程助手即为华为代码大模型的应用案例,可赋能开发者高效、可信开发。这意味着华为的大模型应用正加速走向全球,并持续扩大生态圈。

360周鸿祎表示很多企业只需百亿级大模型

“GPT大模型的诞生代表着通用人工智能、强人工智能的到来,是真正的智能涌现。”6月26日,在世界互联网大会数字文明尼山对话主论坛上,360集团创始人周鸿祎以360自研认知大模型“智脑”为例,分享了相关实践经验和思考。

第一,公有大模型虽然是通才,但它缺乏行业深度。第二,公有大模型容易造成企业内部数据泄露。第三,对企业来讲,公有大模型无法保障内容真正可信。第四,公有大模型无法实现成本可控。

同时,许多企业其实只需要大模型写代码的能力,百亿级垂直大模型就能满足需求,如果使用千亿级大模型就是成本的浪费。在控制成本方面,垂直大模型将会有很大优势。在用公开数据训练的“通识”大模型基础上,训练专有大模型,就能做到“事半功倍”,为企业降本增效。

腾讯云:星脉网络助AI大模型提升10倍通信性能

腾讯云首次对外完整披露自研星脉高性能计算网络。据称,星脉网络具备业界最高的3.2T通信带宽,能提升40%的GPU利用率,节省30%~60%的模型训练成本,为AI大模型带来10倍通信性能提升。基于腾讯云新一代算力集群HCC,其可支持10万卡的超大计算规模。

腾讯云副总裁王亚晨表示:“星脉网络是为大模型而生。它所提供的大带宽、高利用率以及零丢包的高性能网络服务,将助力算力瓶颈的突破,进一步释放AI潜能,全面提升企业大模型的训练效率,在云上加速大模型技术的迭代升级和落地应用。”

AIGC的火爆带来AI大模型参数量从亿级到万亿级的飙升。为支撑海量数据的大规模训练,大量服务器通过高速网络组成算力集群,互联互通,共同完成训练任务。

比尔盖茨表示,AI 可以在 18 个月而不是几年内教会孩子们阅读

人工智能已经在整个教育领域掀起了波澜,微软联合创始人比尔·盖茨表示,人工智能聊天机器人可以在 18 个月而不是几年内教会孩子们阅读。年轻一代被数字工具包围,专家表示,课堂沉浸在人工智能中只是时间问题。

在未来,特别是由编程的大型语言模型支持的聊天机器人,可以帮助学生从初等教育到认证计划,通过大量材料进行自我指导,并根据特定的学习方式定制他们的教育。

通过聊天机器人和人工智能支持的程序不断地从提供给他们的信息中学习,教学不仅可以根据学生的需求进行个性化,而且这些信息可以为教师提供更多有关学生的数据并立即生成材料。逐渐接受没有老师的环境,接受机器学习。

3

相关文章