首页  >  资讯  >  文章
2024-06-18 14:12

勇夺第一!华为昇腾AI算力平台训练大模型效率超越英伟达A100

AI奇点网6月18日报道丨罕见公布!华为高管对外透露昇腾AI算力平台的性能。

在上周6月5日,2024世界半导体大会暨南京国际半导体博览会上,华为旗下的江苏鲲鹏·昇腾生态创新中心COO王陶透露,基于Ascend算力芯片打造的昇腾算力集群,是国内目前唯一可支持训练千亿参数大模型的解决方案,其AI算力性能已经超过了市面主流使用的英伟达A100。

英伟达A100被认为是当今AI大模型的“摇篮”,是海内外90%以上的大模型首选的训练平台。

与英伟达A100相比,华为昇腾AI芯片在训练大模型的效率层面已经达到英伟达的1.1倍,尤其在训练Llama、BloomGPT等主流开源大模型时,昇腾AI算力训练效率已经优于英伟达A100,更是领先国内同行竞品10倍!

华为自2018年10月发布AI战略以来,稳步而有序地推进战略执行、产品研发及商用进程。昇腾910、MindSpore的推出,标志着华为已完成全栈全场景AI解决方案(Portfolio)的构建,也标志着华为AI战略的执行进入了新的阶段。

昇腾910算力芯片属于Ascend-max系列。在HC2018上已经发布了其技术规格。实际测试结果表明,在算力方面,昇腾910半精度 (FP16)算力达到256 Tera-FLOPS,整数精度 (INT8) 算力达到512 Tera-OPS,重要的是,达到规格算力所需功耗仅310W,明显低于设计规格的350W。徐直军表示:昇腾910总体技术表现超出预期,作为算力最强AI处理器,当之无愧。

王陶介绍称,在中国的国产大模型里面,有将近50%的客户选择昇腾技术路线。昇腾现在已经是国产大模型的第一选择。具有超强AI算力、更优AI能效、极佳AI拓展等特点,可广泛应用于深度学习模型开发和训练。

目前,国内头部的AI大模型当中,只有科大讯飞的星火大模型完全基于华为昇腾算力平台进行训练。

“经过测试,科大讯飞使用华为的万卡集群进行大模型训练可实现英伟达A100的0.8~1.2倍的效率。与后者整体性能相比的确还存在一定差距,但在大模型训练这一块,已经与英伟达主流产品没有明显差距,特别是在万卡算力集群实践上,鲲鹏与科大讯飞联手完成了市场检验。”王陶称。

换而言之,华为昇腾是目前国内科技企业难以直接采购英伟达算力GPU的最佳平替。

根据科大讯飞公布的消息,新一代的星火V4.0大模型将在6月27日下周发布,将提供多项GPT-4o不具备的能力。比如:一句话复刻音色、高噪音场景语音识别、中国方言多语种翻译功能等。

7
查看相关话题: #华为 #AI算力 #AI芯片

相关文章