华为盘古Chat七月登场:自然语言对话能力比肩GPT-3.5
AI奇点网6月5日报道丨据国内媒体报道,华为公司计划在7月7日举行一年一度的华为云HDC 2023开发者大会,届时将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat”,被认为是华为旗下的首款针对AI生成式的GPT应用,基于华为自研的盘古大模型。与ChatGPT和百度文心一言针对C端用户市场不同的是,华为这款产品主要面向ToB/ToG的政企端客户。
华为盘古大模型可广泛应用于智能舆情、智能营销、智能巡检、智慧物流等多种场景,具有赋能千行百业的潜力。在人才储备和算力自主可控方面具有优势,有望成为国内领先的大模型产品。此前曾有国内券商披露,在训练千亿参数的盘古大模型时,华为团队调用了超过2000块的昇腾910芯片,进行了超2个月的数据训练能力。
根据内测人士透露,盘古PanGu-Σ大模型的自然语言对话能力达到GPT-3.5的水平。在2022 年 4 月华为官宣发布了 2.0 版本,并且宣布自然语言处理大模型、计算机视觉大模型和科学计算气象大模型均已实现商用上线。
华为盘古大模型最初于 2020 年 11 月在华为云内部提出,并于2021年4月对外透露该消息。根据华为公布的一份论文数据,盘古 PanGu-Σ 大模型的参数量高达 1.085 万亿,并基于华为自研 MindSpore 框架。根据之前的报道,作为一家非互联网社交属性的企业,华为为了打造盘古大模型,从互联网通过工具爬取了80TB公开的文本,最后清洗出1TB的中文数据集以供大模型训练。
对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。
今年7月7日,华为云开发者大会HDC 2023将在华为的东莞松山湖基地拉开帷幕,并将在国内30多个城市、海外10多个国家开设分会场。华为常务董事、华为云CEO张平安在《致全球开发者》的一封信中表示,AI技术风起云涌,百家争鸣,激发新一轮百花齐放的应用创新,驱动千行百业的数字化转型升级,“Al for Industries”将成为人工智能新的爆发点。