首页  >  资讯  >  文章
2023-06-02 18:19

知乎携手面壁大模型发布开源计划:拥有百亿量级参数、万亿级高质量语料

AI奇点网6月2日报道丨伴随着AIGC产业的不断加速推进,新的语言大模型正在被推向前台。5月27日,国内知名知识问答网站知乎联合面壁智能在2023数博会上发布了最新的大语言模型成果。据悉,面壁智能联合OpenBMB语料开源社区,将自研的CPM-Bee 10b模型开源。中英双语表现优秀,拥有百亿量级参数、万亿级高质量语料。

知乎CTO李大海在会上宣布,基于面壁大模型打造的知乎模型应用“搜索聚合”即日开启内测,并发布了类似ChatGPT的对话类聊天产品“面壁露卡”,产品形象是一位叫“露卡”的AI机器人。

在4月的2023知乎发现大会上,知乎率先推出了国内首个知识类大语言模型——“知海图AI”,并内测首个站内大模型应用功能“热榜摘要”。时隔一个月之后,知乎再度联合面壁在2023数博会上带来惊喜。李大海介绍,两家公司在技术上联合研发,同时产品上各有部署。

“搜索聚合”聚焦在知乎搜索的能力输出上,每当用户触发搜索时,系统就会从大量提问和回答中聚合观点,提高用户获取信息、形成决策的效率,也是行业内首个针对知识类问答的大型垂直语言大模型。

面壁智能是一家研发大模型的创新企业,它们早年就联合OpenBMB开源社区,并且将自研的CPM-Bee 10b训练模型数据都全部开源。“CPM-Bee 10b将全面开源并且授权商用。”李大海称,面壁智能一直坚持开源路线,未来也会持续拥抱开源,与广大的模型训练师共创繁荣生态。据介绍,该模型从0开始自主训练,基于Transformer架构,中英双语表现优秀,拥有百亿量级参数、万亿级高质量语料。在ZeroCLUE评测中,CPM-Bee 10b以总分78.18分登顶;在英文常识知识推理榜单上,CPM-Bee 10b得到了67分的平均分,媲美英文开源模型LLaMA。

发布会上还展示了Chat对话类模型产品“露卡”(Luca)。该产品支持智能交互并支持多轮上下文理解对话。能帮助人了解世界知识、处理数理逻辑、编写程序代码、激发创作灵感;还可以利用海量知识数据,帮助人更好地获取信息、做出规划、解决问题。发布会现场还展示了“露卡”优秀的多模态理解能力,不仅可以解析风景、地理等图片信息,还可以理解人物类图片所传达的情绪含义。此外,“露卡”还可以查找论文并生成摘要。李大海介绍,“露卡”目前已开启内测,面壁将不断完善功能,让更多用户体验到大模型带来的便利。

“我们未来很快会把大语言模型能力用在知乎的创作者身上,“李大海说,“创作者用这个能力的时候,一定不是替代创作者来创作的一个生态,我们会把它当成创作者的一个助手。”

2

相关文章