首页  >  资讯  >  文章
2023-08-31 10:25

百度文心、商汤日日新、王小川百川在列:国内8家大语言模型获得官方上线牌照!

AI奇点网8月31日报道丨8月31日今日凌晨,备受行业瞩目的首批大模型产品获批名单终于出炉,当中既有巨头企业,也包含了创业公司与科研院校,具体的企业机构包括:

五家北京企业机构:百度(文心一言)、抖音(云雀大模型)、智谱AI(GLM大模型)、中科院(紫东太初大模型)、百川智能(百川大模型)

三家上海企业机构:商汤(日日新大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型)

产品获批后,上述机构的大模型产品,即可在网站/应用商店下载后直接使用,也终于摆脱了“限量公测”的帽子,可以进行所谓的商业化市场行为。以百度旗下的文心一言为例,AI奇点网小编发现,文心一言的APP已经可以在各大应用商城直接下载马上开始使用,无需任何内测申请码,此前则需要排队领取内测资格。

百度官方发文,文心一言向全社会开放,今年10月14日,百度还将开放一批经过全新重构的AI原生应用。随后,百川智能正式宣布:从今日起,百川大模型面向全社会开放服务。商汤官方今天也发文表示:商汤旗下大模型应用“商量SenseChat”即日起全面向广大用户开放服务。

首批获准上线的大模型产品及企业介绍:

百度-文心一言大模型

百度“文心一言”为国内首个、全球大厂中首个生成式AI产品,于2023年3月16日开启邀测,基础模型文心大模型早在2019年就在国内率先发布,近期升级的文心大模型3.5也持续在十余个国内外权威测评中位居第一。

抖音集团-云雀大模型

8月17日,抖音集团(前字节跳动)宣布开始对外测试AI对话产品“豆包”。据悉“豆包”是基于抖音云雀模型开发,提供聊天机器人、写作助手以及英语学习助手等功能。目前支持网页Web平台、iOS 以及安卓平台,用户可通过手机号、抖音或者Apple ID登录使用。

智谱AI-GLM大模型

成立于2019年的智谱AI,是国内最早一批研发大模型的企业,由清华大学知识工程实验室(KEG)技术成果转化。

当前,智谱已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。

基于ChatGLM,智谱已于今年推出To C聊天对话应用“智谱清言”。而在To B层面,智谱也已经与多家国内互联网巨头,政企达成合作。

百川智能-百川大模型

百川成立于2023年,由搜狗创始人王小川创立。今年6月15日,百川智能推出70亿参数量的中英文语言模型Baichuan-7B,一个月后又接连发布了参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及INT4/INT8两个量化版本。前不久,百川智能刚刚宣布推出新一代大模型Baichuan-53B。

中科院自动化研究所-紫东太初大模型

中科院自动化研究所成立于1956年10月,是中国最早成立的国立自动化研究机构。“紫东太初”定位为跨模态通用人工智能平台,于2021年正式发布。

“紫东太初”目前参数已达千亿级别,拥有视觉、文本、语音多种模态,基于全栈国产化基础软硬件平台建立。今年6月,紫东太初发布2.0版本,再加入了视频、传感信号、3D点云等新的模态数据。目前,紫东太初已在文本创作、医疗、物流、政务等多个行业实现应用落地。

商汤-日日新大模型

今年4月,商汤推出日日新SenseNova”大模型。据悉,日日新大模型拥有提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种能力,其中还包括商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品。目前,商汤最新版大模型“商量SenseChat 2.0版本”已发布,据悉其参数达千亿级规模。

Minimax-ABAB大模型

Minimax成立于2021年,由前商汤科技副总裁、通用智能技术负责人闫俊杰成立。

在模型层,Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构,并推出自研通用大模型“ABAB”。

Minimax也是如今国内估值最高的大模型初创公司之一。据路透6月报道,Minimax完成了新一轮2.5亿美元融资后,整体估值超过12亿美元。

上海人工智能实验室-书生大模型

上海人工智能实验室(又称浦江实验室)成立于2020年,由上海人工智能创新中心发起设立。

2021年,浦江实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系“书生”(INTERN)。到如今,书生大模型体系参数已达千亿级别,包括“书生·多模态”、“书生·浦语”和“书生·天际”等三大基础模型,以及面向大模型研发与应用的开源体系。

5

相关文章