搜狗创始人王小川投资AI大模型:多项考核测评优秀,采用开源模式可免费商用
AI奇点网6月16日报道丨搜狗创始人王小川在腾讯全面收购搜狗后,离开创办的百川智能公司,主要业务是人工智能领域开发。日前,他宣布推出了 70 亿参数量的中英文预训练大模型 ——baichuan-7B。目前 baichuan-7B 大模型已在 Hugging Face、Github 以及 Model Scope 平台发布。
百川智能方面表示,为了验证模型的各项能力,baichuan-7B 在 C-Eval、AGIEval 和 Gaokao 三个最具影响力的中文评估基准进行了综合评估,并且均获得了优异成绩,它已经成为同等参数规模下中文表现最优秀的原生预训练模型。
王小川主持开发的百川智能7B大模型,基于Transformer结构,通过在大约1.2万亿个tokens上进行训练而成。该模型具有强大的语言理解和生成能力,可以应用于各种自然语言处理任务,如文本分类、问答系统、翻译等。
据介绍,baichuan-7B 代码采用 Apache-2.0 协议,模型权重采用了免费商用协议,只需进行简单登记即可免费商用。北京大学和清华大学已率先使用 baichuan-7B 模型推进相关研究工作,并计划在未来与百川智能深入合作,共同推动 baichuan-7B 模型的应用和发展。
百川智能 CEO 王小川表示:“本次开源模型的发布是百川智能成立 2 个月后的第一个里程碑,对百川智能而言是一个良好的开局。baichuan-7B 模型,不仅能为中国的 AGI 事业添砖加瓦,也为世界大模型开源社区贡献了新的力量。”
据悉,为了拓展人工智能大模型研究的业务,王小川成立人工智能公司百川智能,百川智能于2023年4月10日成立,公司早前已获得5000万美元启动资金,团队已初步搭建完成,分别来自搜狗、百度、华为、微软、字节跳动、腾讯等大厂,以及其他创业公司。王小川表示,公司取名“百川”,背后的寓意即是海纳百川,众多数据、行业知识汇聚成一个强大的智能体系,生生不息。
根据爱企查显示,百川智能的主要经营范围为:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;计算机系统服务;人工智能应用软件开发;人工智能双创服务平台;人工智能理论与算法软件开发;人工智能基础软件开发;人工智能通用应用系统;人工智能公共数据平台;人工智能公共服务平台技术咨询服务;人工智能基础资源与技术平台;人工智能硬件销售;人工智能行业应用系统集成服务。