百川智能发布Baichuan2-53B大模型:530亿参数闭源,号称国内“AI幻觉”最低的大模型
AI奇点网9月25日报道丨搜狗创始人王小川创立的人工智能大模型研究公司百川智能今日宣布推出 Baichuan2-53B 闭源大模型,全面升级了 Baichuan-53B 的各项能力。据介绍,Baichuan2-53B 不仅数学和逻辑推理能力提升显著,还通过高质量数据体系和搜索增强极大降低了模型幻觉,号称是“目前国内幻觉问题最低的大模型”。
Baichuan2-53B 是百川智能发布的第 6 款大模型,自 4 月 10 日成立以来,百川智能平均每 28 天推出一个大模型。
百川智能表示,在 Baichuan-53B 的基础上,Baichuan2-53B 不仅重点强化了以上两个维度的能力,并且对整体能力进行了全面升级。其中,逻辑推理能力提升 100%,数学能力提升 31%,语言理解能力提升 29%,文本创作提升 18%,知识问答提升 9%。
想中小学基础的数学题,Baichuan-53B可以很轻松地应用,也可以按照要求列出方程解析式。
Baichuan2-53B 在幻觉处理方面也进行了优化。高质量数据构建方面,Baichuan2-53B 号称“独创了一套数据质量体系”。以低质、优质为标准将数据进行分类,确保模型始终使用优质数据进行预训练。
信息获取方面,Baichuan2-53B 对多个模块进行了升级,包括指令意图理解、智能搜索和结果增强等关键组件。这一综合体系通过深入理解用户指令,精确驱动查询词搜索,最终结合大语言模型技术,优化模型结果生成的可靠性,实现更精确、更智能的模型回答结果,减少模型幻觉。
百川智能使用 FacTool 评测后的结果显示,Baichuan2-53B 综合得分为 140.5。在主流基础大模型中仅排在 GPT-4 之后。
FacTool 是由上海交通大学、卡内基梅隆大学、香港城市大学、Meta 等机构研究人员提出的一款通用框架,能够查核大模型生成内容的事实准确性(也能查核一般性内容的事实准确性)。