首页  >  资讯  >  文章
2023-10-31 18:01

阿里旗下通义千问大模型2.0版本正式发布:千亿级参数赶超ChatGPT,同时发布8大垂直行业大模型应用

AI奇点网10月31日报道丨今天下午,在一年一度的 2023 云栖大会现场,阿里云正式发布千亿级参数大模型通义千问大模型。阿里云CTO周靖人宣布,阿里大模型的家族迎来年度最强升级,也宣布通义千问 2.0 版本正式发布。

根据官方特供的信息,在MMLU、C-Eval、GSM8K、HumanEval、MATH等等10个国际主流的大模型Benchmark测评当中,通义千问2.0版本的综合表现超越ChatGPT(GPT-3.5)以及Meta的Llama-2-70B,正在加速追赶GPT-4,与GPT-4的PK里边也是不分伯仲,略逊一筹。

阿里云首席技术官周靖人透露,过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。

英语任务方面,通义千问2.0在MMLU基准的得分是82.5,仅次于GPT-4.通过大幅增加参数量,通义千问2.0能更好地理解和处理复杂的语言结构和概念。

在更为本土化的中文任务方面,通义千问2.0版本以明显优势在中文测评C-Eval基准获得了最高分,这是由于模型在训练中学习了更多中文语料,进一步强化了中文理解和表达能力。

在数学推理、代码理解等领域,通义千问2.0进步明显。在推理基准测试GSM8K中,通义千问排名第二,展示了强大的计算和逻辑推理能力;在HumanEval测试中,通义千问得分紧跟GPT-4和GPT-3.5。该测试主要衡量大模型理解和执行代码片段的能力,这一能力是大模型应用于编程辅助、自动代码修复等场景的基础。

在发布新一代通义千问大模型2.0版本的同时,阿里云官方还宣布,基于通义大模型训练的8大行业模型全面上线,它们分别是:

  • 通义灵码-智能编码助手
  • 通义智文-AI阅读助手
  • 通义听悟-工作学习AI助手
  • 通义星尘-个性化角色创作平台
  • 通义点金-智能投研助手
  • 通义晓蜜-智能客服
  • 通义仁心-个人专属健康助手
  • 通义法睿-AI法律顾问

截至10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。

周靖人提到,通义千问自今年4月首次发布以来,受到社会广泛关注。据介绍,通义千问 2.0 模型参数达到千亿级别,不管是在阅读理解还是逻辑思维、数据等方面,都有大幅度提升,能够全面的达到国际先进水平。

伴随着新版大模型的推出,通义千问 App 也随之发布,支持语音对话等功能,用户开始可以下载相关 App 进行体验。

周靖人指出,阿里云最先提出了“模型即服务”的创新理念,阿里云拥有从大模型底层算力与构筑,到大模型上层应用的拓展落地,再到围绕大模型开展生态建设的全方位立体能力。通过多年的技术积累,阿里云已经搭建了完善 AI 基础设施,建立了完善的 AI 大模型训练平台,能够为大家提供一个非常完善的模型推理服务。

6

相关文章