“零一万物”对涉嫌抄袭事件道歉,李开复朋友圈回应:公司会向开源社区同行虚心学习,持续进步
AI奇点网11月16日报道丨日前,李开复投资创办的大模型研究公司“零一万物”被阿里前AI科学家贾扬清质疑,完全直接挪用Meta开源大模型LLaMA的架构,只对两个张量(Tensor)名称做修改。11月15日下午,官方正式出来发文回应,在初次开源过程中,他们发现开源的LLaMa架构会对开发者普遍更为友好,对于沿用LLaMa部分推理代码属于经过实验更名后的疏忽,原始出发点是为了充分测试大模型,并非刻意隐瞒来源。零一万物对此表达诚挚的歉意。
作为公司的最高领导者,今天李开复在朋友圈也针对此事做了回应。李开复表示:
全球大模型架构一路从 GPT2 --> Gopher --> Chinchilla --> LLaMa 2 --> Yi,行业逐渐形成大模型的通用标准,就像做一个手机 App 开发者,不会去自创 iOS、Android 以外的全新基础架构。
01.AI(零一万物)起步受益于开源,也贡献开源,从社区中虚心学习,我们会持续进步。
今年3月,创新工场董事长李开复在北京创办大模型创业公司“零一万物”,近日这家公司发布了两款开源大模型 Yi-34B 和 Yi-6B 两个开源大模型。该模型使用了LLaMA的架构,只对两个张量名称进行了修改。
昨日下午,“零一万物”开源团队总监Richard Lin对媒体回应称,这一命名问题是开发人员疏忽导致,开发人员在代码中进行了几次重命名,以满足实验要求。但是开发人员“忘记将张量名称修改回LLaMA”,开发人员对此感到抱歉。官方对此还进一步解释,大模型持续发展与寻求突破口的核心点不仅在于采用了什么样的架构,更重要是训练时候使用的参数。
对此,阿里前AI科学家贾扬清最新发文表示,开源大模型领域,“魔改”要不得。此言直指“零一万物”针对架构之外进行了大量的重构,可能会影响大模型的性能。