酷瑞百科11月15日消息,AI 大模型创业公司“零一万物”正式公开回应了其Yi大模型涉嫌抄袭LLaMA事件,称做法确实不妥,将会按照外界建议修改争议张量(Tensor)名。
零一万物由创新工场董事长兼CEO李开复于今年创办,并在本月初宣布推出Yi-34B和Yi-6B两个开源大模型,号称对学术研究完全开放,同步开放免费商用申请。
然而在不久前,开发者ehartford在Yi-34B的Hugging Face开源主页上表示,称该模型使用了Meta LLaMA的架构,只对两个张量名称进行了修改,分别为input_layernorm和post_attention_layernorm。
同时ehartford还表示,其希望该公司在模型被大量使用之前考虑重命名张量以符合LLaMA架构,并将这一更改应用到官方模型中。
零一万物开源团队总监Richard Lin昨天承认,修改Llama张量名的做法不妥,将会按照外界建议把“修改后的张量名称从Yi改回LLaMA”。
Richard Lin表示,出现这一问题主要是由于开发人员疏忽导致,开发人员为了满足测试要求,在代码中进行了几次重命名,但是后面忘记将张量名称修改回LLaMA了。
不过另一名开发者JosephusCheung则表示,既然官方已经宣布修改Yi大模型张量名称,那么Yi便是LLaMA的衍生作品,因为其推理部分和模型定义都是“LLaMA”的一部分。
目前Richard Lin暂未对此进行回复。