事情是这样的,近日,斯坦福ai团队被曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果,模型结构和代码,几乎一模一样。
斯坦福的llama3-v项目在5月29日发布,宣称仅需500美元就能训练出一个性能超越gpt-4v、gemini ultra、claude opus等的多模态大模型。
llama3-v 的 3 位作者或许是拥有名校头衔加持,又有特斯拉、spacex 的大厂相关背景,这个项目短短几天就受到了不小的关注。
然而,一位网友发现,llama3-v的模型结构和代码与出自清华系明星创业公司面壁智能的minicpm-llama3-v 2.5几乎一模一样,只是变量名有所变化。
面对抄袭的指控,斯坦福团队选择了删库跑路,目前在github和huggingface上的相关项目均显示404,无法访问。
面壁智能的minicpm-llama3-v 2.5项目具有独特的功能,如识别清华简一种罕见的中国古代文字。
llama3-v在未公开的实验性特征上与minicpm-llama3-v 2.5表现出高度相似的行为,这些特征是根据minicpm-llama3-v 2.5团队内部数据训练的。
面对抄袭的质疑,斯坦福团队最初辩称,他们的工作早于面壁智能的minicpm,只是使用了他们的tokenizer。
然而,随后他们在medium上的声明被删除,且最新的回应也被撤回。
面壁智能ceo李大海对此事件做出了正式回应,要求llama3-v作者对这个问题给出一个正式的解释,目前,此事仍在持续发酵中。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系澳门最新大白菜网站进行处理。