家人们,国际AI领域爆出来一个惊天大瓜:斯坦福大学的AI团队推出的Llama3-V项目被指控抄袭中国国产大模型MiniCPM-Llama3-V 2.5。这一事件在社交媒体和AI领域引起了广泛的关注和讨论。
一、事件回顾
斯坦福大学的AI团队推出的Llama3-V项目,宣称只需500美元就能训练出一个超越GPT-4V的SOTA多模态大模型,而且比Gemini Ultra、GPT-4V、Claude Opus都强大。这个团成员,凭借斯坦福大学的显赫背景以及与特斯拉、SpaceX等知名企业的关联,使得该项目在短短几天内便吸引了众多目光。
然而,事情的发展逐渐变得戏剧化。
一位细心的网友突然意识到,这个模型的“配方”似乎有些似曾相识。经过仔细对比,他惊讶地发现,这竟然与MiniCPM-Llama3-V 2.5(由清华系明星创业公司面壁智能开发)如出一辙。这位网友随即前往面壁智能的GitHub项目页面,留下了这样的揭露信息:
“你们的大模型被斯坦福团队抄袭了!”
模型结构、代码还有配置文件,完全一模一样,只是变量名变了以下! 这真实惊呆了老铁啊!
这位网友之所以选择在面壁智能的GitHub项目下留言,是因为他之前已经在Llama3-V的项目页面上尝试联系过作者,但是斯坦福团队的反应却是直接删除了整个项目并逃离了现场。
确实,如今无论是GitHub还是HuggingFace,相关的Llama3-V项目页面都显示着404错误,无法访问。
抄袭揭露详情地址:
地址:https://github.com/OpenBMB/MiniCPM-V/issues/196 (需要梯子)
然而,这个项目被指控抄袭了由中国清华系明星创业公司面壁智能开发的MiniCPM-Llama3-V 2.5模型。两者的模型结构和代码几乎完全相同,只是变量名有所变化。
二、道歉与撤下
面对抄袭的指控,斯坦福团队选择了在GitHub和HuggingFace上删除相关项目,显示出404错误,无法访问。随后,斯坦福Llama3-V团队的两位作者Siddharth Sharma和Aksh Garg在社交平台上向面壁MiniCPM团队正式道歉,并表示会撤下Llama3-V模型。他们承认使用了MiniCPM-Llama3-V 2.5的tokenizer,并声称他们的工作早于面壁智能的MiniCPM,但并未意识到OpenBMB(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。面对抄袭指控,斯坦福团队选择删除相关项目,而面壁智能CEO李大海要求Llama3-V作者给出正式解释。此事仍在持续发酵中。
三、国际关注与影响
斯坦福人工智能实验室主任Christopher David Manning也发文谴责这一抄袭行为,并对MiniCPM这一中国开源模型表示赞扬。这一事件在国际AI领域引起了广泛关注,特别是关于开源社区的共同利益和尊重他人成果的重要性。同时,这一事件也凸显了中国在AI领域的研究实力和国际影响力。
斯坦福AI团队抄袭风波,不仅引发了国际AI领域的广泛关注,也展现了中国国产大模型MiniCPM在国际舞台上的影响力。这一事件提醒我们,尊重他人的成果是科研工作的基本准则,同时也凸显了中国在AI领域的研究实力和国际地位。
AITOP100平台资讯专区: https://www.aitop100.cn/infomation/index.html