斯坦福AI团队承诺撤下相关模型
近日,斯坦福大学AI团队开发的Llama3-V开源模型被指涉嫌抄袭清华大学与面壁智能合作的开源项目“小钢炮”MiniCPM-Llama3-V 2.5,此事件迅速在网络上引发了广泛讨论。对此,斯坦福团队的两名成员Siddharth Sharma和Aksh Garg通过社交媒体向面壁MiniCPM团队公开道歉,承认未能充分验证模型的原创性,并宣布将立即撤下Llama3-V模型。斯坦福AI团队承诺撤下相关模型。
斯坦福人工智能实验室负责人Christopher David Manning也发声批评这一抄袭行为,并对手中MiniCPM模型给予正面评价。
争议起因于斯坦福AI团队宣称以低廉成本训练出超越GPT-4V的先进多模态大模型。网友仔细比对后发现,Llama3-V模型在结构和代码上与MiniCPM-Llama3-V 2.5高度相似,仅做了少量变量名调整,甚至包含对方特有的分词器设置及未公开的“清华简”古文字数据识别功能,进一步证实了抄袭指控。
面壁智能CEO李大海对事件表示遗憾,既感欣慰于团队成果获得国际认可,也强调应构建一个开放互信的协作环境。面壁智能首席科学家、清华大学副教授刘知远指出,人工智能领域的进步依赖于全球范围内的开源共享精神,Llama3-V团队的行为违背了这一原则,尽管他们已开始采取补救措施,包括从平台移除相关模型。他呼吁业界保持对开源贡献的尊重。
面壁智能自2022年成立以来,发展迅速,近期完成了数亿元融资,并在大模型技术端侧应用方面取得进展,MiniCPM系列的推出正是其成果体现。李大海强调,推动大模型技术在终端的实际应用是公司当前的工作重点。