斯坦福团队不要脸,竟然抄袭清华的AI模型
怪事年年有,今年特别多,不是说美国才是AI人工智能的大本营吗?不是说斯坦福大学是世界最好的大学之一吗?结果最近曝光的一件事颇有点倒反天罡的感觉。
根据国内外一些技术社区这两天陆续透露的信息来看,斯坦福大学的某AI研究团队偷偷抄袭了清华大学和面壁智能公司开发的一个多模态模型“MiniCPM-Llama3-V 2.5”。
其实MiniCPM系列是面壁智能推出的开源端侧模型,既然开源,那就允许别人用,然而斯坦福这个团队非常恶劣,他们推出的Llama3-V表面上宣传成自己开发的产品,然而却是1:1将清华大学和面壁智能联合研发的MiniCPM-Llama3-V 2.5完全复制了。
面壁智能公司特意对两个模型做了测试,结果证实两者没有任何不同,从代码到案例处理,不是几乎,而是完全一模一样,连错误案例都是如此。最可恶的是该团队通过抄袭,间接的窃取了清华大学尚未对外公开的“清华简”识别能力。
清华简可是我国近几十年来最重要的考古发现之一,这些来自于战国中晚期的竹简记载了许多颠覆传统历史认知的一手记载:比如周幽王烽火戏诸侯的故事已经基本确认是虚构的,目前流传的《尚书》基本确定是后世伪造的,以及记载了全世界第一种十进制计算器等等。
但是清华简因为源自于战国时期的楚国文字,加上长时间的腐蚀,还有大部分内容没有破译和识别清楚,那么负责这项工作的就是清华大学团队,而面壁智能公司也一同参与了用AI人工智能技术协助破译和识别的工作。
面壁公司CEO李大海的回应
然而斯坦福团队竟然连这些也都顺手牵羊拿过来,根据《财经网》的说法,“文字数据为研究团队花费数月从清华简上逐字扫描并人工标注得来,并未对外公开,证实抄袭事实”。所以斯坦福团队的做法真的是令人十分气愤。
如果说斯坦福团队态度上能诚恳道歉也就还能稍微平复大家的怨气,然而该团队至今没有道歉,只是慌忙的将模型和其它信息进行了隐藏,并宣布隐藏不是因为抄袭,而是推理出现了错误,他们要进行修复,还大言不惭地说“我一修好就把它(抄袭的模型)放回去。”
还有一名成员嘴硬回击,说两个模型只是架构相似,并非抄袭,这很快引来围观的技术人员群体声讨,该团队的应对措施很简单,在其相关的帖子和页面将质疑的声音全部删除。
笔者特意查了一下该团队的成员名单,最核心人员从姓名上看基本确定是印度人(名字为Mustafa Aljaddery、Aksh Garg、Siddharth Sharma),不排除其手下有中国人的可能。
该团队6月4日发布的道歉声明,仍然充满诡辩
这很符合我们对硅谷印度团队的“刻板印象”,十分擅长吹牛和制作PPT,真让他们拿出成绩,他们就会采取偷鸡摸狗的行为。
相关阅读