为客户维护权益,是我们永远不变的使命!
最近 AI 圈里又闹出一个大新闻,《 斯坦福团队剽窃中国 AI! 》
估量刚看到这个题目,许多人跟世超一样都蒙了。啊?是不是看花眼了?
哪个斯坦福?确定没搞反?
您猜怎么着,这还真就是 QS 排名前五的谁人美国斯坦福。
别说海内网友,业内大佬也绷不住,直呼时代变了。
确切的说,应该是斯坦福的一个本科生团队,抄了清华博士创业公司的产物,也就是面壁智能的开源模子:MiniCPM-Llama3-V 2.5 小钢炮。
事儿要从 5 月 29 号提及。
这天有两个斯坦福的印度年轻人,一个还跟佛祖( Siddharth 悉达多 )同名,在天下上* ai 开源社区—— HuggingFace上宣布了他们的大模子 Llama-3-V 。
看着他们鲜明亮丽的实习简历,又是特斯拉又是 SpaceX 的,很快,网友们就把这个号称 “500 刀就能练成比肩 GPT-4V 、 Gemini Ultra” 的后起之秀,顶上了 HuggingFace 首页,推文浏览量也跨越 30 万。
刚最先可能另有人觉着:我大美利坚山河代有秀士出啊,你看看,本科生就能做出比肩大厂的成就,什么叫天下一流啊~
很快,一些眼尖的业内人士发现纰谬劲了,你这玩意怎么看着跟21 号谁人 MiniCPM 小钢炮差不多,不会是抄的吧,咋不标注泉源?
之以是人家一眼丁真判定为抄,主要是它宣称的体积小、性能强、多模态的特点,很难不让人把它和清华的 MiniCPM 对比。
但他又声名自己是原创的,没引用人家 MiniCPM 。
不外面临别人的指责,这大学生团队还嘴硬,说 MiniCPM 是引用了 LLaVA-UHD 的,我们也引的这个,念书人的事,那能叫抄吗?真是装糊涂的天才。
问题是 MiniCPM 和 LLaVA-UHD 原来的样子早就纷歧样了,而你这个 Llama3-V 的长相跟 LLaVA-UHD 不能说一模一样,至少是绝不相关,然则跟人家小钢炮就像一个妈生的。
等放一块儿仔细一瞅,好家伙,模子结构跟人家像也就算了,设置文件怎么都一模一样。
再一看代码,除了加点花样化,改了几个变量名,其余都毫无区别,甚至人家清华专门界说的特殊符号,你这代码里都没变过。
更搞笑的是,有网友发现运行 Llama3-V 时,用斯坦福团队提供的权重文件(神经网络微挪用的参数 )是跑不起来的,但若是把其中的变量名改为 MiniCPM-Llama3-V 2.5 的,就会丝滑启动。
都锤成这样了,印度老哥照样始终咬死不认。
很快,收到新闻的面壁智能官方也下场开锤,示意 Llama3-V 项目的作者并不完全明白 MiniCPM-Llama3-V 2.5 的架构,甚至也不明白他们自己的代码。
换句话说,还挺阴阳的, “ 你抄都没抄明了啊。 ”
除此之外,面壁团队还甩出一个雷神之锤的证据, Llama3-V 居然可以识别清华简!
清华简是清华校友捐赠的主要文物,这些埋藏于战国时代的竹简躲过了秦始皇焚书,保留着包罗古本《尚书》、先秦史料、医方哲学等极其珍贵的原始档案,简朴来说就是上古版《永乐大典》。
谁在《庆余年2》里赚得最多?
清华简识别实在是 MiniCPM-Llama3-V 2.5 研发时内置的彩蛋,所有训练识其余数据,都是面壁智能和清华大学互助,一个字一个字扫描标注的,从未公然。这些完全私有的数据斯坦福团队不能能拿到,然则两个模子却都能实现识别,甚至犯错的地方都一模一样。
到这,可以说他们剽窃是百分百,板上钉钉的事了。鼓破万人捶,面临全天下网友的唾沫星子,这俩印度哥们怎么做的呢?
答,删库跑路!
他们马上删掉了 HuggingFace 上的 Llama3-V 模子,并示意: “ 异常谢谢那些在谈论中指出与之前研究相似之处的人。我们意识到我们的架构异常类似于OpenBMB 的 MiniCPM-Llama3-V 2.5 ,他们在实现上比我们争先一步。我们已经删除了关于作者的原始模子。 ”
不是,太过了啊,还要点脸不?
然后他们又光速滑跪致歉甩锅三连,说我们哥俩只是宣传推广的,代码都是外包给另一个南加州大学老哥干的,冤枉啊!
但事已经闹大了,丢面儿的斯坦福大学官方也急遽下场,他们的人工智能实验室主任,谷歌 Deepmind 的研究员 Christopher David Manning 直接发文开喷, “ 典型的不认可自己错误! ”
并对 MiniCPM 这一中国开源模子示意赞扬。
而被抄的面壁智能团结首创人刘知远,则对他们喊话:“团队三人中的两位也只是斯坦福大学本科生,未来另有很长的路,若是知错能改,善莫大焉。”
面壁 CEO 李大海也诙谐回应道: “ 我们对这件事深表遗憾。一方面感伤这也是一种受到国际团队认可的方式,另一方面呼吁人人共建开放、互助、有信托的社区环境。 ”
“ 我们希望团队的好事情被更多人关注与认可,但不是以这种方式。 ”
话虽这么说,但这次的事确实也让人人注重到,国产 AI 似乎也不是刻板印象中那样了。
连开头的大佬, Hugging Face 的认真人 Omar Sanseviero 也示意,
“ 社区一直忽视了中国机械学习生态系统的事情。他们正在用有趣的大语言模子、视觉大模子、音频和扩散模子做一些令人惊讶的事情。 ”
并提到鹅厂混元大模子,和最近爆火的 ChatTTS
拿这次的主角面壁智能来说,虽然各大厂商( 上个月谷歌安卓 15 ,过几天苹果 iOS18 )都在结构移动端大模子,但经由此次事宜,人人发现这家中国公司,在这个赛道上也十分精彩。
MiniCPM 不只体量小,只用 2.4B 的数据规模就能到达数倍于它的模子能力,不仅支持安卓系统,还支持鸿蒙,推理做题都绝不逊色。
视觉识别能力也相当不错,稀奇是中文图像场景下,显示比 ChatGPT-4V 更好。
除此之外,面壁官方还在今天中午官宣,「小钢炮」MiniCPM 决议免费公然!对学术研究完全开放,企业和小我私人只需填写问卷挂号后就允许商用。
什么叫名目啊~( 战术后仰 )
世超以为,网友们确实也应该改变一些偏见。许多人以前都以为,国产 AI 都是套壳 ChatGPT , 这不行那不行,谢谢 XXX 开源。
然而就像刘知远说的,只管面临国际*模子仍有差距,但中国大模子已经从以前的 nobody ,发展为了 AI 领域的要害推动者之一。
至于这两个年轻人,希望你们耗子尾汁,不要再耍这样的小伶俐。