斯坦福抄袭清华，世界一流大学实锤了-足球网站

您的当前位置：乐购汽车 > 热点 >

斯坦福抄袭清华，世界一流大学实锤了

2024-06-06 15:05编辑：sh-ad来源：投资界阅读量：14485

最近 ai 圈里又闹出一个大新闻，《斯坦福团队抄袭中国 ai！》

估计刚看到这个标题，很多人跟世超一样都蒙了。啊？是不是看花眼了？

哪个斯坦福？确定没搞反？

您猜怎么着，这还真就是 qs 排名前五的那个美国斯坦福。

别说国内网友，业内大佬也绷不住，直呼时代变了。

确切的说，应该是斯坦福的一个本科生团队，抄了清华博士创业公司的产品，也就是面壁智能的开源模型:minicpm-llama3-v 2.5 小钢炮。

事儿要从 5 月 29 号说起。

这天有两个斯坦福的印度年轻人，一个还跟佛祖同名，在世界上* ai 开源社区—— huggingface上发布了他们的大模型 llama-3-v 。

看着他们光鲜亮丽的实习简历，又是特斯拉又是 spacex 的，很快，网友们就把这个号称“500刀就能练成比肩 gpt-4v 、 gemini ultra”的后起之秀，顶上了 huggingface 足球分析首页，推文浏览量也超过 30万。

刚开始可能还有人觉着:我大美利坚江山代有才人出啊，你看看，本科生就能做出比肩大厂的成绩，什么叫世界一流啊～

之所以人家一眼丁真鉴定为抄，主要是它宣称的体积小、性能强、多模态的特点，很难不让人把它和清华的 minicpm 对比。

但他又申明自己是原创的，没引用人家 minicpm 。

不过面对别人的指责，这大学生团队还嘴硬，说 minicpm 是引用了 llava-uhd 的，我们也引的这个，读书人的事，那能叫抄吗？真是装糊涂的天才。

问题是 minicpm 和 llava-uhd 原来的样子早就不一样了，而你这个 llama3-v 的长相跟 llava-uhd 不能说一模一样，至少是毫不相关，但是跟人家小钢炮就像一个妈生的。

等放一块儿仔细一瞅，好家伙，模型结构跟人家像也就算了，配置文件怎么都一模一样。

再一看代码，除了加点格式化，改了几个变量名，别的都毫无区别，甚至人家清华专门定义的特殊符号，你这代码里都没变过。

更搞笑的是，有网友发现运行 llama3-v 时，用斯坦福团队提供的权重文件是跑不起来的，但如果把其中的变量名改为 minicpm-llama3-v 2.5 的，就会丝滑启动。

都锤成这样了，印度老哥还是始终咬死不认。

很快，收到消息的面壁智能官方也下场开锤，表示 llama3-v 项目的作者并不完全理解 minicpm-llama3-v 2.5 的架构，甚至也不理解他们自己的代码。

换句话说，还挺阴阳的，“你抄都没抄明白啊。”

除此之外，面壁团队还甩出一个雷神之锤的证据， llama3-v 居然可以识别清华简！

清华简是清华校友捐赠的重要文物，这些埋藏于战国时代的竹简躲过了秦始皇焚书，保存着包括古本《尚书》、先秦史料、医方哲学等极其珍贵的原始档案，简单来说就是上古版《永乐大典》。

清华简识别其实是 minicpm-llama3-v 2.5 研发时内置的彩蛋，所有训练识别的数据，都是面壁智能和清华大学合作，一个字一个字扫描标注的，从未公开。这些完全私有的数据斯坦福团队不可能拿到，但是两个模型却都能实现识别，甚至犯错的地方都一模一样。

答，删库跑路！

他们马上删掉了 huggingface 上的 llama3-v 模型，并表示:“非常感谢那些在评论中指出与之前研究相似之处的人。我们意识到我们的架构非常类似于openbmb 的 minicpm-llama3-v 2.5 ，他们在实现上比我们抢先一步。我们已经删除了关于作者的原始模型。”

不是，过分了啊，还要点脸不？

然后他们又光速滑跪道歉甩锅三连，说我们哥俩只是宣传推广的，代码都是外包给另一个南加州大学老哥干的，冤枉啊！

但事已经闹大了，丢面儿的斯坦福大学官方也急忙下场，他们的人工智能实验室主任，谷歌 deepmind 的研究员 christopher david manning 直接发文开喷，“典型的不承认自己错误！”

并对 minicpm 这一中国开源模型表示赞扬。

而被抄的面壁智能联合创始人刘知远，则对他们喊话:“团队三人中的两位也只是斯坦福大学本科生，未来还有很长的路，如果知错能改，善莫大焉。”

面壁 ceo 李大海也诙谐回应道:“我们对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式，另一方面呼吁大家共建开放、合作、有信任的社区环境。”

“我们希望团队的好工作被更多人关注与认可，但不是以这种方式。”

话虽这么说，但这次的事确实也让大家注意到，国产 ai 好像也不是刻板印象中那样了。

连开头的大佬，hugging face的负责人omar sanseviero也表示，

“社区一直忽视了中国机器学习生态系统的工作。他们正在用有趣的大语言模型、视觉大模型、音频和扩散模型做一些令人惊奇的事情。”

并提到鹅厂混元大模型，和最近爆火的chattts

拿这次的主角面壁智能来说，虽然各大厂商都在布局移动端大模型，但经过此次事件，大家发现这家中国公司，在这个赛道上也十分出色。

minicpm 不但体量小，只用 2.4b 的数据规模就能达到数倍于它的模型能力，不仅支持安卓系统，还支持鸿蒙，推理做题都毫不逊色。

视觉识别能力也相当不错，特别是中文图像场景下，表现比 chatgpt-4v 更好。

除此之外，面壁官方还在今天中午官宣，「小钢炮」minicpm 决定免费公开！对学术研究完全开放，企业和个人只需填写问卷登记后就允许商用。

什么叫格局啊～

世超觉得，网友们确实也应该改变一些成见。许多人以前都认为，国产 ai 都是套壳 chatgpt , 这不行那不行，感谢 xxx 开源。

然而就像刘知远说的，尽管面对国际*模型仍有差距，但中国大模型已经从以前的 nobody ，成长为了 ai 领域的关键推动者之一。

至于这两个年轻人，希望你们耗子尾汁，不要再耍这样的小聪明。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

加码“以旧换新”，极限放价后一汽-大众双腾更香了
伴随着北京车展的热度，国内汽车消费市场也逐渐企稳回升。据中国汽车流通协会发布的最新汽车消费指数显示，4月汽车消费指数为80.4，同比、环比实现双增长，创今年汽车消费指数新高。为了进...

2024-06-06 14:38
极越汽车ppa智驾覆盖增加124城
6月5日晚，极越汽车宣布，其ppa智驾系统已全面覆盖全国高速高架路段。据介绍，极越ppa智驾新增124座城市城市高速高架。其中，新增100座城市高速路段和24座城市高架路段；p...

2024-06-06 12:26
星途揽月与传祺gs8：谁将领跑豪华suv市场？
在繁华的都市丛林中，豪华suv如同熠熠生辉的明星，以它们独特的气质和无与伦比的性能，淋漓尽致地展现着都市精英的独特生活态度。这些车型不仅仅是交通工具，更是身份与品味的象征。今天，我...

2024-06-06 10:47
贵州“六大产业基地”架起现代化产业体系“四梁八柱”
架起现代化产业体系的“四梁八柱” “六大产业基地”强链聚势离2024年年底首台机组建成并网发电的时间越来越近，盘江普定超超临界燃煤发电项目一号机组主厂房、冷却塔、烟囱等主要建...

2024-06-06 10:23
开启豪华平权时代奇瑞风云t9全球上市
5月21日，新豪华风云t9全球上市发布会在北京中关村国际创新中心盛大启幕。奇瑞风云基于技术向上、品质向上、服务向上、市场向上成果，推出新豪华中大型电混suv——风云t9，并以新车4...

2024-06-06 08:49