当前位置：

文章详情

LIama 4疑似作弊，都怪Meta把牛皮吹破了

“内卷”从不只是国内互联网大厂的标配，在大洋彼岸的硅谷巨头也一样。上周末，当大家还在享受清明小长假时，Meta突然更新了新一代的LIama 4大模型。而LIama 4最大的变化就在于引入“混合专家架构”（MoE）提升效率，使得其超越DeepSeek-V3，成为了lmsys大模型竞技场中排名第一的开源模型。

LIama 4被疑作弊，都怪Meta把牛皮吹破了

为此Meta方面洋洋得意地表示，“今天是原生多模态AI创新新时代的开始”。然而仅仅36小时之后，Llama 4就迎来了危机。

海外用户在实测之后，用“差评如潮”表达了他们的愤怒，Reddit、Discord的相关频道更是直接变成“吐槽大会”。哪怕不提数学推理、代码生成等任务表现糟糕，即使是Meta在官方文档中吹嘘的行业领先图像理解能力，大量用户也认为Llama 4不如谷歌去年夏季开源的Gemma 2。

甚至还出现了LIama 4在最受关注的大模型竞技场中独占鳌头，可到了各式各样的第三方基准测试中不仅没能名列前茅，反而直接变成了吊车尾。表现如此让人大跌眼镜的情况下，难道LIama 4也是“图片仅供参考”？

LIama 4被疑作弊，都怪Meta把牛皮吹破了

不仅如此，有AI研究人员在社交媒体上表示，Meta提交给LM Arena（著名的人类评估排行榜）进行测试评估的LIama 4 Maverick版本，与公开发布给开发者使用的可能并非同一个版本。同时又有人发现，Meta GenAI团队负责人Ahmad Al-Dahle在推文中透露，Llama 4在lmsys大模型竞技场里运行的是特殊版本。

LIama 4被疑作弊，都怪Meta把牛皮吹破了

紧接着到了北京时间本周一上午，有人在知名的北美留学论坛“一亩三分地”上爆料称，Llama 4的训练不及预期，公司领导层提出在训练后期将基准测试的测试集数据混入训练数据中，以此实现更漂亮的基准测试成绩。

LIama 4被疑作弊，都怪Meta把牛皮吹破了

事实上，大模型在基准测试中作弊已经不是什么新鲜事，比如各路大模型在GSM8k和MATH这两个常见的数学基准测试中，动辄就能取得80%以上的超高正确率，其实就是大模型记住了GSM8k和MATH的“题库”，从而导致实际测试中不是推理、而是填答案。

正如"有些事不上秤不到四两重，要是上了秤一千斤都打不住”说的那样，大模型刷题如今确实是业界的潜规则，但要摆在台面上就是另一回事了。要知道，今年年初OpenAI仅仅是因为向FrontierMath基准测试提供资金支持，就被外界指控的其o3模型数学能力惊人的原因是因为“提前看了试卷”。

瓜田李下的行为在AI圈显然不被认可的情况下，更何况Llama 4这种内部吹哨人已经站出来指证。面对LIama 4作弊的指控，Meta的员工也坐不住了，有两位一亩三分地的用户用实名发声，宣称Meta GenAI从未使用基准测试的数据用来训练LIama 4。

当然，即便没有Meta的员工实名否认，这位匿名爆料者也大概率是造谣，因为其爆料中有一个关键信息表明其并非Meta GenAI的成员。这位匿名爆料者在爆料的末尾提及，数天前宣布离职的Meta人工智能研究副总裁Joelle Pineau，也是因为不认同Llama 4而选择离开。

LIama 4被疑作弊，都怪Meta把牛皮吹破了

虽然Joelle Pineau确实是Meta的AI副总裁，可她主管的是基础AI研究团队（Fundamental AI Research，FAIR），可推出LIama 4的却是Meta GenAI。

那么问题就来了，为什么这种谣言会有市场呢？一亩三分地这个华人论坛上的爆料，更是以异乎寻常的速度被翻译到了Reddit上，可见不仅仅是华人信、说英语的美国人同样也信了。

其实这都怪DeepSeek，其DeepSeek-V3和R1模型过于惊艳，使得Meta在开源模型领域的“一哥”地位被动摇。要知道过去两年Meta的股价之所以能一路攀升，“开源模型一哥”这个身份功不可没。

LIama 4被疑作弊，都怪Meta把牛皮吹破了

可DeepSeek的出现就让Meta占领用户心智的进程停滞，所以他们必须要进行反击。如若不然，Meta在GPU、数据中心、电力、水资源等AI基础设施的数百亿美元投入，岂不是打水漂了。所以“开源AI一哥”这个名号，Meta是志在必得。只是想要和能要是两码事，所以Meta或许在LIama 4上也就有了铤而走险的理由。

归根结底，LIama 4的表现差强人意，才是这一系列阴谋论出现的土壤。

【本文图片来自网络】推荐阅读：OPPO Find X8 Ultra评测：更有想法的影像超大杯在拍好照这件事上，OPPO走出了新的方向。比亚迪的双旗舰发布会，这些细节更值得关注刚刚亮相的汉L和唐L，还有这些“分量”绝不算轻的细节。

展开收起

服务软件
话题：服务软件关注

+1 0 0 0

三易生活

作为一头科技媒体，经常跑在热点后面追尾巴，整点儿科普和吐槽什么的。

1159文章| 0爆料| 484粉丝

关注

相关商品推荐

Microsoft 微软 15月微软office365家庭版microsoft365增强版

279元起

看百科去购买

Microsoft 微软 365 家庭版 30月

548元起

看百科去购买

微软支持重装绑 office2021永久激活码2019终身版macoffice软件 Office2021小型企业版for Mac

529元起

看百科去购买

Microsoft 微软 Office 365 个人版

239元起

看百科去购买

Microsoft 微软 365家庭版一年

259元起

看百科去购买

Microsoft 微软 618活动大促中 office永久激活码office2019增强版终身版outlook密钥

349元起

看百科去购买

Microsoft 微软 618活动开始到手15元/月 office365个人版续费新订microsoft365个

249元起

看百科去购买

Microsoft 微软 618活动大券加跨店满减微软 MAC专用办公软件office2019永久版

299元起

看百科去购买

微软在线发多年office365家庭版个人版续费新订microsoft365订阅密钥 Microsoft365 个人版一年密钥-在线直发咚咚聊天窗口领取

239元起

看百科去购买

Microsoft 微软 618一次付款终身使用苹果M1M2办公软件 Office2016小型企业版 MAC专用

159元起

看百科去购买

微软一次买断 office2021永久激活码2019终身版macoffice软件2024 Office2021电子版 Win10/Win11

599元起

看百科去购买

微软在线发 office365个人版microsoft365续费office365拼车共享 Microsoft365个人版一年续订密钥-在线直发咚咚聊天窗口

暂无报价

看百科

猎寻手机信息采集系统1.0 -ZK5000(手机快速点验/手机检查仪)

暂无报价

看百科去购买

统信 UOS桌面操作系统V20/适用于国产型号/官方正版授权/国产专用

暂无报价

看百科

统信uos操作系统V20激活码授权永久激活 ARM架构（一年服务）

580元起

看百科去购买

Microsoft 微软 365/Office 家庭版文档自动保存各设备通用 1年盒装版 6人同享

暂无报价

看百科去购买

0评论

当前文章无评论，是时候发表评论了

提示信息

取消

确认

评论举报

垃圾广告！低俗色情！人身攻击！疑似水军评论！其他有害！

相关文章推荐

京东将推出2千亿出口转内销扶持计划

4月11日，京东宣布推出2000亿出口转内销扶持计划。未来一年内，京东将大规模采购不低于2... 阅读全文

+1 290 155 518
安卓应用开屏广告跳过软件 | GKD（1.10.1）

软件简介：GKD 是一款基于无障碍 + 高级选择器 + 订阅规则的自定义屏幕点击 AP... 阅读全文

+1 40 485 42
网盘特殊版，低调使用！

软件介绍今天给大家带来夸克网盘和1*3网盘的特殊版本，有需要的小伙伴及时收藏！第一款：夸克... 阅读全文

+1 40 502 11
视频播放器 PotPlayer 美化增强版

视频播放器 PotPlayer 美化增强版（1.7.22515.0 / 250402 De... 阅读全文

+1 27 278 12
京东进军外卖遭美团高管炮轰！刘强东回应：不打口水仗产生不了社会价值

快科技4月12日消息，针对美团核心本地商业CEO王莆中的吐槽，刘强东也是第一时间回应。王莆... 阅读全文

+1 33 30 158
免费移动图书馆！超多资源，手机墨水屏平板都能安装，附使用教程

如果手头有开放系统的墨水屏阅读器，或者喜欢用手机、平板看书，博看书苑无疑是一个必装的免费阅... 阅读全文

+1 101 108 15
听说你想用飞牛nas听音乐？正在打听nas音乐播放器哪个好？

飞牛nas上次更新后，打开“飞牛私有云”文件管理，就能播放特定几个格式的音乐。这无疑给轻度... 阅读全文

+1 6 77 38
用AI把微信聊天记录变成可视化报告，酷到封神。

我之前拉了一个AI自媒体的群，就...同行交流，互相学习。很快就500人了，然后里面这群人... 阅读全文

+1 12 100 9
咸鱼虽好也要注意防风险

咸鱼是个好东西，可以淘到很多性价比很高的好东西。但咸鱼也是个鱼龙混杂的地方。经验值略低的小... 阅读全文

+1 85 18 0
AI加持，消费体验大升级

在数字化浪潮中，AI技术已深度融入消费领域，成为提升消费者信任感和满意度的关键力量。智能... 阅读全文

+1 90 8 2
激励潜力作者的计划:破茧计划

文字创作正经历从个体劳动向生态化协作的转型。为激发创作市场的源头活水，"破茧... 阅读全文

+1 74 14 1
刘强东近照曝光！和李斌一起吃京东外卖

快科技4月9日消息，今日，蔚来创始人李斌在微博上晒出和京东刘强东的合影，二人一同在京东总部... 阅读全文

+1 12 15 57
斩获 3W 星！最近爆火的 MCP 一网打尽。

如果你关注 AI 领域，最近肯定经常听到MCP这个词。这是个啥呢？照本宣科：MCP 是Mo... 阅读全文

+1 6 72 2
网易开源的一款TTS神器，2000种声音随意切换！

语音合成技术现已广泛应用于语音克隆、语音助手、配音服务、有声读物等领域，但如何让合成语音更... 阅读全文

+1 5 71 1
保姆级教程：群晖NAS玩转下载神器！三套方案部署qBittorrent

方案一：套件中心安装（小白首选）步骤1 安装qBittorrent套件打开群晖套件中心，搜... 阅读全文

+1 11 46 14
放心消费AI赋能大赛：我的成长与收获

参加“放心消费AI赋能大赛”不仅是一次技术挑战，更是一段充满启发的学习旅程。从赛前准备到项... 阅读全文

+1 52 13 0
【全网首发】玩客云彻底输了！网心云刷CasaOS装HA，省电更省心

来来咯，我又来咯。今天是对网心云OEC进行刷机，刷入armbian后刷CASAOS然后安装... 阅读全文

+1 7 45 7
放心消费AI赋能：AI为食品安全检测带来的革新

前段时间，家里老人在小超市买了盒牛奶，回家才发现已经过期好几天了。这件事让我格外关注食品安... 阅读全文

+1 55 7 0
虚拟发货陷阱与交易安全四重锁

在闲鱼二手江湖，每分钟就有3.7人掉进新式骗局！实测血泪经验+反诈中心数据，奉上保姆级避险... 阅读全文

+1 51 10 0
激励潜力作者的计划

在信息爆炸的时代，优质内容创作者是文化生态的核心驱动力。如何系统性激发作者的创作潜力？需要... 阅读全文

+1 47 14 0

更多精彩文章

网易云音乐用户增长策略

以下是一篇关于网易云音乐用户增长策略的文章：《网易云音乐用户增长策略解析》网易云音乐作... 阅读全文

+1 0 0 0
比Windows系统内置的快10倍！论好用还得是第三方开源外挂

开始之前先问大家一个问题有多少小伙伴尝试过微软家的手机互联功能呢？莫理以前就用过，当时给... 阅读全文

+1 1 1 0
电子教鞭PointerStick：让课堂视线不再迷失的隐形助手

在数字化教学场景中，一个常见的痛点逐渐浮出水面：无论是线下大屏演示还是线上直播授课，传统的... 阅读全文

+1 0 0 0
逆天黑科技！这5款AI工具让论文查重率从89%降到3%，怎么做到的？

在学术写作和内容创作领域，查重率一直是让人头疼的问题。尤其是面对严格的学术规范和查重要求，... 阅读全文

+1 0 0 0
让你的飞牛OS支持网络唤醒（WOL）功能

飞牛OS支持网络唤醒（WOL）功能，可以通过以下步骤进行设置：1.安装 ethtool 工... 阅读全文

+1 0 0 0
北京小程序搭建公司怎么选？2025版最新小程序搭建公司品牌榜

在选择北京小程序开发公司时，你是不是也感到眼花缭乱，无从下手？别担心，今天我们就来聊聊这个... 阅读全文

+1 0 0 0
北京网站建设公司选择指南，2025版精选网站搭建公司服务商榜

在当今数字化时代，拥有一个专业且高效的网站已成为企业线上展示的标配。面对市场上众多的北京网... 阅读全文

+1 0 0 0
美团出手！五项举措支持外贸企业开拓国内市场

快科技4月13日消息，近日，商务部加大力度推进内外贸一体化，帮助外贸企业开拓国内市场，并指... 阅读全文

+1 0 0 0
越来越多国家加入！法国网友自发组抵制美货消费者群：开始抵制可口可乐和麦当劳等

4月13日消息，据国外媒体报道称，随着美国关税大棒挥向全球，一些国家和地区的用户开始自发的... 阅读全文

+1 0 0 0
AI 护航：消费者信息安全的新护盾与实用招

在当下，咱们日常消费基本都离不开网络，从网购到移动支付，可这也带来个大问题，信息安全咋保障... 阅读全文

+1 8 4 0
一种解决NT不能下载部分种子的方法

1.问题引入前些时部署了 NT 2.9.1，就随手订阅了几个动画。按理来说每次新出一集动画... 阅读全文

+1 1 0 0
特殊定制版，太给力了！

今天给大家分享一款超棒的免费录屏软件，真的是录屏的好帮手！这款软件功能可以录制 MP4、A... 阅读全文

+1 0 0 0
AI不是来抢饭碗的！马云这次发声，终于明白啥是“人间烟火”了

自从AI时代来临之后，外界对于AI最大的质疑就在于——是否会取代人类。有专家称，AI将会或... 阅读全文

+1 3 12 23
告别在线卡顿！这款开源工具让β 站视频离线观看（附8K下载教程）

最近有粉丝反应在β~站学习Python教程时，发现一个特别棒的教学视频，想下载保存反复观看... 阅读全文

+1 1 3 0
论文降重新选择！5款免费AIGC降重工具实测推荐

在学术写作中，利用 AIGC 工具辅助创作后，如何降低 AIGC 率成为关键。以下是 5... 阅读全文

+1 0 0 0
光影魔术手单文件版

光影魔术手单文件版一款非常老牌的图片编辑工具，至今马上都要有20年了。支持图片裁剪、拼接... 阅读全文

+1 0 1 0
两款AI图片处理神器，让你效率狂飙！

今天要给大家分享两款特别实用的软件，一个是抠图，一个是无损放大，都已经激//活，永久可用，... 阅读全文

+1 2 0 0
超越网页版！这款工具让D~Y视频下载变得如此简单（附详细教程）

如果你是一名短视频创作者，经常需要收集和分析同行的优质作品。但每次在D~Y上看到好的视频创... 阅读全文

+1 4 11 0
nvm下载安装教程

nvm介绍nvm 官网地址：https://nvm.uihtm.comnvm 是一个 no... 阅读全文

+1 0 0 0
如何注册网站域名和购买虚拟主机

如何注册网站域名和购买虚拟主机？想要在互联网上立足，拥有一个属于自己的网站是必不可少的。... 阅读全文

+1 0 0 0