Nothing Special   »   [go: up one dir, main page]

晚了一步的天才:比DeepSeek更强,却因发布时机成为配角

2025-03-07 18:44:35 19点赞 90收藏 53评论

就在前天,阿里云Qwen团队推出了QwQ-32B人工智能模型,虽然关注的人不多,但我经过简单使用后可以断定,在大模型领域这是一次不弱于DeepSeek R1的进步。

这个模型可以说是AI世界的袖珍选手——只有320亿参数,却能在多项测试中与那些"大块头"模型一较高下。比如,它与拥有671B参数的DeepSeek R1相比,不仅不落下风,有时还略胜一筹。一个轻量级选手击败了重量级冠军,让人不得不刮目相看。

晚了一步的天才:比DeepSeek更强,却因发布时机成为配角

QwQ-32B有什么特别之处?

QwQ-32B的秘密武器是它的训练方法。Qwen团队没有简单地堆砌更多参数,而是采用了一种叫"大规模强化学习"的方法。这有点像教孩子学习:不是给孩子塞更多的书本,而是教会孩子如何思考、提问和反思。

具体来说,QwQ-32B基于Qwen2.5-32B模型,通过特殊的训练让它学会了"思考"。研究人员发现,当给模型足够的时间去思考问题、质疑自己的答案、反思解题过程时,它解决数学和编程问题的能力会大幅提升。这就像人类解决复杂问题时,不是靠死记硬背,而是通过分析、推理来找到答案。

与其他模型相比怎么样?

根据阿里云的测试数据,QwQ-32B的表现相当亮眼:

在LiveBench评分中得了72.5分,超过了DeepSeek R1的70分

在AIME24数学测试和LiveCodeBench编程测试中,它的表现与DeepSeek R1不相上下

在一些通用能力测试中,QwQ-32B还略占上风

最关键的是,QwQ-32B的计算成本相比DeepSeek R1再次降低到了十分之一——前者只需0.25美元,后者则需2.5美元。

QwQ-32B的成功再次证明了,AI发展不一定要走"参数越多越好"的路线,通过更聪明的训练方法也能达到甚至超越大模型的效果。它与其他几款知名模型如DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini以及原始DeepSeek-R1相比,在多项任务上都表现得不分伯仲。

普通人能用上吗?

QwQ-32B的一大优势是它对硬件的要求相对较低。与那些需要超级计算机才能运行的庞然大物不同,QwQ-32B对普通开发者更加友好。实际测试表明,只需要18G以上显存的GPU就能成功运行这个模型。使用CPU运行也只需要有32G内存。这意味着,QwQ模型甚至可以在一些高端消费级GPU上运行,大大降低了使用门槛。

实际用起来怎么样?

QwQ-32B在解决复杂问题时表现出色,特别是在需要深度思考的任务上。比如解答数学题时,它不仅能给出答案,还能展示完整的推理过程,让你看懂它是怎么一步步得出结论的。

不过,和所有AI模型一样,QwQ-32B也不是完美的。有时它也会"说胡话"(技术上称为"幻觉"),不过相比DeepSeek有所提升。这是目前所有大语言模型都面临的共同挑战,也是几乎无法消除的,只能通过优化算法尽量减少幻觉的提升,

与一些DeepSeek R1模型类似,QwQ-32B能够把它的思考过程完整地展示出来,让你能看到它的思路。这一点再次吊打openai。

晚了一步的天才:比DeepSeek更强,却因发布时机成为配角晚了一步的天才:比DeepSeek更强,却因发布时机成为配角

这意味着什么?

QwQ-32B的出现标志着AI技术发展的一个新阶段。它告诉我们,通过更聪明的训练方法和算法优化,我们可以创造出更高效的AI系统,而不必一味追求更大的参数量。 随着DeepSeek R1和QwQ-32B等模型的突破,国内AI技术正在国际舞台上崭露头角。

QwQ-32B模型的开源发布,可能做不到让更多人能够接触和使用先进的AI技术。但是无论如何这是一次了不起的技术进步,唯一的遗憾就是发布比DeepSeek晚了几个月吧。

作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~

展开 收起

Microsoft 微软 15月 微软office365家庭版microsoft365增强版

Microsoft 微软 15月 微软office365家庭版microsoft365增强版

279元起

Microsoft 微软 365 家庭版 30月

Microsoft 微软 365 家庭版 30月

548元起

微软支持重装绑 office2021永久激活码2019终身版macoffice软件 Office2021小型企业版for Mac

微软支持重装绑 office2021永久激活码2019终身版macoffice软件 Office2021小型企业版for Mac

529元起

Microsoft 微软 618活动大促中 office永久激活码office2019增强版终身版outlook密钥

Microsoft 微软 618活动大促中 office永久激活码office2019增强版终身版outlook密钥

349元起

Microsoft 微软 Office 365 个人版

Microsoft 微软 Office 365 个人版

239元起

微软在线发 多年office365家庭版个人版续费新订microsoft365订阅密钥 Microsoft365 个人版 一年 密钥-在线直发咚咚聊天窗口领取

微软在线发 多年office365家庭版个人版续费新订microsoft365订阅密钥 Microsoft365 个人版 一年 密钥-在线直发咚咚聊天窗口领取

239元起

Microsoft 微软 365家庭版一年

Microsoft 微软 365家庭版一年

259元起

Microsoft 微软 618活动大券加跨店满减 微软 MAC专用办公软件office2019永久版

Microsoft 微软 618活动大券加跨店满减 微软 MAC专用办公软件office2019永久版

299元起

Microsoft 微软 618活动开始到手15元/月 office365个人版续费新订microsoft365个

Microsoft 微软 618活动开始到手15元/月 office365个人版续费新订microsoft365个

249元起

Microsoft 微软 618一次付款终身使用苹果M1M2办公软件 Office2016小型企业版 MAC专用

Microsoft 微软 618一次付款终身使用苹果M1M2办公软件 Office2016小型企业版 MAC专用

159元起

微软在线发 office365个人版microsoft365续费office365拼车共享 Microsoft365个人版一年续订 密钥-在线直发咚咚聊天窗口

微软在线发 office365个人版microsoft365续费office365拼车共享 Microsoft365个人版一年续订 密钥-在线直发咚咚聊天窗口

暂无报价

猎寻 手机信息采集系统1.0 -ZK5000(手机快速点验/手机检查仪)

猎寻 手机信息采集系统1.0 -ZK5000(手机快速点验/手机检查仪)

暂无报价

Microsoft 微软 365/Office 家庭版 文档自动保存 各设备通用 1年盒装版 6人同享

Microsoft 微软 365/Office 家庭版 文档自动保存 各设备通用 1年盒装版 6人同享

329元起

深信服科技(SANGFOR)终端管理系统 (aES)

深信服科技(SANGFOR)终端管理系统 (aES)

300元起

统信 UOS桌面操作系统V20/适用于国产型号/官方正版授权/国产专用

统信 UOS桌面操作系统V20/适用于国产型号/官方正版授权/国产专用

暂无报价

微软一次买断 office2021永久激活码2019终身版macoffice软件2024 Office2021电子版 Win10/Win11

微软一次买断 office2021永久激活码2019终身版macoffice软件2024 Office2021电子版 Win10/Win11

599元起
53评论

  • 精彩
  • 最新
  • ds主要开源让普通个人用户免费试用,在此之前的ai都是收费模式,就算免费也仅限每日许可使用几条十几条。

    校验提示文案

    提交
    并不是,之前国产ai都免费

    校验提示文案

    提交
    用几次就要收费。而阿里的百分之百会收费。就去年阿里云盘那个鸟样。说的永不限速。

    校验提示文案

    提交
    还有6条回复
    收起所有回复
  • 这就是典型的“吃最后一个馒头就够了”,没有DS证明了大模型不止力大飞砖一条路,你看国产大模型会走这个方向吗? [邪恶]

    校验提示文案

    提交
    增大参数量的路已经走到头了,必然会往这个方向发展

    校验提示文案

    提交
    收起所有回复
  • QWQ也真可爱hhh

    校验提示文案

    提交
    我怀疑是故意的 [傻笑]

    校验提示文案

    提交
    就是故意的,千问还有个 QVQ 模型 [脸红]

    校验提示文案

    提交
    收起所有回复
  • 说错了,强化学习不是教方法,而且用奖励机制教应试套路。

    校验提示文案

    提交
    个人理解不同吧,我尽量用简单易懂的方式说明

    校验提示文案

    提交
    收起所有回复
  • 日期都能搞错的ai 你们敢用吗

    校验提示文案

    提交
    因为没人告诉他日期 [苦恼]

    校验提示文案

    提交
    要加联网功能

    校验提示文案

    提交
    还有1条回复
    收起所有回复
  • 已经在mac上跑起来了,本地用真不错

    校验提示文案

    提交
    太强了,去年这个时候我还在幻想假如本地ai能有gpt3.5水平就好了 [喜极而泣]

    校验提示文案

    提交
    前天也用了,本地部署了,m4 pro 48g融合内存,跑起来有点慢。

    校验提示文案

    提交
    还有1条回复
    收起所有回复
  • 运行配置怎样

    校验提示文案

    提交
    我用的白嫖魔塔服务器大概2tokens每秒,可以开十个一起勉强够用

    校验提示文案

    提交
    收起所有回复
  • 如何对比模型性能的? 全凭主观感觉吗?

    校验提示文案

    提交
    是的,我测试就是用它来写一天工作代码,哪个更能带来效率提升我就认哪个

    校验提示文案

    提交
    收起所有回复
  • 不知好用,而且最新的是qwen2.5max吧

    校验提示文案

    提交
    不是,是这个

    校验提示文案

    提交
    收起所有回复
  • 本地部署真香

    校验提示文案

    提交
    确实

    校验提示文案

    提交
    收起所有回复
  • 没有APP吗?

    校验提示文案

    提交
    不清楚,app的话都差不多没必要单独体验这一个。通义千文可能有

    校验提示文案

    提交
    收起所有回复
  • 感觉qwq还是差一点,32b倒是确实有优势

    校验提示文案

    提交
    主要是性能要求太低了

    校验提示文案

    提交
    收起所有回复
  • 搞这些不如用ima或者大模型知识引擎。前者个人用,后者企业用。省事多了。

    校验提示文案

    提交
    你的大模型知识引擎用哪个大模型 [尴尬]

    校验提示文案

    提交
    收起所有回复
  • 链接在哪里?

    校验提示文案

    提交
    百度通义千问

    校验提示文案

    提交
    收起所有回复
  • 4090是不是就能本地部署了?

    校验提示文案

    提交
    是的

    校验提示文案

    提交
    收起所有回复
  • 这个不行,很多问题,实测了。

    校验提示文案

    提交
  • 这模型话痨

    校验提示文案

    提交
  • 其实一般,思考过程相当啰嗦,同样的利率计算问题,gpt思考了十几秒,deepseek思考了两分钟,这个思考了将近5分钟,最后得出了错误结果…

    校验提示文案

    提交
  • 亲测 3060跑不动!

    校验提示文案

    提交
  • 写故事不行,酒馆用不了

    校验提示文案

    提交
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
天猫超级红包
距结束::
现金红包天天领,最高8888元
红包按钮
最新文章 热门文章
90
扫一下,分享更方便,购买更轻松