阿里发布 Qwen3Max 性能超 GPT5,全球前三 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dudaming
V2EX    问与答

阿里发布 Qwen3Max 性能超 GPT5,全球前三

  dudaming 15 天前 4483 次点击

刚看新闻,这是真的吗,突然这么厉害 https://t.cj.sina.com.cn/articles/view/1642634100/61e89b7404001jrie

39 条回复    2025-09-28 19:44:54 +08:00
dudaming
    1
dudaming  
OP
   15 天前
有没有了解的大佬说说,还是很震惊的
thedog
    2
thedog  
   15 天前
真假都有可能。阿里应该是有这个实力的。不过阿里的 pr 味道很重,也不知道实际测试什么水平。等真出来了,测测就知道了。
NoobNoob030
    3
NoobNoob030  
   15 天前
大概率是真的
dynastysea
    4
dynastysea  
   15 天前
平时日常用 qwen ,gpt5 也用,技术方面 qwen 优势明显,很多技术问题,gpt5 都说的很浅
xing7673
    5
xing7673  
   15 天前
chat 页面上选 qwen3-Max 不支持深度思考,实测的感觉和 instant 模型差不多。

不知道哪里可以有 thinking 的版本去测试一下
Meteora626
    6
Meteora626  
   15 天前
是 gpt5 太让人失望了,4-5 完全没有体现出实力。Qwen3Max 把参数堆到 t 级 出成果也不意外,看看之前 k2 就是粗暴堆 ds 架构再训练都很不错
knva
    7
knva  
   15 天前
阿里大模型还是没问题的,qwen image 和 wan2.2 都很棒
coefu
    8
coefu  
   15 天前
从 1000 到 10000 的提升,恰恰是我方最擅长的,毋庸置疑。
fs418082760
    9
fs418082760  
   15 天前
中文的 AI 能力害得靠中文训练出来的模型才精准。
Skifary
    10
Skifary  
   15 天前
前三是哪三家
1una
    11
1una  
   15 天前
@Meteora626 堆参数也不是谁都能堆的,还记得 2T 参数的 Llama 4 Behemoth 么?一直延期到现在还没发布
maolon
    12
maolon  
   15 天前
你超了哪个 gpt5 呢?超了 low, medium 还是 high ?这个三个 thinking effort 可是性能天差地别
全球第三是 chatbot arena 这个现在基本没有参考性的榜
我不是说 qwen 不行,不如说我一直都在吹 qwen, 但是阿里的稿子还是看看就好
Parva
    13
Parva  
   15 天前   4
同楼上,现在哪家新发一个模型 媒体都是吹得天花乱坠。最后发现还得是 chatgpt+claude
Rickkkkkkk
    14
Rickkkkkkk  
   15 天前
我搜索 chatgpt 链接点开就能用;我搜索 Qwen3Max ,请问?
hellodigua
    15
hellodigua  
   15 天前
woc ,看了标题去试了一下 qwen3-max ,效果真的可以
Revenant
    16
Revenant  
   15 天前
最新版本还没体验过,不过之前版本的 qwen 是 Benchmark 战神,基准没输过,实战没赢过,实际体验连 DSv3 都干不过
june4
    17
june4  
   15 天前
@Rickkkkkkk 能上 v2 就别用百度了,官网不是能用吗? https://chat.qwen.ai/
stinkytofux
    18
stinkytofux  
   15 天前
@Rickkkkkkk #14 阿里云百炼上不就有么, 我看到这个帖子就找到了, 还免费. 你不熟是因为你平时不用.

https://bailian.console.aliyun.com
Rickkkkkkk
    19
Rickkkkkkk  
   15 天前
@june4 你用 google 搜索 Qwen3Max 可以看看前几个结果是啥
MoozLee
    20
MoozLee  
   15 天前
之前的版本,实际使用下一用一个不吱声。
AutumnVerse
    21
AutumnVerse  
   15 天前 via iPhone
以前每次有新模型问世,我都会去尝试一番,现在已经没那个兴趣了,还是 gpt 吧。个个发布会都吹得震天响,真正干活还得 gpt
june4
    22
june4  
   15 天前
@Rickkkkkkk 第一个就是模型的官方发行文档页啊,里面详细介绍了这个模型,以及去哪里用(注明了官方网站版网址和 api 方式用法)
pGiG2vI1165eY8KI
    23
pGiG2vI1165eY8KI  
   15 天前
Qwen3 相关模型是真强,用了有一段时间了。
Seck
    24
Seck  
   15 天前 via Android
哦,我说一下使用感受
比没上线之前,反正实际效果是好的,这一点毋庸置疑
就是你经常用阿里 qwen 的话,可以明显体验出来,没上 max 和上 max 过后,有个明显不一样

但是我不用啊,我只是会在前两名 gemini 以及 GPT5 回答问题实在回答不出来,这个再换一个

互联网效应,人人都愿意用 top one, top 2 没人记住,何况你这是 top3 ,更没人用
Seck
    25
Seck  
   15 天前 via Android
@AutumnVerse 现在的大模型加入了用户个性化,同一个问题,不同的用户问,也会回答不同的内容。
你用得越多,越了解你,你越离不开。

这就是为什么无论你发什么模型,我就用 GPT5♂♂
clarkethan
    26
clarkethan  
   15 天前
@Meteora626 建议多体验下 GPT-5 的 thinking 或者 pro 模型再下这个结论
pxlxh
    27
pxlxh  
   15 天前 via iPhone
前面几楼一股怪味儿
fivee
    28
fivee  
   15 天前
@Rickkkkkkk 你都知道搜 chatgpt 了,都不知道搜 qwen 吗
byby
    29
byby  
   15 天前
纸面上没输过,体验上没赢过
gpt5
    30
gpt5  
   4 天前
又是蒸煮 gpt
gechang
    31
gechang  
   14 天前
老板买了 GPT plus 用着还行啊,很多问题一针见血,一条回答就能解决了,其他 AI 得反复问,给报错结果啥的
lizy0329
    32
lizy0329  
   14 天前
先把 循环思考卡死 修复了,再谈其他的吧
zhouu
    33
zhouu  
   14 天前
@xing7673 因为 thinking 版本还在训练,发布的就是指令型模型
Dawnnnnnn
    34
Dawnnnnnn  
   14 天前
你就用吧,一用一个不吱声。
ludan110
    35
ludan110  
   14 天前
cluade chatgpt 应该是公认的前 2 qwen 都超了这两个的 只写前三太保守了
donglinjieshi
    36
donglinjieshi  
   14 天前
我还是喜欢 Grok
xing7673
    37
xing7673  
   14 天前
@zhouu 可以,期待 thinking 的
mscsky
    38
mscsky  
   14 天前
国产也就跑分在赢,文字处理不如 gemini 一毛
vevlins
    39
vevlins  
   11 天前
实测对我来说,Gemini 2.5 pro 是地表最强模型,回答问题不仅很深刻,而且思维非常流畅。同样的问题对比了一下,没感觉 Qwen3 Max 有任何优势。
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3132 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 22ms UTC 00:34 PVG 08:34 LAX 17:34 JFK 20:34
Do have faith in what you're doing.
ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86