抛开性价比这个选项,你认为目前写代码最强模型是? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
tlerbao
V2EX    程序员

抛开性价比这个选项,你认为目前写代码最强模型是?

  •  
  •   tlerbao 6 天前 6991 次点击

    答案无疑肯定是在 Codex 和 Claude Sonnet/Opus 中产生。

    为什么要抛开性价比这个选项?

    我发现现在甚至有人还在吹 Deepseek 、GLM 。

    2025 年了,哪吒票房那段时间还没完?年还没过完?

    吹的有两种人(我说的比较难听):

    1. 用不起贵的,强行拉出性价比,所谓的便宜好用。
    2. 爱国,大谈 Claude 敌对势力。

    所以,你认为

    抛开爱国情绪、抛开花费,目前写代码最强模型到底是 Codex 还是 Claude ?

    没深度使用过多家的,没对比过的,只用过某一种的,回答也基本没有什么参考价值。

    79 条回复    2025-10-09 10:10:03 +08:00
    mooyo
        1
    mooyo  
       6 天前 via iPhone   3
    claude-sonnet-4.5
    imjiaoyuan
        2
    imjiaoyuan  
       6 天前 via Android
    claude-sonnet-4.5


    和这个比起来国产的像低能儿
    TimePPT
        3
    TimePPT  
    PRO
       6 天前 via Android   1
    GPT-5 High
    ty29022
        4
    ty29022  
       6 天前 via iPhone   3
    我个人的感觉是 gpt5 像个 cs 科班的大佬
    claude 像个经验丰富的中级程序员 对复杂情况无能为力
    novaren
        5
    novaren  
       6 天前 via Android
    claude 毋容置疑
    facebook47
        6
    facebook47  
       6 天前 via Android   6
    Claude 写代码无敌,另外在这个论坛,头一次听说有人吹 deepseek 的,一拉一踩非常不可取
    spike0100
        7
    spike0100  
       6 天前 via iPhone
    我自己用下来 glm 其实还好。主要差别是 claude sonnect 4.5 一般一次生成的代码直接就可以跑,glm 需要主动提醒一两次才能调好。最终效果感觉差别不大。
    spike0100
        8
    spike0100  
       6 天前 via iPhone
    @spike0100 都是用 claude code + 对应基础模型测的。deepseek 和 qwen3 max 试过跑了 50 ,60 人民币的 token ,结果都没法看。
    takanashisakura
        9
    takanashisakura  
       6 天前   1
    说性能的话毋庸置疑吧。但是在真正用的时候,很难不考虑性价比和可用性吧。
    所以我也没得选,只有 deepseek 和 gemini 。
    xiaojie668329
        10
    xiaojie668329  
       6 天前
    有时候 Gemini 做得比 Claude 好
    raydg7777
        11
    raydg7777  
       6 天前
    还是 Codex
    Alias4ck
        12
    Alias4ck  
       6 天前   1
    吹 glm 的和 deepseek 的 肯定是没吃过细糠
    victor
        13
    victor  
       6 天前   1
    claude 够快所以是主力。但 claude 4.5 写完的功能,codex 还能挑出来一堆毛病。
    skiy
        14
    skiy  
       6 天前   8
    你抛开花费但抛开不了人家不让你用吧?这是不可控因素。刚刚又有 up 说自己被封号了。
    yb2313
        15
    yb2313  
       6 天前
    抛开花费我选同时使用几个顶尖模型,然后每次需求选择最好的一个结果,即使不同时使用也可不断轮换使用对比每个模型擅长领域。
    lithiumii
        16
    lithiumii  
       6 天前 via Android
    可能有一个月没写代码了,之前是用免费的 copilot 里的旧版本 gpt (好像是 4.1 )和 Claude ( 3.5 吧大概)或者用 Aider 调免费的 Gemini 2.5 Pro ,或者付费的 DeepSeek V3 或者 3.1 和 GLM 4.5 (这俩便宜)。
    体感最强是 Gemini 2.5 Pro ,其次相差不远是 DS 和 GLM ,免费 copilot 送的模型是真的不行了。
    haiku
        17
    haiku  
       6 天前 via Android   1
    GPT 5 high
    下个月等 Gemini 3
    streamrx
        18
    streamrx  
       6 天前 via iPhone
    gpt5 high
    zpvip
        19
    zpvip  
       6 天前
    claude-sonnet-4.5
    这个是毒品, 不能碰
    Imindzzz
        20
    Imindzzz  
       6 天前 via Android   14
    你想抛开谈就抛开谈呗,为啥要贬低一下“吹”deepseek...
    mywjyw
        21
    mywjyw  
       6 天前
    cdex cli 做的比 claude code 差,很多功能不全,很难用
    lancevps
        22
    lancevps  
       6 天前
    生成 html 的 UI 设计稿,豆包最强
    sunnysab
        23
    sunnysab  
       6 天前   1
    额,倒也不是爱国情绪,https://www.reddit.com/r/LocalLLaMA/

    reddit 上很多外国人考虑中国的模型,超级积极… qwen 和 glm 评价不错。llama 挨骂较多,openai 被骂的也不少
    Thymolblue
        24
    Thymolblue  
       6 天前
    现在用 GPT-5 和 Claude 有什么渠道吗?直接用 API 都需要组织认证,目前国内身份没法通过
    yyws2012
        25
    yyws2012  
       6 天前 via Android
    @mooyo 都不考虑价格了还 sonnet
    yyws2012
        26
    yyws2012  
       6 天前 via Android
    @skiy 可以买别人转接的,就是 opus 会非常贵,但既然不考虑价格那就是可以的
    ggp1ot2
        27
    ggp1ot2  
       6 天前
    Claude Sonnet 4.5

    没有什么价格不价格的,这个模型可以满足我现在的需求
    mooyo
        28
    mooyo  
       6 天前
    @yyws2012 #25 sonnet 4.5 现在就是比 opus 4.1 好用啊。有又快又好用的为啥要用又慢又垃圾的
    charles0
        29
    charles0  
       6 天前
    GPT-5 high (比 GPT-5-Codex 强很多)
    Bad0Guy
        30
    Bad0Guy  
       6 天前
    cc ,但是封号比 codex 还疯狂,如果 Gemini3 效果比 Claude4.5 好那我会考虑日常转用 Gemini3
    Gekou
        31
    Gekou  
       6 天前
    没用过 claude ,但 claude 肯定不能一次处理 100w 的 token ,10w 行代码
    反驳请给出详细方法谢谢
    plasticman64
        32
    plasticman64  
       6 天前
    claude 会找 bug ,这是我最佩服的一点
    v20220522
        33
    v20220522  
       6 天前
    @charles0 为什么会这样, 能展开讲讲吗?
    lcandy
        34
    lcandy  
       6 天前
    @TimePPT 支持,codex-high 都没 5-high 好用
    agagega
        35
    agagega  
       6 天前 via iPhone   7
    为了那点所谓的优势整天琢磨哪个模型在 benchmark 里表现更好真的有意思么,还不如找到一个坚持用下去。有 gemini 用 gemini ,没有用 deepseek-v3 也能达到目的。天天炒作 claude 看着都麻了,是不是公司的政治观点还会影响用户?
    jonty
        36
    jonty  
       6 天前
    2025 年了,还有人在对比最强模型?谁不知道 claude 好用,是大家不想用吗?
    rubyacgn
        37
    rubyacgn  
       6 天前
    谁没事国庆写代码啊
    binaryify
        38
    binaryify  
       6 天前
    Codex 虽然有点慢但是经常一步到位, claude 像是应届生,着急写代码,但是经常返工
    bytesfold
        39
    bytesfold  
       6 天前 via iPhone
    Claude 4.5 体感跟 Codex 效果区别不大了;
    Claude 4 体感就是愣头青
    asuka02
        40
    asuka02  
       6 天前 via Android
    你这是从抖音学的标题吗?
    zy5a59
        41
    zy5a59  
    PRO
       6 天前
    我感觉这两个是互补的,codex 写逻辑强一些,但是 UI 写出来是真丑,claude 正好相反
    xuhuanzy
        42
    xuhuanzy  
       6 天前 via Android
    codex 上下文读取很激进,对于复杂项目效果远超 claude
    Bluecoda
        43
    Bluecoda  
       6 天前
    claude-sonnet-4.5 用下来比 gpt5-high 强多了,速度又快,体验感太棒
    kennylam777
        44
    kennylam777  
       6 天前
    @sunnysab Local AI 中的放 LLM 的不, 但私有商 SOTA(只 API 那)模型比是比中模型
    welcomezhangjun
        45
    welcomezhangjun  
       5 天前
    claude-sonnet-4.5
    coderlxm
        46
    coderlxm  
       5 天前 via Android
    codex-gpt5-high
    bf109_
        47
    bf109_  
    PRO
       5 天前
    codex cloud 吊打一切
    yjxjn
        48
    yjxjn  
       5 天前
    claude-sonnet-4.5
    CodeX
    Aolose
        49
    Aolose  
       5 天前   1
    抛开性价比?那我选择牛马大模型
    gfbts
        50
    gfbts  
       5 天前
    @Aolose 牛马竟是我自己
    mendax2019
        51
    mendax2019  
       5 天前
    gemini 2.5 pro ,快也是强
    pkokp8
        52
    pkokp8  
       5 天前
    顺便想问问大家,各位用这些模型的时候都是开箱即用吗
    会不会有什么奇技淫巧是我不知道的
    BernieDu
        53
    BernieDu  
       5 天前
    @xuhuanzy codex 读的上下文可能更多,你让他给代码找错确实更好用,但是一旦让它上手干活比 4.5 差远了,还是搭配着用吧
    ferock
        54
    ferock  
    PRO
       5 天前 via Android
    cl 4.0 ,没钱用 4.5 还没体验过
    andrew2558
        55
    andrew2558  
       5 天前
    现在这些大模型写代码是真的强呀,期待 gemini3
    gmuubyssss
        56
    gmuubyssss  
       5 天前
    @sunnysab 跟人家天天骂川普一样,你能天天????????
    jiayouzl
        57
    jiayouzl  
       5 天前
    毫无疑问 claude-sonnet-4.5
    salor
        58
    salor  
       5 天前
    写代码 GPT-5 High ,修 bug GPT-5 Pro
    Seck
        59
    Seck  
       5 天前 via Android
    没有先发优势?
    强者恒强,互联网的赢者通吃效应?

    超过,想过了,直到 ai 热潮结束,也不能超过!

    要真是超过才是危险的,妈的做了三个版本才火起来,今天对面随随便便,资源比你少,人才投入比你少,市场价格比你低,然后被超越

    那估计三战就来了,创新失败效应才是人类社会进步最后的壁垒,如果创新者被对面:资源,人才,技术,市场,教育都不如你超过……那世界才真有意思
    234ygg     60
    234ygg  
       5 天前
    但凡有点水平的代码,gpt 明显强一大截,垃圾代码的话 claude 和 gpt 差不多
    wangweiggsn
        61
    wangweiggsn  
       5 天前
    @mendax2019 我也用的 Gemini Pro 2.5, 注册 API 免费,vscode 里配置一下 API key 直接用,我用量没超,一直是免费的。
    qoras
        62
    qoras  
       5 天前
    gpt5-high 比 gpt5-codex 好,就是有点慢,不过可以加钱用 gpt5-high-fast
    kulove
        63
    kulove  
       5 天前 via Android
    抛不开 用了几天 Codex 效果差很多
    novaa
        64
    novaa  
       5 天前
    windows 下用了下 codex 跟个智障一样各种错误
    lscho
        65
    lscho  
       5 天前 via Android
    你想问就问,非要贬低一下别人。。。

    其实所有模型都试用一两个月你就会发现,所有的模型都有它擅长和不擅长的。

    而且每个人的使用习惯不一样(提示词习惯、规则配置、项目配置等),甚至网络环境的区别都会导致他对不同的模型体验不一样。

    所以这玩意目前我觉得没有固定答案,每个人都可以多试用几种来找到最合适自己的。

    就个人而言,claude 在大多数情况下符合预期,但是在少部分情况下确实有可能表现的还没有其他模型好。所以我已经习惯多种模型交叉验证解决稍微复杂的问题。
    shintendo
        66
    shintendo  
       5 天前
    lovdanny
        67
    lovdanny  
       5 天前 via Android
    我最近真切感受到 Codex 的强大比我之前在 Cursor 里用的 Claude 模型更稳,也更少生成冗余代码。最近我用 Codex 一口气写完了一个 Rust 命令行工具(用于处理 TSV 和 Excel 表格数据,tsvkit: https://github.com/dawnmy/tsvkit ),基本上都是一次就过。

    前期用的是 Local 模式,额度用完后换成 Cloud 模式,结果真是让我震惊,在这种通用编程任务上,AI 已经可以做到几乎“代写”了,人只需要提清楚需求就行。
    kneo
        68
    kneo  
       4 天前 via Android
    不知道是不是错觉,前段时间 claude 降智,到现在我觉得 sonet 4.5 也智障一样,没缓过来。都在推 sonet 4.5 我还挺意外的。
    Wkj1998
        69
    Wkj1998  
       4 天前 via Android
    @Gekou 这么多代码,逻辑复杂应该只有 GPT-5-high 、Gemini2.5 Pro 能处理了,
    Wkj1998
        70
    Wkj1998  
       4 天前 via Android
    GPT-5-high 、Claude Sonnet4.5 、不截断的 Gemini2.5 Pro ,最重要的是互补,每个 LLM 都有短板,要取长补短
    anteros
        71
    anteros  
       4 天前
    哪个被骂的人最多,就用哪个。我说的是世界范围内。
    yippee0539
        72
    yippee0539  
       4 天前
    之前也是一直用 claude
    但是架不住贵/白嫖的不稳定
    索性 dp 了,够用、快、稳定、便宜
    byasm32
        73
    byasm32  
       4 天前
    Gemini 2.5 Pro 已经完全够用。。超长上下文支持,几百 k 的附件代码也随便分析,速度也快。
    yyws2012
        74
    yyws2012  
       4 天前 via Android
    @byasm32 gemini 非常擅长讲述内容,但是在分析较多内容时幻觉严重,之前我让它分析代码它能信誓旦旦地说出一个不存在的 feature
    ptstone
        75
    ptstone  
       3 天前
    ”我发现现在甚至有人还在吹 Deepseek 、GLM “ 。 八月底九月初的时候,我用 deepseek 和 sonet 4 ,同样的提示词写一个项目,deepseek 做的 ui 效果明显强与 sonet4.1 。 都是用 claude code 。后来放弃了 sonet4 生产的项目,用 sonet 4 接着 deepseek 生成的项目接着写后端,做单一任务,deepseek 在某些方面不一定差,做复杂任务,需要关联很多代码,你不提示 deepseek 会不读仓库其他代码直接写,sonnet 不降智的情况下,会读应用到的代码。凡是不要这么武断下结论。
    fourninenine
        76
    fourninenine  
       3 天前
    我就是第一种人我来反驳第二种
    什么叫“大谈敌对势力”?
    deepseek 不让美国人用了吗?
    到底是谁在搞敌对?
    Vaspike
        77
    Vaspike  
       2 天前 via iPhone
    写 UI 我个人觉得 Gemini 依然最强
    NineTree
        78
    NineTree  
       21 小时 57 分钟前
    claude code
    millken
        79
    millken  
       9 小时 5 分钟前
    Claude Sonnet 4.5 确实用起来最爽
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3047 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 11:15 PVG 19:15 LAX 04:15 JFK 07:15
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86