O3, O4mini-high, claude3.7, Gemini2.5pro 编程能力该怎么排序 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
jdz
V2EX    程序员

O3, O4mini-high, claude3.7, Gemini2.5pro 编程能力该怎么排序

  •  1
     
  •   jdz 161 天前 via Android 4536 次点击
    这是一个创建于 161 天前的主题,其中的信息可能已经有所发展或是发生改变。
    28 条回复    2025-05-06 12:24:24 +08:00
    jdz
        1
    jdz  
    OP
       161 天前 via Android
    编程能力
    crackidz
        2
    crackidz  
       161 天前   1
    laogui
        3
    laogui  
       161 天前   1
    事实上 o3 效果最好,用过就知道,但价格太贵,都不在考虑范围之内,都在讨论 Gemini 2.5 Pro 和 Claude 3.7 Sonnet
    dbg
        4
    dbg  
       161 天前
    大模型 前端编程 排行榜
    https://web.lmarena.ai/leaderboard
    icyalala
        5
    icyalala  
       161 天前
    Cursor 官方统计: https://x.com/cursor_ai/status/1917982557070868739
    现在用得最多的还是 Claude3.7 和 Gemini2.5 pro ,但是 o3/o4-mini 增长很快
    Numeron
        6
    Numeron  
       161 天前
    https://aider.chat/docs/leaderboards/
    Leoking222
        7
    Leoking222  
       161 天前
    编程无脑 Claude 3.7 就对了,目前没对手
    lneoi
        8
    lneoi  
       161 天前
    Gemini2.5 pro 很厉害,加上上下文足够大
    murmurkerman
        9
    murmurkerman  
       161 天前 via iPhone
    genimi 2.5 pro
    huluhulu
        10
    huluhulu  
       161 天前
    genimi 2.5 pro ,尤其是大段代码重构的时候,简直无敌。
    nanjoyoshino
        11
    nanjoyoshino  
       161 天前
    我投 Claude 一票,有一次一个关于 redis memory usage 命令的东西,全部问了一遍,只有 Claude 第一次就回答了正确答案,其它的始终都没有给出正确答案
    Zhoukker
        12
    Zhoukker  
       161 天前
    o3 非常强。就是门槛和价格,综合考虑还是 2.5pro
    yibie
        13
    yibie  
       161 天前
    已转 gemini
    ShadowPower
        14
    ShadowPower  
       160 天前
    写前端或者新写独立的代码的时候,claude 3.7 强
    对现有的整个项目或者整个模块做分析、重构、genimi 2.5 pro 强
    godqueue
        15
    godqueue  
       160 天前
    gemini 感觉最新的内容会比较好,比如最新的 springboot3 以上的版本,他就能给出正确的答案;其他的会差一些
    但是编程整体应该是 Claude 最强
    yueyingky
        16
    yueyingky  
       160 天前
    以前用 3.7 ,现在觉得 genimi 2.5 pro 更好用
    ooops
        17
    ooops  
       160 天前
    个人实测 3.7 3.5 > 2.5pro
    aarontian
        18
    aarontian  
       160 天前
    平时用 cursor 写 go 和 python 多些,经常是提出一个比较复杂的需求用 agent 模式一次性写完。感觉写代码 claude 独一档,但 gemini 2.5 pro 规划总结能力和 debug 能力似乎更强(实际写代码时候不那么准确)

    以及 claude 在多轮对话和中断重启的时候容易丢失上下文,我有时候会让 gemini 总结一下我的要求,列计划,然后切换到 claude 3.7 去执行

    o3/o4-mini 没怎么试过
    yulon
        19
    yulon  
       160 天前
    Claude 原生很积极使用 tool ,别的模型估计提示词写多一点也行,但是为什么要写呢
    azraeljack
        20
    azraeljack  
       160 天前
    cursor 里用 gemini 2.5 pro 高血压的次数显著少于 claude 3.7
    Derek0310
        21
    Derek0310  
       160 天前
    怎么选 Gemini 的大多数都把这个单词打错了?
    anivie
        22
    anivie  
       160 天前
    gemini ,断崖领先不是吹的
    morewe
        23
    morewe  
       160 天前
    @Derek0310 你不说我都没注意,然后仔细一看,还真是,没数错的话看到了 4 个,怀疑是不是后面几个人懒得打字,直接复制前面的人的了。结果都抄错了。
    Leeeeex
        24
    Leeeeex  
    PRO
       160 天前 via Android
    gemini2.5 吧,主要是能白嫖,claude 没有白嫖到
    godqueue
        25
    godqueue  
       159 天前
    试了下 cursor 里的 gemini2.5-pro 发现真不错;
    代码上下文能力强很多。。比 claude 3.7 好。。claude 3.7 的上下文太小。。经常忘记东西
    godqueue
        26
    godqueue  
       158 天前
    只能用 gemini2.5-pro 做总结,然后写代码细节还是 claude 3.7 好
    solider245
        27
    solider245  
       157 天前   1
    穷人套餐+deepseekv3+geminipro2.5
    jdz
        28
    jdz  
    OP
       157 天前 via Android
    @solider245 关键问题是穷人套餐还很强
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1020 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 18:33 PVG 02:33 LAX 11:33 JFK 14:33
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86