O3， O4mini-high， claude3.7， Gemini2.5pro 编程能力该怎么排序

28 replies 2025-05-06 12:24:24 +08:00

1

jdz

OP

May 2, 2025 via Android

编程能力

2

crackidz

May 2, 2025

1

没有最好，选择合适的 https://composio.dev/blog/gemini-2-5-pro-vs-claude-3-7-sonnet-coding-comparison/

3

laogui

May 2, 2025

1

事实上 o3 效果最好，用过就知道，但价格太贵，都不在考虑范围之内，都在讨论 Gemini 2.5 Pro 和 Claude 3.7 Sonnet

4

dbg

May 2, 2025

大模型前端编程排行榜
https://web.lmarena.ai/leaderboard

5

icyalala

May 2, 2025

Cursor 官方统计： https://x.com/cursor_ai/status/1917982557070868739
现在用得最多的还是 Claude3.7 和 Gemini2.5 pro ，但是 o3/o4-mini 增长很快

6

Numeron

May 2, 2025

https://aider.chat/docs/leaderboards/

7

Leoking222

May 2, 2025

编程无脑 Claude 3.7 就对了，目前没对手

8

lneoi

May 2, 2025

Gemini2.5 pro 很厉害，加上上下文足够大

9

murmurkerman

May 2, 2025 via iPhone

genimi 2.5 pro

10

huluhulu

May 2, 2025

genimi 2.5 pro ，尤其是大段代码重构的时候，简直无敌。

11

r6Vm94FFk9u3W6XI

May 2, 2025

我投 Claude 一票，有一次一个关于 redis memory usage 命令的东西，全部问了一遍，只有 Claude 第一次就回答了正确答案，其它的始终都没有给出正确答案

12

Zhoukker

May 2, 2025

o3 非常强。就是门槛和价格，综合考虑还是 2.5pro

13

yibie

May 2, 2025

已转 gemini

14

ShadowPower

May 3, 2025

写前端或者新写独立的代码的时候，claude 3.7 强
对现有的整个项目或者整个模块做分析、重构、genimi 2.5 pro 强

15

godqueue

May 3, 2025

gemini 感觉最新的内容会比较好，比如最新的 springboot3 以上的版本，他就能给出正确的答案；其他的会差一些
但是编程整体应该是 Claude 最强

16

yueyingky

May 3, 2025

以前用 3.7 ，现在觉得 genimi 2.5 pro 更好用

17

ooops

May 3, 2025

个人实测 3.7 3.5 > 2.5pro

18

aarontian

May 3, 2025

平时用 cursor 写 go 和 python 多些，经常是提出一个比较复杂的需求用 agent 模式一次性写完。感觉写代码 claude 独一档，但 gemini 2.5 pro 规划总结能力和 debug 能力似乎更强（实际写代码时候不那么准确）

以及 claude 在多轮对话和中断重启的时候容易丢失上下文，我有时候会让 gemini 总结一下我的要求，列计划，然后切换到 claude 3.7 去执行

o3/o4-mini 没怎么试过

19

yulon

May 3, 2025

Claude 原生很积极使用 tool ，别的模型估计提示词写多一点也行，但是为什么要写呢

20

azraeljack

May 3, 2025

cursor 里用 gemini 2.5 pro 高血压的次数显著少于 claude 3.7

21

Derek0310

May 3, 2025

怎么选 Gemini 的大多数都把这个单词打错了？

22

anivie

May 3, 2025

gemini ，断崖领先不是吹的

23

morewe

May 3, 2025

@Derek0310 你不说我都没注意，然后仔细一看，还真是，没数错的话看到了 4 个，怀疑是不是后面几个人懒得打字，直接复制前面的人的了。结果都抄错了。

24

Leeeeex

PRO

May 4, 2025 via Android

gemini2.5 吧，主要是能白嫖，claude 没有白嫖到

25

godqueue

May 4, 2025

试了下 cursor 里的 gemini2.5-pro 发现真不错;
代码上下文能力强很多。。比 claude 3.7 好。。claude 3.7 的上下文太小。。经常忘记东西

26

godqueue

May 5, 2025

只能用 gemini2.5-pro 做总结，然后写代码细节还是 claude 3.7 好

27

solider245

May 6, 2025

1

穷人套餐+deepseekv3+geminipro2.5

28

jdz

OP

May 6, 2025 via Android

@solider245 关键问题是穷人套餐还很强