答案无疑肯定是在 Codex 和 Claude Sonnet/Opus 中产生。
为什么要抛开性价比这个选项?
我发现现在甚至有人还在吹 Deepseek 、GLM 。
2025 年了,哪吒票房那段时间还没完?年还没过完?
吹的有两种人(我说的比较难听):
抛开爱国情绪、抛开花费,目前写代码最强模型到底是 Codex 还是 Claude ?
没深度使用过多家的,没对比过的,只用过某一种的,回答也基本没有什么参考价值。
1 mooyo 6 天前 via iPhone ![]() claude-sonnet-4.5 |
2 imjiaoyuan 6 天前 via Android claude-sonnet-4.5 和这个比起来国产的像低能儿 |
![]() | 3 TimePPT PRO ![]() GPT-5 High |
4 ty29022 6 天前 via iPhone ![]() 我个人的感觉是 gpt5 像个 cs 科班的大佬 claude 像个经验丰富的中级程序员 对复杂情况无能为力 |
![]() | 5 novaren 6 天前 via Android claude 毋容置疑 |
6 facebook47 6 天前 via Android ![]() Claude 写代码无敌,另外在这个论坛,头一次听说有人吹 deepseek 的,一拉一踩非常不可取 |
![]() | 7 spike0100 6 天前 via iPhone 我自己用下来 glm 其实还好。主要差别是 claude sonnect 4.5 一般一次生成的代码直接就可以跑,glm 需要主动提醒一两次才能调好。最终效果感觉差别不大。 |
![]() | 8 spike0100 6 天前 via iPhone @spike0100 都是用 claude code + 对应基础模型测的。deepseek 和 qwen3 max 试过跑了 50 ,60 人民币的 token ,结果都没法看。 |
![]() | 9 takanashisakura 6 天前 ![]() 说性能的话毋庸置疑吧。但是在真正用的时候,很难不考虑性价比和可用性吧。 所以我也没得选,只有 deepseek 和 gemini 。 |
10 xiaojie668329 6 天前 有时候 Gemini 做得比 Claude 好 |
11 raydg7777 6 天前 还是 Codex |
12 Alias4ck 6 天前 ![]() 吹 glm 的和 deepseek 的 肯定是没吃过细糠 |
![]() | 13 victor 6 天前 ![]() claude 够快所以是主力。但 claude 4.5 写完的功能,codex 还能挑出来一堆毛病。 |
![]() | 14 skiy 6 天前 ![]() 你抛开花费但抛开不了人家不让你用吧?这是不可控因素。刚刚又有 up 说自己被封号了。 |
![]() | 15 yb2313 6 天前 抛开花费我选同时使用几个顶尖模型,然后每次需求选择最好的一个结果,即使不同时使用也可不断轮换使用对比每个模型擅长领域。 |
![]() | 16 lithiumii 6 天前 via Android 可能有一个月没写代码了,之前是用免费的 copilot 里的旧版本 gpt (好像是 4.1 )和 Claude ( 3.5 吧大概)或者用 Aider 调免费的 Gemini 2.5 Pro ,或者付费的 DeepSeek V3 或者 3.1 和 GLM 4.5 (这俩便宜)。 体感最强是 Gemini 2.5 Pro ,其次相差不远是 DS 和 GLM ,免费 copilot 送的模型是真的不行了。 |
![]() | 17 haiku 6 天前 via Android ![]() GPT 5 high 下个月等 Gemini 3 |
18 streamrx 6 天前 via iPhone gpt5 high |
![]() | 19 zpvip 6 天前 claude-sonnet-4.5 这个是毒品, 不能碰 |
![]() | 20 Imindzzz 6 天前 via Android ![]() 你想抛开谈就抛开谈呗,为啥要贬低一下“吹”deepseek... |
21 mywjyw 6 天前 cdex cli 做的比 claude code 差,很多功能不全,很难用 |
![]() | 22 lancevps 6 天前 生成 html 的 UI 设计稿,豆包最强 |
![]() | 23 sunnysab 6 天前 ![]() 额,倒也不是爱国情绪,https://www.reddit.com/r/LocalLLaMA/ reddit 上很多外国人考虑中国的模型,超级积极… qwen 和 glm 评价不错。llama 挨骂较多,openai 被骂的也不少 |
24 Thymolblue 6 天前 现在用 GPT-5 和 Claude 有什么渠道吗?直接用 API 都需要组织认证,目前国内身份没法通过 |
![]() | 27 ggp1ot2 6 天前 Claude Sonnet 4.5 没有什么价格不价格的,这个模型可以满足我现在的需求 |
29 charles0 6 天前 GPT-5 high (比 GPT-5-Codex 强很多) |
![]() | 30 Bad0Guy 6 天前 cc ,但是封号比 codex 还疯狂,如果 Gemini3 效果比 Claude4.5 好那我会考虑日常转用 Gemini3 |
31 Gekou 6 天前 没用过 claude ,但 claude 肯定不能一次处理 100w 的 token ,10w 行代码 反驳请给出详细方法谢谢 |
![]() | 32 plasticman64 6 天前 claude 会找 bug ,这是我最佩服的一点 |
![]() | 35 agagega 6 天前 via iPhone ![]() 为了那点所谓的优势整天琢磨哪个模型在 benchmark 里表现更好真的有意思么,还不如找到一个坚持用下去。有 gemini 用 gemini ,没有用 deepseek-v3 也能达到目的。天天炒作 claude 看着都麻了,是不是公司的政治观点还会影响用户? |
![]() | 36 jonty 6 天前 2025 年了,还有人在对比最强模型?谁不知道 claude 好用,是大家不想用吗? |
37 rubyacgn 6 天前 谁没事国庆写代码啊 |
![]() | 38 binaryify 6 天前 Codex 虽然有点慢但是经常一步到位, claude 像是应届生,着急写代码,但是经常返工 |
39 bytesfold 6 天前 via iPhone Claude 4.5 体感跟 Codex 效果区别不大了; Claude 4 体感就是愣头青 |
![]() | 40 asuka02 6 天前 via Android 你这是从抖音学的标题吗? |
![]() | 41 zy5a59 PRO 我感觉这两个是互补的,codex 写逻辑强一些,但是 UI 写出来是真丑,claude 正好相反 |
42 xuhuanzy 6 天前 via Android codex 上下文读取很激进,对于复杂项目效果远超 claude |
![]() | 43 Bluecoda 6 天前 claude-sonnet-4.5 用下来比 gpt5-high 强多了,速度又快,体验感太棒 |
![]() | 44 kennylam777 6 天前 @sunnysab Local AI 中的放 LLM 的不, 但私有商 SOTA(只 API 那)模型比是比中模型 |
45 welcomezhangjun 5 天前 claude-sonnet-4.5 |
![]() | 46 coderlxm 5 天前 via Android codex-gpt5-high |
![]() | 47 bf109_ PRO codex cloud 吊打一切 |
![]() | 48 yjxjn 5 天前 claude-sonnet-4.5 CodeX |
![]() | 49 Aolose 5 天前 ![]() 抛开性价比?那我选择牛马大模型 |
51 mendax2019 5 天前 gemini 2.5 pro ,快也是强 |
![]() | 52 pkokp8 5 天前 顺便想问问大家,各位用这些模型的时候都是开箱即用吗 会不会有什么奇技淫巧是我不知道的 |
![]() | 54 ferock PRO cl 4.0 ,没钱用 4.5 还没体验过 |
55 andrew2558 5 天前 |
56 gmuubyssss 5 天前 @sunnysab 跟人家天天骂川普一样,你能天天???????? |
![]() | 57 jiayouzl 5 天前 毫无疑问 claude-sonnet-4.5 |
![]() | 58 salor 5 天前 写代码 GPT-5 High ,修 bug GPT-5 Pro |
59 Seck 5 天前 via Android 没有先发优势? 强者恒强,互联网的赢者通吃效应? 超过,想过了,直到 ai 热潮结束,也不能超过! 要真是超过才是危险的,妈的做了三个版本才火起来,今天对面随随便便,资源比你少,人才投入比你少,市场价格比你低,然后被超越 那估计三战就来了,创新失败效应才是人类社会进步最后的壁垒,如果创新者被对面:资源,人才,技术,市场,教育都不如你超过……那世界才真有意思 |
但凡有点水平的代码,gpt 明显强一大截,垃圾代码的话 claude 和 gpt 差不多 |
![]() | 61 wangweiggsn 5 天前 @mendax2019 我也用的 Gemini Pro 2.5, 注册 API 免费,vscode 里配置一下 API key 直接用,我用量没超,一直是免费的。 |
62 qoras 5 天前 gpt5-high 比 gpt5-codex 好,就是有点慢,不过可以加钱用 gpt5-high-fast |
![]() | 63 kulove 5 天前 via Android 抛不开 用了几天 Codex 效果差很多 |
![]() | 64 novaa 5 天前 windows 下用了下 codex 跟个智障一样各种错误 |
65 lscho 5 天前 via Android 你想问就问,非要贬低一下别人。。。 其实所有模型都试用一两个月你就会发现,所有的模型都有它擅长和不擅长的。 而且每个人的使用习惯不一样(提示词习惯、规则配置、项目配置等),甚至网络环境的区别都会导致他对不同的模型体验不一样。 所以这玩意目前我觉得没有固定答案,每个人都可以多试用几种来找到最合适自己的。 就个人而言,claude 在大多数情况下符合预期,但是在少部分情况下确实有可能表现的还没有其他模型好。所以我已经习惯多种模型交叉验证解决稍微复杂的问题。 |
![]() | 66 shintendo 5 天前 |
![]() | 67 lovdanny 5 天前 via Android 我最近真切感受到 Codex 的强大比我之前在 Cursor 里用的 Claude 模型更稳,也更少生成冗余代码。最近我用 Codex 一口气写完了一个 Rust 命令行工具(用于处理 TSV 和 Excel 表格数据,tsvkit: https://github.com/dawnmy/tsvkit ),基本上都是一次就过。 前期用的是 Local 模式,额度用完后换成 Cloud 模式,结果真是让我震惊,在这种通用编程任务上,AI 已经可以做到几乎“代写”了,人只需要提清楚需求就行。 |
68 kneo 4 天前 via Android 不知道是不是错觉,前段时间 claude 降智,到现在我觉得 sonet 4.5 也智障一样,没缓过来。都在推 sonet 4.5 我还挺意外的。 |
70 Wkj1998 4 天前 via Android GPT-5-high 、Claude Sonnet4.5 、不截断的 Gemini2.5 Pro ,最重要的是互补,每个 LLM 都有短板,要取长补短 |
![]() | 71 anteros 4 天前 哪个被骂的人最多,就用哪个。我说的是世界范围内。 |
72 yippee0539 4 天前 之前也是一直用 claude 但是架不住贵/白嫖的不稳定 索性 dp 了,够用、快、稳定、便宜 |
![]() | 73 byasm32 4 天前 Gemini 2.5 Pro 已经完全够用。。超长上下文支持,几百 k 的附件代码也随便分析,速度也快。 |
![]() | 74 yyws2012 4 天前 via Android @byasm32 gemini 非常擅长讲述内容,但是在分析较多内容时幻觉严重,之前我让它分析代码它能信誓旦旦地说出一个不存在的 feature |
75 ptstone 3 天前 ”我发现现在甚至有人还在吹 Deepseek 、GLM “ 。 八月底九月初的时候,我用 deepseek 和 sonet 4 ,同样的提示词写一个项目,deepseek 做的 ui 效果明显强与 sonet4.1 。 都是用 claude code 。后来放弃了 sonet4 生产的项目,用 sonet 4 接着 deepseek 生成的项目接着写后端,做单一任务,deepseek 在某些方面不一定差,做复杂任务,需要关联很多代码,你不提示 deepseek 会不读仓库其他代码直接写,sonnet 不降智的情况下,会读应用到的代码。凡是不要这么武断下结论。 |
![]() | 76 fourninenine 3 天前 我就是第一种人我来反驳第二种 什么叫“大谈敌对势力”? deepseek 不让美国人用了吗? 到底是谁在搞敌对? |
![]() | 77 Vaspike 2 天前 via iPhone 写 UI 我个人觉得 Gemini 依然最强 |
![]() | 78 NineTree 21 小时 57 分钟前 claude code |
79 millken 9 小时 5 分钟前 Claude Sonnet 4.5 确实用起来最爽 |