AI 太烧钱了,有什么好的大模型组合方案? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
meetyuan

AI 太烧钱了,有什么好的大模型组合方案?

  •  
  •   meetyuan 5 天前 9269 次点击

    用 AI 生成计划,写代码,用 claude-opus-4-6 半天烧了四十多,这样下去扛不住。

    我就想能不能使用 claude 或者 gpt 写计划,指定好详细的开发计划和实施流程,然后让 minimax(我买了一个月的 plus ,放那里快到期了)来完成实施过程以及测试?

    各位高手有什么建议没有?

    108 条回复    2026-04-23 08:36:51 +08:00
    1  2  
    YanSeven
        1
    YanSeven  
       5 天前
    直接用的 claude 的 api 吗,那确实烧
    WessonC
        2
    WessonC  
       5 天前
    只能中转站,但是现在中转站太 JB 乱了。
    iorilu
        3
    iorilu  
       5 天前   3
    很多人是这么做的阿

    但是, 即使你拆的很细, 差的模型也不保证能无错完成

    这就看你取舍了, 你愿意多花时间, 甚至自己可以直接改代码的, 可以用

    如果你做不了, 那只能多花钱
    fingerxie
        4
    fingerxie  
       5 天前
    我是用的 codex ,感觉不错。 大体来讲一个月 20 美刀的版本略微不够,配合公司提供的 cursor+阿里云 coding plan 刚好覆盖
    meetyuan
        5
    meetyuan  
    OP
       5 天前
    @WessonC
    @YanSeven 用的中转,充了 40 ,大半天就没了,倍率也没有多高,实在扛不住了
    ooooo00000ooooo
        6
    ooooo00000ooooo  
       5 天前
    就是主楼说的那样搞啊,不过不要用 Minimax ,用 GLM
    66beta
        7
    66beta  
       5 天前
    试试 deepseek API ,我试了下,只看做计划,写代码的话,跟 CLAUDE 差别不大,价格那就是降维打击了
    hnbcinfo
        8
    hnbcinfo  
       5 天前
    用 Claude Code Router ,把不同的任务分给不同的大模型,应该能节省成本,不过我没测试过。
    sampeng
        9
    sampeng  
       5 天前
    实话说。。我也是这样做的。但你会发现 plan 也很花钱
    Sundayz
        10
    Sundayz  
       5 天前
    从官方订阅,再到中转站,最后 Trae CN 白嫖免费模型,一路走下来并没有感觉到使用顶级模型的必要性,免费的模型一样能够完成工作。
    meetyuan
        11
    meetyuan  
    OP
       5 天前
    @sampeng 我今天测试了,做计划确实也烧钱,但是还在接收的范围内,之前写代码和做测试,烧 token 太厉害了
    mnoputd20adfadf3
        12
    mnoputd20adfadf3  
       5 天前
    高频用 GPT(敞开用)
    可以看看 我自用的 中转 aHR0cHM6Ly81ODUwMTZkMy51M3UuZGV2Lw==
    (pro + plus 号池)
    同行、看着出吧(毕竟奥特曼 经常重置额度)
    适合同行分摊成本,不做商业服务
    yiiouo
        13
    yiiouo  
       5 天前
    公司有买 cursor ,一个月能用 100 美元吧,然后我自己买了 kimi ,配合 opencode 效果还可以。
    Sezxy
        14
    Sezxy  
       5 天前
    腾讯云的 coding plan lite 40 元,虽然模型不是最新,但处理 crud 绰绰有余
    mnoputd20adfadf3
        15
    mnoputd20adfadf3  
       5 天前
    @mnoputd20adfadf3
    刚刚注册的一个用户
    送了 一百刀 用于体验(没有倍率,和官方一样计价的)
    奥特曼,重置额度了,余量多

    薅羊毛用户,请去 商业化中转站 谢谢 ~
    请留给真有使用需求的(且高频用的)
    后续注册
    可在站内 @我 送体验额度
    YangWaleed
        16
    YangWaleed  
       5 天前
    本来可以推荐 copilot 的,现在也没了
    总体上看订阅比 API 便宜,我之前是 codex + copilot 勉强够用,现在可能得两个 codex 了
    ntdll
        17
    ntdll  
       5 天前
    通常是用大模型做规划和最后的审查 code review ,而小模型负责根据规划文档编码,这样可以节约 token
    AnQiYang
        18
    AnQiYang  
       5 天前
    @66beta 你认真的嘛,感觉这么不现实呢
    cookii
        19
    cookii  
       5 天前 via Android
    @66beta deepseek 还是差距太大了,至少也得拿 kimi 吧
    AlohaV2
        20
    AlohaV2  
       5 天前
    别充年费,等等 ds
    herofire
        21
    herofire  
       5 天前
    @mnoputd20adfadf3 已注册,求体验额度
    66beta
        22
    66beta  
       5 天前
    @AnQiYang #18 不信就自己试一下嘛,反正我用下来差距并不大。也用了大半年了,现在公司买了 CLAUDE 我就慢慢不用了
    mnoputd20adfadf3
        23
    mnoputd20adfadf3  
       5 天前
    @herofire 邮箱是多少
    base 加密发一下 谢谢
    Ethan24067
        24
    Ethan24067  
       5 天前
    我自用的是 opencode 加 omo 插件,这个插件把任务细分为多个部件,你对于每个部件可以分别配置模型,这样的话,就能拆开了。类似的还有 claude code 里的 ccg-workflow ,前端派给 gemini ,后端扔给 codex ,claude 桥接和规划。
    mnoputd20adfadf3
        25
    mnoputd20adfadf3  
       5 天前
    @herofire 看到你过往 回复记录了 ...
    不用邮箱了
    106npo
        26
    106npo  
       5 天前 via Android
    minimax 太小了,glm 或者 kimi 吧
    mansunyunxin
        27
    mansunyunxin  
       5 天前
    你问的方向是对的,但 Minimax 做执行层降级太多。更好的组合是:

    DeepSeek/GLM 做具体执行,Claude 只做规划 + 审查。

    这本质上是 Karpathy 「 Goal-Driven Execution 」的成本感知版本不只是给目标,还要给「在什么成本约束下达到目标」。

    规划的 token 消耗经常被低估。实际上更好的分法是:
    - 大模型:规划路径 + 审查代码质量
    - 便宜模型:按规划路径执行

    DeepSeek 写代码和 Claude 差距没那么大,但价格是降维打击。省下来的预算可以多跑几轮规划。
    shea
        28
    shea  
       5 天前
    @mnoputd20adfadf3 #25 大佬,我也注册了,求体验额度,c2hlYW9vY0BnbWFpbC5jb20=
    mnoputd20adfadf3
        29
    mnoputd20adfadf3  
       5 天前
    @shea 已 赠送
    wengjin456123
        30
    wengjin456123  
       5 天前
    @mansunyunxin ds 的 128k 上下文是不是太小了
    Elio
        31
    Elio  
       5 天前
    我用的中转站 codex ,一个月才差不多四五十
    exploretheworld
        32
    exploretheworld  
       5 天前
    找个能随便用的公司上班
    Panameragt
        33
    Panameragt  
       5 天前
    openrouter/free
    linecode
        34
    linecode  
       5 天前
    @mnoputd20adfadf3 大佬,注册了,来个体验额度,OTE1OTIxNTAwQHFxLmNvbQ==
    mnoputd20adfadf3
        35
    mnoputd20adfadf3  
       5 天前
    @linecode 已 处理
    mpthink
        36
    mpthink  
       5 天前
    @mnoputd20adfadf3 大佬,注册了 bXB0aGluazoxNjMuY29t
    s0f
        37
    s0f  
       5 天前
    @mnoputd20adfadf3 大佬,注册了 MzE2MDI0NzYzQHFxLmNvbQ==,谢谢
    mnoputd20adfadf3
        38
    mnoputd20adfadf3  
       5 天前
    @mpthink
    @s0f
    都处理了
    wangmn
        39
    wangmn  
       5 天前
    可以试试我主页的中转 可以敞开用
    cryzzchen
        40
    cryzzchen  
       5 天前
    @YangWaleed copilot 也没了?
    YangWaleed
        41
    YangWaleed  
       5 天前
    @cryzzchen 不让新用户订阅了,而且 opus 额度大砍,要想用 opus 可能还是 Claude 官方便宜
    之前用 copilot 主要是为了 opus ,现在感觉不值得了
    jimrok
        42
    jimrok  
       5 天前
    海外模型可以做一下任务制定,规格说明,给出样例代码,国产模型负责实现设计。写代码可以试试 GLM 和 kimi ,有指引的情况下,应该出来的内容不会太差。
    wanghanthu
        43
    wanghanthu  
       5 天前
    老黄:The more you buy, the more you save.
    wu67
        44
    wu67  
       5 天前
    @YangWaleed 不用 opus 用用 4.6 倒也还行.
    但是看到有人说会把月次数限制成周次数? 那就很尴尬了, 不过我没看到在哪有官方声明, 不知道他在哪看来的.
    YangWaleed
        45
    YangWaleed  
       5 天前
    @wu67 不确定。我感觉 sonnet 4.6 是不是没 gpt-5.4 强? copilot 里这两个消耗一样,那我肯定优先用 gpt-5.4 。
    我自己感觉两个 openai plus 订阅的量够我轮换地用了,再订阅 copilot 好像有点鸡肋
    zihaogong
        46
    zihaogong  
       5 天前
    @mnoputd20adfadf3 #38 NjM1NTY1OTkwQHFxLmNvbQ== 感谢
    mnoputd20adfadf3
        47
    mnoputd20adfadf3  
       5 天前
    @zihaogong 已处理
    wu67
        48
    wu67  
       5 天前
    @YangWaleed 我一直用 4.6, 聪明程度足够我用了. 以前 gpt5 刚出的时候我被坑过, 就再也没启用过 gpt 系列的了, 除了一个 gpt4.1 用来在高级请求耗尽时备用.
    YangWaleed
        49
    YangWaleed  
       5 天前
    @wu67 我倒是反过来。一开始用 sonnet 和 opus ,后来发现 gpt-5.4 好像能力上相差无几但用量多很多,就慢慢迁移到 gpt 了。不过后来 codex 用量砍了后也撑不住我用 superpowers ,得两个号混着用才行
    wu67
        50
    wu67  
       5 天前
    @YangWaleed 5.4 还有越界到处修改代码的问题吗? 不频繁的话我也试试看
    abc0123xyz
        51
    abc0123xyz  
       5 天前
    别用 弱智 max ,跑个龙虾还凑合,写代码太拉了
    TheAnonymous
        52
    TheAnonymous  
       5 天前
    @mnoputd20adfadf3 求体验额度 OTkzNTM3MTc4QHFxLmNvbQ==
    mnoputd20adfadf3
        53
    mnoputd20adfadf3  
       5 天前
    @TheAnonymous 已处理
    imnpc
        54
    imnpc  
       5 天前
    kimi + gpt
    YangWaleed
        55
    YangWaleed  
       5 天前
    @wu67 我没感觉到有这种情况。不过我也不会仔细 review 代码改动,只确认修改方案。
    superpowers skills 会起一个 subagent 写代码,两个 subagent 分别 review 修改逻辑和代码质量。所以额度会肉眼可见地掉,现在我都会强调不需要这么严格的 review 才好点
    fongyip
        56
    fongyip  
       5 天前 via Android
    @mnoputd20adfadf3
    哥方便给个体验额度吗?
    Zm9uZ3lpcDIwMjNAMTYzLmNvbQ==
    mnoputd20adfadf3
        57
    mnoputd20adfadf3  
       5 天前
    @fongyip 已处理
    sarices
        58
    sarices  
       5 天前
    @mnoputd20adfadf3 #23

    来点测试 cHJldHR5NTIzMkAxMjA3MjkueHl6
    mnoputd20adfadf3
        59
    mnoputd20adfadf3  
       5 天前
    @sarices 已处理
    fuchish112
        60
    fuchish112  
       5 天前
    @mnoputd20adfadf3 c29yc2hpb25AZ21haWwuY29t 大佬
    rsyjjsn
        61
    rsyjjsn  
       5 天前
    用 proxifier + antigravity 直接薅谷歌的,强度不高 一周三个谷歌号,强度高你就一天一个号,反正 7 天之后就重置额度了
    justforvx
        62
    justforvx  
       5 天前
    @mnoputd20adfadf3 R2F6aW5nMjgyN0AxNjMuY29t 感谢大佬
    mnoputd20adfadf3
        63
    mnoputd20adfadf3  
       5 天前
    @fuchish112
    @justforvx
    已处理
    xinshu
        64
    xinshu  
       5 天前
    @mnoputd20adfadf3 d2hvaXMueGluc2h1QGdtYWlsLmNvbQ== 感谢大佬
    thedustoooo
        65
    thedustoooo  
       5 天前
    @mnoputd20adfadf3 ZGVzdGlueW9vb29AMTI2LmNvbQ== 大佬
    luckyxl
        66
    luckyxl  
       5 天前
    @mnoputd20adfadf3 7CefPvGBexCUijc6JXHoAk 感谢大佬
    PPZZPP
        67
    PPZZPP  
       5 天前
    @mnoputd20adfadf3 大佬,注册了 YTEzMjc5MzkxNTdAZ21haWwuY29t
    ThunStorm
        68
    ThunStorm  
       5 天前 via Android
    @mnoputd20adfadf3 ZjE1MTV4Y25AZ21haWwuY29t 感谢大佬
    luckyxl
        69
    luckyxl  
       5 天前
    @mnoputd20adfadf3 Mjc5NDc0Mzg2QHFxLmNvbQ== 感谢大佬
    meetyuan
        70
    meetyuan  
    OP
       5 天前   1
    @mnoputd20adfadf3 哥,感谢你的回复,要不你在开个推广帖子吧,我一定支持!

    我这里主要是想讨论下怎么多模型配合使用,现在有点乱了。
    luck2023
        71
    luck2023  
       5 天前 via Android
    @mnoputd20adfadf3 注册好了,Y29uZmlkZW5jZXMyMDIzQGdtYWlsLmNvbQ==
    mnoputd20adfadf3
        72
    mnoputd20adfadf3  
       5 天前
    @meetyuan 不好意思哈
    么么哒 ~

    请不要在 @ 我了
    余量也不够了
    感恩
    program9527
        73
    program9527  
       5 天前
    最近看了下视频生成的。google 的 veo ,sora 、即梦好像价格都非常高。有什么低成本的方案吗
    lodelo
        74
    lodelo  
       5 天前
    @mnoputd20adfadf3 MTc1ODQzNzY3QHFxLmNvbQ== 感谢大佬
    wclebb
        75
    wclebb  
       5 天前
    认真讲,如果你能用大模型免费写代码,那么就没有这个岗位了。
    ls006009
        76
    ls006009  
       5 天前
    @mnoputd20adfadf3 大佬, 注册好了, 求体验额度, bHMwMDYwQDE2My5jb20= 谢谢
    zhangdashuan
        77
    zhangdashuan  
       5 天前
    @mnoputd20adfadf3 #12 大佬,已注册,求体验额度。MzIwMDI0MTE0MkBxcS5jb20=
    vincentwu
        78
    vincentwu  
       5 天前
    @mnoputd20adfadf3 大佬已注册,d3lsd2lsbDAyMTJAMTYzLmNvbQ==
    kevan
        79
    kevan  
       5 天前
    @mnoputd20adfadf3 我注册了 ID: am95bXVzaWNAMTYzLmNvbQo=
    teaguexiao
        80
    teaguexiao  
       5 天前
    用 Claude Code 的话可以在 CLAUDE.md 里将需求和架构写详细,让 Sonnet 做执行,只在关键定义和架构评审时再切回 Opus ,这样一天的费用能控在十块内。
    XUEHAIWUYA
        81
    XUEHAIWUYA  
       5 天前
    找个正规的中转,或者 token 是不是确实用的多
    Lutto
        82
    Lutto  
       5 天前
    我半天用了 100 美金的 token……
    chenzezeya
        83
    chenzezeya  
       5 天前
    哥方便来点~ NDQ4MTY1MzE1QHFxLmNvbQ==
    @mnoputd20adfadf3
    gaoxiaoxin
        84
    gaoxiaoxin  
       5 天前
    MTUwOTQzNDY3NGdhb0BnbWFpbC5jb20= 感谢大佬 @mnoputd20adfadf3
    soFollish
        85
    soFollish  
       5 天前
    emh1YW5nemh1YW5nemhvdWlAZ21haWwuY29t 感谢老板 @mnoputd20adfadf3
    sarices
        86
    sarices  
       5 天前   1
    @mnoputd20adfadf3 #59
    速度还可以,挺不错的,用一段时间看看
    mach9452
        87
    mach9452  
       5 天前
    贵就对了,我还没失业就是因为 AI 比我贵[doge/]
    mackes
        88
    mackes  
       5 天前
    @mnoputd20adfadf3 老哥,刚注册了一个用户名 mackes
    mackes
        89
    mackes  
       5 天前
    @Elio 老哥可以分享一下吗?
    hais1992
        90
    hais1992  
       5 天前
    @mnoputd20adfadf3 aGFpczE5OTJAMTYzLmNvbQ== 求体验额度,已注册,多谢大佬~
    gotoschool
        91
    gotoschool  
       5 天前
    @mackes #89 留联系方式
    mackes
        92
    mackes  
       4 天前
    @gotoschool bWFja2VzNzRAZ21haWwuY29t 谢谢
    distance7509
        93
    distance7509  
       4 天前
    我感觉中转站的话,还不如官方拼车,中转站的消耗太快了
    panzhc
        94
    panzhc  
       4 天前
    用量大的话,直接买 chatgpt pro 套餐,$200 的一个人用应该足够了。
    meetyuan
        95
    meetyuan  
    OP
       4 天前
    @teaguexiao 这个我要试试,谢谢大佬!
    meetyuan
        96
    meetyuan  
    OP
       4 天前
    @rsyjjsn 不看评分的话,gemini 和 claude 用起来差别大吗 ?
    actopas
        97
    actopas  
       4 天前
    直接就 claude max 就完事了一个月 700 上下
    rsyjjsn
        98
    rsyjjsn  
       4 天前
    @meetyuan 个人感觉差距不太多 但肯定是 claude 最好用,比如生成一个页面,gemini 可能完成度 80% claude 大概有 90%
    doyel
        99
    doyel  
       4 天前
    @mnoputd20adfadf3 #12 大哥注册关闭吗。。。
    simo
        100
    simo  
       4 天前
    我目前用的,可以参考下:
    codex: 一天持续 8 个小时,两个 openai plus 够用了。 [持续记录改进文档,方便新开会话。会话多了,就重开。遇到一次,会话到 3G ,一轮就消耗 1/3 5 小时 plus 用量]
    minimax 跑龙虾,日常工具性任务,足够。一年不到 500 。
    反重力:年付的,基本废了,维护之前的项目用。
    opencode go:10$那个,glm5 量很小,做做小工具用。
    自建备用,主要 qwen 3.6 35B

    建议可以上一个 openai plus ,如果能用一周,那就一个号够了,20$,应该是最划算的了。
    1  2  
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2960 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 166ms UTC 13:00 PVG 21:00 LAX 06:00 JFK 09:00
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86