讲讲家里云新人部署求职项目用的大模型 API 供应商:主力 NVIDIA NIM + 备用 Ollama + OpenAI Codex 调试,含 glm-5.1、gemma4:31b、minimax-m2.7,零成本不爆账单 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
longxinglink

讲讲家里云新人部署求职项目用的大模型 API 供应商:主力 NVIDIA NIM + 备用 Ollama + OpenAI Codex 调试,含 glm-5.1、gemma4:31b、minimax-m2.7,零成本不爆账单

  •  
  •   longxinglink 12 天前 4114 次点击

    1. NVIDIA NIM API (包含网页调用,API )

    项目 详情
    注册地址 https://build.nvidia.com/settings/api-keys
    Base URL https://integrate.api.nvidia.com/v1
    模型数量 约 187 个开源模型(含 gemma-4-31b 、GLM5 等)
    并发限制 支持 40 并发,几乎无限量
    注册门槛 域名邮箱即可,无需验证手机号、无需绑卡,gmail 邮箱需要验证手机号

    作为我的大模型主要供应商,SLA 一直很稳定,高并发但是模型比较老旧,支持境内访问


    2. Ollama Cloud API ( Free 不包含网页调用,仅 API )

    项目 详情
    地址 https://ollama.com/
    Base URL https://ollama.com/v1
    模型数量 36 个开源模型(含 glm-5.1 、gemma4:31b 、minimax-m2.7 )
    注册门槛 gmail 注册无需手机号、无需支付方式
    主要限制 Free 计划同一时间每个 API Key 只能请求同一个模型

    作为我的大模型备用供应商,SLA 一直很稳定,可惜量少不支持高并发,支持境内访问


    openclaw 我用的这个,用于家里云调试非常好用( Claude 不要用于 openclaw ,会封号) 美/新/英等国家,新注册账户送一个月 Plus 或者 Business ,但是需要绑定支付方式

    OpenAI Codex ( Free 计划包含网页调用 cli ,API 需额外付费)

    项目 详情
    地址 https://openai.com/codex/
    可用模型 gpt-5.4 等(含 xhigh 思考级别)
    Free 计划额度 限制2.2 美元 / 5 小时(约为 Plus 计划的一半)
    注册门槛 临时域名邮箱或者 gmail 即可,风控很友好,这个无需多言
    第 1 条附言 &nsp;  8 天前
    NVIDIA API 新增包括 z-ai/glm-5.1 、minimaxai/minimax-m2.7 等四款模型
    minimaxai/minimax-m2.7
    nvidia/ising-calibration-1-35b-a3b
    nvidia/nemotron-3-content-safety
    z-ai/glm-5.1
    33 条回复    2026-04-21 12:52:21 +08:00
    irvinghua
        1
    irvinghua  
       12 天前
    nvidia 是不是改了规则,我按照你的链接点进去注册,提示没有权限使用 API KEY ,提示文字:“Please verify your account to get API access.” 输入国内手机号验证,在输入栏校验死活不通过。而且看了下模型列表,只查到有 glm-5 ,没有 glm-5.1 啊
    irvinghua
        2
    irvinghua  
       12 天前
    @irvinghua 终于通过了,那个手机号校验输入栏设计得很智障,要先选国家和地区,再输入手机号。选定了国家,国家区号前缀居然不会跟着联动改变,比如选 China ,输入栏国家区号依然是+1 ,要手动改成+86 ,我刚刚手动改成+086 校验一直通不过,非得是+86 。
    cvbnt
        3
    cvbnt  
       12 天前
    NVIDIA NIM 最好补充一下,要搭配 CC SWITCH 里开启代理才能在 Claude code 里用
    rebnonu
        4
    rebnonu  
       12 天前
    用 opencode 。CC SWITCH 配置好了直接用
    CareiOS
        5
    CareiOS  
       12 天前
    免费使用?
    longxinglink
        6
    longxinglink  
    OP
       12 天前
    @irvinghua NVIDIA NIM API 使用域名邮箱不需要手机号验证,使用 gmail 邮箱需要手机号验证,ollama 才有 glm-5.1 和 minimax-m2.7 这在文中有写

    @cvbnt 开源模型性能有限,没有为 Claude code 工程编码场景优化设计,建议使用 Codex Free 计划( https://openai.com/codex/)或订阅 Claude.ai ,,第三方转接层风险请自行评估。

    @CareiOS 对,我用的都是三家的免费计划
    BD8NCF
        7
    BD8NCF  
       12 天前
    NIM 使用域名邮箱也要手机收短信验证,下午试了。
    之前看到有人说 gemma4 可以免费用,看了下,gemma4 要收费的
    longxinglink
        8
    longxinglink  
    OP
       12 天前
    @BD8NCF NVIDIA NIM API 注册获得的 API 里 /models 有 NVIDIA NIM API ,且全程没有绑定任何支付方式,NVIDIA NIM API 并没有付款通道,请问 V 友是在哪里看见 “gemma4 要收费的”
    NVIDIA NIM API 我使用的 xxx.ggff.net 二级域名邮箱和 xxx.de 域名邮箱 都没有复现 V 友说的 “NIM 使用域名邮箱也要手机收短信验证” ,V 友的说法可以复现吗?
    BD8NCF
        9
    BD8NCF  
       12 天前
    @longxinglink
    我用我自己的域名,通过 cf 转 gmail 的邮箱,类似 [email protected] 这样的,确定要手机短信验证,短信内容有“通达文”字样,似乎是国内一家公司代发的。我看手机上去年也收到这个号的短信,不知道是哪家发的验证码,肯定不是 nvidia ,大概他们用的同一家的短信服务。

    gemma4 要收费的意思,并不是说 nvidia 直接收费,是 nvidia 不免费提供,你在 free endpoint 里面找不到。应该是 nvidia 的几家合作商提供的收费主机。

    你看 google 家的模型,
    https://build.nvidia.com/models?filters=publisher%3Agoogle
    gemma-4 就没有 Free EndPoint 字样,只是 Downloadable

    gemma-4-31b-it 部署环节,你就可以看到费用了:
    https://build.nvidia.com/google/gemma-4-31b-it/deploy
    longxinglink
        10
    longxinglink  
    OP
       12 天前
    @BD8NCF
    是否需要手机号验证似乎有他们自己的一套风控逻辑?

    https://build.nvidia.com/settings/api-keys 里生成获得的 key 可以用 gemma-4-31b-it 以及其他模型,

    你说的 https://build.nvidia.com/google/gemma-4-31b-it/deploy 是托管在第三方服务商比如 Bitdeer AI 是需要额外收费
    BD8NCF
        11
    BD8NCF  
       12 天前
    @longxinglink 是我搞错了。他家提供的 api 可以使用 key 直接访问就 ok 了。我以为他家是提供 docker 给你部署然后再访问你自己部署的模型。
    MorningBOBO
        12
    MorningBOBO  
       11 天前
    ollama glm5.1 要收费了 model is experiencing high volume. while capacity is being added, a subscription is required for access: ollama
    liuxue
        13
    liuxue  
       10 天前 via iPhone
    ollama 我尝试了注册,发现用 gmail 也要手机号了
    longxinglink
        14
    longxinglink  
    OP
       8 天前
    @MorningBOBO NVIDIA API 新增包括 z-ai/glm-5.1 、minimaxai/minimax-m2.7 等四款模型,nvidia 免费了
    MorningBOBO
        15
    MorningBOBO  
       8 天前
    @longxinglink 好的,谢谢告知。
    imqiyue
        16
    imqiyue  
       6 天前
    感谢,nvidia 现在上 glm5.1 了
    okface
        17
    okface  
       6 天前
    nvidia 的手机号验证过不了,用的 CF 域名邮箱
    longxinglink
        18
    longxinglink  
    OP
       6 天前
    @okface 老老实实验证手机号吧,一个手机号可以多次验证,实测同一个+44 可以验证 5 次以上
    ycxzfforever
        19
    ycxzfforever  
       6 天前
    NVIDIA 验证的时候提示:
    This phone number has exceeded limits, please try a different phone number or try again later.
    longxinglink
        20
    longxinglink  
    OP
       6 天前
    @ycxzfforever 被验证太多次(几十上百)或者运营商在 nvidia 黑名单内
    Oo0
        21
    Oo0  
       6 天前
    用了下 glm5.1,就是有一丢丢慢,当然免费不能奢求太多
    tinola
        22
    tinola  
       6 天前
    @ycxzfforever 同样,换了几个都是这样。
    njmaojing
        23
    njmaojing  
       6 天前
    谢谢 OP ,不过 nvidia 的 glm5.1 目前是真慢....
    qf19910623
        24
    qf19910623  
       6 天前
    nvidia 要手机号验证,然后验证码又发不出去,一直显示手机号受限制
    yshan
        25
    yshan  
       6 天前
    手机号验证不了,换了几个号都不行
    https://forums.developer.nvidia.cn/t/86-exceeded-limits/28664/65

    官方论坛上也有人报同样的问题
    longxinglink
        26
    longxinglink  
    OP
       6 天前
    @yshan 好像被注册机撸羊毛党搞炸了,我也没法注册
    longxinglink
        27
    longxinglink  
    OP
       6 天前
    @yshan 好像又好了,美国 IP ,接码写+44 xxxx ,很卡但是勉强通过了一个,验证手机号验证了半天
    iorilu
        28
    iorilu  
       6 天前
    nvidia 是一分钟 40 次, 怎么可能 40 并发
    kingwang
        29
    kingwang  
       6 天前
    别浪费时间了,程序员拿那么高的工资这点钱不想出。NVIDIA 的 api 基本上是废的,响应都是分钟级的
    default996
        30
    default996  
       6 天前
    在 cc-switch 中配置了,各种问题……
    gzlock
        31
    gzlock  
       5 天前
    使用 google vioce 验证手机号时,出现以下错误
    The phone number you provided is invalid, please try again.
    yshan
        32
    yshan  
       5 天前
    @longxinglink 有好用的接码平台吗
    longxinglink
        33
    longxinglink  
    OP
       5 天前   1
    @yshan 这个论坛能讲吗 hh ?有一个 0.07 美元,最低充值 6.8 人刀的,搜 5sim
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1557 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 74ms UTC 16:26 PVG 00:26 LAX 09:26 JFK 12:26
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86