最近在评测一些 Claude 中转站,发现一个大坑,写出来给大家避一避。
先说结论:选中转站,必须确认它真正支持提示词缓存。不支持的、或者用"假缓存"的,单价再便宜也是陷阱。
为什么这是个坑?
Claude 官方接口有个特性叫提示词缓存:把长系统提示词、长上下文缓存住,5 分钟内复用,缓存读取价格只有正常输入的十分之一( Sonnet 是每百万 token 0.3 美元 vs 3 美元)。
写入缓存本身比正常输入略贵(每百万 token 3.75 美元),但只要后续命中,平摊下来非常划算。
为什么有些中转站会一直在写缓存?
我研究了一下,主要有三种情况:
1:号池不稳定,频繁切换账号。每换一个账号,缓存就重置一次,等于永远在重新写入。
2:Kiro 逆向渠道本身就没有缓存。市面上你看到的所谓"Kiro 逆向"都是假缓存,Kiro 没有返回缓存读写信息。
3:中转站自己写的假缓存代码计费有问题。前端账单页面给你显示有缓存读写,实际计费逻辑是错的
真实账单对比
我手头两个站的数据:
A 站(无缓存,每次都在写):

6 次请求,每次缓存写入约 6 万 token
单次成本 0.11 到 0.13 美元
总计约 0.73 美元
B 站(真缓存):

第一次写入 6 万 token ,后续全部命中缓存读
缓存读 6 万 token 的成本约 0.018 美元
4 次请求总计约 0.16 美元
同样是分组倍率 0.5x ,同样模型( Sonnet 4.6 ),同样上下文规模,成本差了 4 倍以上。请求次数越多、对话越长,差距会被指数放大。
怎么自查?
打开你的中转站账单页,看每条记录的 token 明细:
一直显示几万、几十万缓存写入,几乎不出现缓存读 → 有问题,跑路
第一次写入后,后续大量出现缓存读、写入只有几百 → 正常
建议
充值前先小额测试,连续发几条请求,看缓存读是否生效
如果发现一直在写缓存不读,立刻停用,能退款就退款
便宜的单价 × 永远在写入的"假缓存" = 比官方还贵。别被"分组倍率 0.1x"骗了。