最近取消订阅了多家厂商的包月 token 服务,现在纯按 token 量消费, 因为它们都有降智问题。 - V2EX

最近取消订阅了多家厂商的包月 token 服务,现在纯按 token 量消费, 因为它们都有降智问题。 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

请不要在回答技术问题时复制粘贴 AI 生成的内容

主要的问题是这些厂商，它的后台的模型并不总是用了它的主力的模型，会在后台降智。
智谱的这个 GLM 4.6 ，新出的 Minimax M2 ，一开始挺好的，服务一有压力就乱来。只要这些模型出 token 的速度一提升，就知道开始降智了，用了次一档的东西。造成的结果就是写出来非常烂的代码，写出来一个文件，每个函数都是错误的，然后我要给他擦屁股几个小时。这太可怕了，浪费我的大量的时间，去给他他们的模型提供优化数据。还不如老老实实消费 token 去。

12 条回复 2025-11-15 23:59:55 +08:00

1

zzutmebwd

12 小时 29 分钟前

牛马们如果都有活一多就降低工作质量的觉悟就好了。

2

CC11001100

10 小时 23 分钟前

@zzutmebwd 实际上人的负载一旦高了之后出错率就会不由自主的升高，领导们有时候也会靠这个来辅助判断压榨牛马的性能极限。。。

3

musi

8 小时 52 分钟前 via iPhone

@CC11001100
jd 上叫抗压能力
面试时叫压力测试

4

Seck

7 小时 47 分钟前

听了楼上的 3 层楼，醍醐灌顶，摸鱼摸鱼

5

YanSeven

7 小时 14 分钟前

什么意思，没看懂，是在说同一个厂商推出的“包月服务”里面的模型会出现降智以次充好的现象，而该厂商的以 api 充值的方式则不会吗。

6

mightofcode

7 小时 0 分钟前

自己掌握生产力是多麽重要

7

dbow

OP

6 小时 50 分钟前

@YanSeven 包月服务里，厂商有明显的动态调度，节省资源的情况，用次一等规模较小的模型，临时取代规模大的那个，以获得得快的 token 输出，以及服务量，但是输出的代码就差了很多，　小模型不仅 token 成本低，并发服务能力也好的多。

8

kneo

6 小时 10 分钟前 via Android

按 token 付费不降智吗？

9

dbow

OP

6 小时 1 分钟前

@kneo 部分第三方厂商会用量化版本来忽悠客户，但通常不会用小模型来替代，我觉得花点钱是次要的，出了垃圾代码要我花几小时修正才最恶心。

10

bobohu

4 小时 39 分钟前

GLM 4.6 两天我用了 100 万 token ，太可怕了

11

Linioi

4 小时 2 分钟前

@bobohu 一百万 token 也就是 1M ，这用量挺小吧，我一小时可能就要好几 M 了。

12

bbbblue

2 小时 18 分钟前

minimax m2 套餐不是才刚上吗。。。这么快就试出来降智了？

关于帮助文档自助推广系统博客 API FAQ Solana 1042 人在线 最高记录 6679

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 27ms UTC 18:18 PVG 02:18 LAX 10:18 JFK 13:18
Do have faith in what you're doing.

ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86