V2EX sillydaddy
$V2EX
Solana
Give SOL to Copy Address
使用 SOL 向 sillydaddy 打赏,数额会 100% 进入 sillydaddy 的钱包。
 sillydaddy's recent timeline updates
sillydaddy
5.47D
4.89D

sillydaddy

V2EX member #472822, joined on 2020-02-27 19:30:20 +08:00
Today's activity rank 5
MOD
Has privileges to move topics
sillydaddy's recent replies
1 day ago
Replied to a topic by ixixi Vibe Coding 需要这样一个功能
做好了,可以售卖,保证火!就像那只特制的,只有“Accept/Reject”2 个按键的键盘一样。
这到底是 bug 还是 feature ,搞不懂了。我最近把代理客户端从 shadowsocks 换成了可以开 tun 模式(虚拟网卡模式)的 clash ,终于可以用上 Opus 4.8 了。属于是被逼着学习新东西了,不过 Clash 确实好用。
有点意思啊,我前不久才了解到有 Remotion ,我还以为它只是做成品视频的。
我还纳闷说怎么没看到你说的视频,原来还可以用 web player 这样做,而且里面的文本都可以选中。
学习了。感谢 OP 分享。
主要是不好换算。没有一个合适的基准。我觉得一个比较好的基准是,未缓存输入 token 与 credit 的交换比例,接近 1:1 。

cached input: 1000 万
non-cached input:20 万
output:5 万

这样非常容易在 token 和花费之间估算,上面的都折算成 non-cached input:1000 万/50 + 20 万 + 5 万*2 = 50万。对于 DeepSeek V4 Flash ,就是 0.5 元。
内卷是说效率低,把大量时间或资源,耗费在很小的提升上,比如农业上的精耕细作,比如为了竞争分数而鸡娃学习和考试那些不必要的东西。为这些东西的大量付出带来的价值微乎其微。

AI 编程是这样吗?感觉这 2 个不搭边啊。个人或者公司消耗 token ,肯定是为了带来价值,比如节省开发时间或精力,这些省下来的当然是价值。也一定会产生对应的后果,比如总财富增加,总劳动时间减少。换句话说,如果没有带来任何改变,你为什么要用 AI 编程呢?假如你说是为了不落后于同事,那好,假如你们公司所有人都是因为竞争压力而采用 AI 编程,那这种竞争带来了什么呢?公司的生产效率有没有提高?公司的产出有没有增加?增加了的话,社会总财富就会增加,那么要么工资增加,要么就是工资不变但购买力增加了。你说的「时间和钱也没变多」,是不符合常理的。
@TuTouPower 反正雷死人不偿命。。实际是现在区分了缓存 input 和未缓存 input ,但大众哪懂这个,直接简单粗暴 2 亿->110 亿,7 亿->380 亿,多直接!等你把中转站挂出去,回过味来,你也不能骂他,因为它用量确实比以前多了几倍。厉害吧。
又一个被小米套路到的,不是一千亿 token ,是一千亿 credits 。每个 token 现在消耗几百个 credits 了。
@sillydaddy #4 上面的例子算错了,10 轮命中率=550000/650000=85%。
一般用 claude code 这类 agent ,缓存会占比很大,一般都会在 90%以上。因为它要经历 thinking..action..thinking..action 这样很多轮,轮次越多,缓存占比越大,因为每一轮都会把之前轮的那些输入喂给大模型,这些就是缓存。

假如每轮新输入 10000 个 token ,那么 10 轮后,未缓存的就是 100000 个 token ,缓存的呢? 10000+20000+30000+...+100000=5550000 ,缓存命中率=5550000/5650000=98%

实际要考虑上下文超出会压缩,导致原来的缓存失效。但缓存命中率只跟 Agent 工具的用法有关系,Agent 模式一般都能到 90%以上,除非你特意优化 Agent 的流程,减少缓存的占用,比如使用定制的流程去处理,例如那些 AI 视频生成管线,把流程前一环节的输出经过筛选,作为下一环节 API 调用的输入,而不是堆积信息,这样会减少缓存。

这是我用 claude code 调用小米 token plan 处理文本提取信息,这个场景下的消耗(缓存占比非常大,命中率 97%,这种情况下,可用量确实提高了 10 倍左右):
https://v2ex.com/t/1215750#r_17686925

不过,小米套路多倒是真的。
@LittleTree 可能是国内国外的不匹配?我的 token plan 是走的新加坡。
About     Help     Advertise     Blog     API     FAQ     Solana     905 Online   Highest 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 31ms UTC 21:07 PVG 05:07 LAX 14:07 JFK 17:07
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86