


1 iorilu 3 月 12 日 这缓存命中是什么原理 不太可能两人用一样提示词把 还是用了相似性, 差不多了就算一样, 就取缓存? |
2 nativeBoy OP |
3 niubilewodev 3 月 12 日 是的,很多中转站没有缓存,用起来不比官方便宜。 |
4 66beta 3 月 12 日 |
5 dbskcnc 3 月 12 日 deepseek v4 快点出来吧,如果能用 就不需要用 google 了 |
6 asd999cxcx 3 月 12 日 官方上下文会不会不够?我看别人说火山的上下文会多一些 |
7 nativeBoy OP @asd999cxcx #6 当上下文达到 128K 时,roo code 会把上下文压缩 |
8 yangzzzzzz 3 月 12 日 chat 和 reasoner 用起来有什么区别吗 |
9 stefwoo 3 月 12 日 @iorilu 缓存命中不是很简单吗?就是你第一轮对话的时候,会带上第一轮的数据。第二轮对话是带上第一轮和第二轮的数据。第三轮对话是带上前两轮的数据。然后你每次都会命中啊。相当于你每次发给他的就是增量的不太多,大部分都是对话的历史数据。 |
10 iorilu 3 月 12 日 |
12 listenerri 3 月 12 日 @inc3ption #11 是这样的话,如果子代理用的多了也费钱 |
13 asd999cxcx 3 月 18 日 @nativeBoy 我的意思是官方上下文就 64 ,你这 128 根本就达不到.. |