
1 frandy 9 小时 10 分钟前 了解下 langchain4j 或者 spring ai ,不需要自己从头写,2023 年的时候自己写过,原理是将 AI 和人的对话存储到数据库,按照时间排序,然后每次新的对话,就把之前的对话一起拼起来扔给模型,是的,没错,就是这么做的,你去看一些成熟的框架,也是这么做的,好的是,可以根据对话轮次或者文字长度,进行截取。为什么这么做?因为受限于大模型的 token 最大值不是无限的 |
2 MIUIOS 9 小时 4 分钟前 楼上说的基本没错,找下现成框架没必要自己手撸,人家带全套的生态工具,直接套用就行了,都是调 api 只是看谁调的花。 |
3 aisk 8 小时 57 分钟前 拿过去的用户输入,或者做了简单关键词命中的输入,给大模型解析一下让它提取关键信息成你想要的格式,写到 es 里? |
4 Solix 8 小时 52 分钟前 via iPhone 找个开源记忆项目,vibe coding 重构成 java 结束 |
5 maolon 8 小时 50 分钟前 长期记忆一般分为几种做法 1. 个人 profile ,这种提取信息结构化存 json ,一个用户有且只有一个,读的时候固定读取,用 rdb 就行了 2. 知识库/摘要信息,这种就是你现在用 es 在做的事,但是更常见的做法是存 vector db(然后走 rag 那一套),或者走 graph db 那一套(知识提取为三元组,具体看是哪种类型的知识),这两种市面上都有很多开源库的实现 3. 行为记忆/日程,也就是最近有什么 events/日程之类的,一般用于 recall 用户最近行为(而且需要准确 recall ),很多人会把这个功能合并到知识库里(但是这种一般是 time sensitive ,所以直接合并知识库其实不是特别好管理) 然后在此之上,就是记忆的读取/业务层,比如语义检索,关键字检索,retreive ,trim, summary function 之类的东西,这个看你们业务怎么做了,都是自由发挥 记忆读取出来都是拼接回当前的 context 内(你可以简单理解为 prompt ,但是我更愿意叫他 context ),然后调用模型 api |
6 soap0X 8 小时 49 分钟前 via Android 大模型是无状态无记忆的。最好向量库,不要用传统的库(最近看搜索知道了向量库回想了下之前的知识库,但这里我没实践过) | ||