目前的 Agent 是不是皇帝的金锄头? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
isSamle
0.04D

目前的 Agent 是不是皇帝的金锄头?

  •  
  •   isSamle 2 月 2 日 1728 次点击
    这是一个创建于 75 天前的主题,其中的信息可能已经有所发展或是发生改变。

    前情提要:

    1. 从 25 年年头 deepseek 带火了国内大模型氛围后,大部分公司就火急火燎的上马模型项目
    2. 经过一年的模型迭代基本上进化出了具备一定使用价值的各类模型
    3. 从模型训练到模型落地,各种工作流配置、知识库、智能体、自动写代码等等等……
    4. 近段时间发布的 Agent 打通阿里系应用,大龙虾 Clawdbot ,让 AI 帮你操作 XXX……

    个人感受: 结合工作中遇到的情况,感觉现在的发展模式不太得劲,现在相当于让 AI 去分析自然语言,然后借用各种工具接口,去实现各种功能,Agent 和系统是分开的。

    个人想法: 有一个 All-In-One 的想法,个人觉得关键技术应该是“模型记忆”,我们对系统的使用其实是对数据一系列的增删改查,包括现在个人能接触到的 Agent 的模式,也逃不过调用接口、MCP 、Skills 去实现对外部数据的增删改查;另一面,人类设计系统、人类记忆、学习、改变认知、掌握技能、输出知识等一系列过程,也是脑中数据的增删改查。

    核心重点: 解决关键技术:“模型记忆”,可能以一个接口分发网关的形式呈现: 主要解决两个难题:1. 无序输入的有序存储 、2. 有序存储的无限归纳

    1. 当请求模型接口的时候,首先识别用户身份,这决定了后续数据存储的对应域;
    2. 通过分片、嵌入模型、大模型解析的方法,对传入的无序内容进行解构;
    3. 将解构后的内容,在记忆中做一定的检索,然后整合为新的内容;
    4. 通过语境和配置分析是否外部检索,调用传统的接口、MCP 、Skill ;
    5. 最后对所有的内容进行整合输出,并重新分片解构,存入记忆;

    例如: user: 今天 XX 天气怎么样? system:用户是 xxx ,标记数据关联 xxx ; system: 分片:今天、XX 、天气; memory:检索到今天关联数据、XX 关联数据、xxx 关联数据、天气关联数据; system:分析有获取当前日期的需要、分析有调用天气接口的需要; ai: 获取日期、获取天气; ai: 整理内容,输出回复结果; system: 对对话进行切片,记忆:某年某月某日某地某人问过某问题回过某回复;

    记忆的模式:ai 归类--相关日期--相关人--相关地点--相关元素--

    经过对 AI 的调教,我们可以在他们的记忆里存储 N 个 N 维且相关质检有关联的表单(实际不以常规表单呈现,但是通过记忆的有序抽取可以构成一个表单,就类似于你问 XX 班语文成绩,然后回应就是,张三 90 分,李四 100 分…这样的有序类表结构),这个时候就不需要各种各样的系统了,AI 即是系统、AI 即是万物

    flowchart TD A["拦截模型调用"] --> B["解析请求内容"] B --> C["在向量数据库查记忆"] C --> D["携记忆进行整合"] D --> E{"需要外部检索?"} E -- "是" --> F1["构造检索关键词"] F1 --> F2["执行外部检索(知识库/联网)"] F2 --> F3["获取检索结果"] F3 --> F4["整合 请求内容 + 记忆 + 检索结果"] E -- "否" --> F4 F4 --> G["按用户需要的形式返回响应"] G --> H["将过程中的内容写入向量数据库记忆"] 

    看下过年期间有没有空搞个 Demo 出来,有感兴趣一起搞的吗

    2 条回复    2026-02-03 22:01:36 +08:00
    zizon
        1
    zizon  
       2 月 2 日
    你猜大模型为什么叫大模型.

    参数量就是你的模型记忆的概念.

    跟 LLM 交互不一定要用自然语言.
    这个是 OpenAI 挖的坑.

    你看 Google 是可以读极短关键字的.

    模型的推理本质还是搜索召回.

    打个比方,你给的关键信息构成的向量指向越接近你要的状态的空间.
    你就会评价这个模型更好用.

    像 coding,你天花乱坠的各种 markdown 不如给个 example 让它照着抄.
    Twain
        2
    Twain  
       2 月 3 日
    除了几个大厂做的大模型还有点智能的感觉外,其他一些行业大模型都是用的 rag ,rag 顶多算是一个检索系统,算不上什么智能系统
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2889 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 33ms UTC 02:41 PVG 10:41 LAX 19:41 JFK 22:41
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86