转发一篇好文 《What We Talk About When We Talk About Agent Infra》 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
d0r1an
V2EX    程序员

转发一篇好文 《What We Talk About When We Talk About Agent Infra》

  •  
  •   d0r1an 1 月 30 日 1654 次点击
    17 条回复    2026-02-06 21:53:54 +08:00
    maolon
        1
    maolon  
       1 月 30 日
    有意思, 所以他的意思就是把 agent 的 workfow 应拆净拆到一个 atomic 语义的步骤然后把各个步骤固定化和容器化以应对 scale 和不确定性问题?
    d0r1an
        2
    d0r1an  
    OP
       1 月 30 日
    @maolon 是的,超强的抽象能力
    d0r1an
        3
    d0r1an  
    OP
       1 月 30 日
    我按照这个抽象实现了一个 SkillBox

    https://github.com/boxlite-ai/boxlite/pull/170
    Reminders
        4
    Reminders  
       1 月 30 日   2
    agent 执行环境的不隔离,执行过程产生的副作用的确是现实问题。

    如果把 skills 和执行环境打包,做到无外部依赖、无副作用、可重用、规模化。也许是个不错的方向。
    d0r1an
        5
    d0r1an  
    OP
       1 月 30 日 via iPhone
    Reminders
        6
    Reminders  
       1 月 30 日
    @d0r1an #3 我没太明白这个怎么使用,是在 python 中调用这个 SkillBox 么,这个 SkillBox 是不是也应该像 docker 一样提供一个打包好的 image 呢?
    d0r1an
        7
    d0r1an  
    OP
       1 月 30 日 via iPhone
    @Reminders 这个 skill 是跑在微型虚拟机里面的,独立内核。目的是让 agent 或者 app 调用,例如文章提到的 buy coffee skill
    Reminders
        8
    Reminders  
       1 月 31 日
    @d0r1an #7 意思是,如果把项目部署在服务器上,我想为每一个用户分配一个 skill_box ,那么每个用户都可以通过

    boxlite.SkillBox() as skill_box

    创建一个 skill_box 使用是吗?无法服务重启,用户可以无负担在再次创建出一个 skill_box 重新使用嘛?
    Cbdy
        9
    Cbdy  
       1 月 31 日
    有趣的思路
    d0r1an
        10
    d0r1an  
    OP
       1 月 31 日 via iPhone
    @Reminders 是的
    liuchao719
        11
    liuchao719  
       8 天前   1
    和我之前的一个想法特别类似,agent 现在要处理的逻辑层次太多了,每一层都会带来不确定性。或许还有一种思路是,每次遇到不确定性就分配一个 subagent 处理不确定性。因为与其手动封装各种可重入节点,不如让 llm 自己去划分任务的逻辑层次。
    d0r1an
        12
    d0r1an  
    OP
       7 天前
    @liuchao719 可以一起讨论下,精进整个思路和实现
    liuchao719
        13
    liuchao719  
       4 天前 via iPhone
    @d0r1an 之前不是有人指挥好几个 Agent 干活,人只需要像自己有点像 leader 一样规划就行。其实这个思路是把 agent 作为 leader ,让他去安排一些子 Agent 去做细分的活儿。这样子,Agent 就能够自己去处理一些不确定性的东西,减少了上层 Agent 的一些认知负担。可以嵌套两三层这种架构,专门拆解复杂问题。但我这个想法应该是去年的,现在应该已经有类似的 Agent 架构出来了,只是我还没时间去研究。

    然后最近不是 skill 很火嘛,然后还有那种自学习的 skill ,其实对于一个层级上的子 Agent 来说,如果每次划工分给他的问题是合理的,那么我觉得他很快就能自学习出一整套 skill 来,其实很像公司的架构了。
    d0r1an
        14
    d0r1an  
    OP
       4 天前
    @liuchao719 Interesting insight 。我琢磨下
    liuchao719
        15
    liuchao719  
       3 天前
    @d0r1an 我有了一些新想法:
    理想状况下 Agent 是一定要完成任务的,但是考虑到现实情况,有可能我们也不能清楚 Agent 能不能完成任务,只是先把任务交给它试试(比如大部分不懂技术的人用 clawdbot 的时候)。这时我们不是想让 Agent 一条路走到黑,然后告诉我他干不了,而是希望 Agent 在执行的过程中,如果过于困难,就向上请求支援。

    这个机制还可以应用在多层 Agent 架构中。面对复杂问题,首先分散出一堆子 Agent 探索,子 Agent 如果过于困难,则向上汇报,主 Agent 再根据子 agent 执行结果,综合评定最小解决代价后继续灵活改变计划,或寻找其他解决方案。
    liuchao719
        16
    liuchao719  
       3 天前
    目前无论是我自己用 AI ,还是观察别人用 AI ,都有一个核心问题:当前 AI 无法感知到所有执行环境。比如一个 API 不通,究竟是网断了?还是梯子挂了?还是服务有问题?可能我们刚好忘记告诉它了某个事实,导致它在执行的过程中一遍遍尝试,浪费很多 token 和时间。但如果 AI 能够“浅尝辄止”并向上反馈,再结合自总结 skill 的机制,把人类的反馈记下来,我觉得 AI 未来应该会是很好的助手/帮手,而非仅仅是一个高效率的执行者。
    d0r1an
        17
    d0r1an  
    OP
       2 天前
    @liuchao719 这就是真正的 AI 同事,AI 实习生,遇到不懂的事情要知道向 mentor 求助
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     4353 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 36ms UTC 09:26 PVG 17:26 LAX 01:26 JFK 04:26
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86