boss-skill v3.9.5 发布,聊聊对 Harness 的一点新理解 - V2EX
请不要在回答技术问题时复制粘贴 AI 生成的内容
echoVic

boss-skill v3.9.5 发布,聊聊对 Harness 的一点新理解

  •  
  •   echoVic 1 day ago 1175 views

    Harness 不是让 Agent 更聪明,而是让 Agent 的工作更可信。

    所以这次变更给 Boss 的整条研发流水线加一层工程化的骨架。

    它要管五件事:流程怎么定义,当前跑到哪,产物以什么为准,什么时候允许继续,失败后怎么恢复。

    这次最关键的变化,是加了一层 workflow-plan.json 。

    过去 Boss 里已经有 pipeline pack 、artifact DAG 、runtime commands 。DAG 能表达"哪个产物依赖哪个产物",runtime 能记录阶段和 Agent 状态。但它们之间还缺一层明确的执行定义。

    现在初始化时,会把 pipeline pack 和 artifact DAG 编译成一份 workflow plan 。它描述这条流水线有哪些 phase 、哪些 agent node 、哪些 gate node ,以及这些节点之间的依赖关系。与此同时,workflowHash 、packHash 、artifactDagHash 描述的是"这条流程定义是什么",runId 描述的是"这一次具体执行"。

    这个拆分很重要。

    因为流程定义和运行实例不是一回事。定义可以被审计、比较、缓存;运行实例可以暂停、恢复、失败、重试。以前这些东西混在一起,很多恢复逻辑只能靠约定。现在它们开始有了明确边界。

    我现在会把 Harness 分成几层看

    第一层是定义层。 它回答:这条流水线到底是什么?比如 pack 、DAG 、workflow plan 、各种 hash 。它应该稳定、可比较。

    第二层是运行层。 它回答:这一次跑到哪了?这里靠的是事件流和 execution.json ,而不是聊天上下文。聊天记录不可靠,事件流才是状态真相源。

    第三层是产物层。 PRD 、架构文档、任务拆解、QA 报告、部署报告,这些落盘并被 runtime 记录后,才算正式产物。Agent 说自己完成了,不等于完成了。

    第四层是门禁层。 测试、Evidence Wave 、QA 、final gate ,本质上都是在问同一个问题:凭什么继续?这层是防止"看起来完成了"的关键。

    第五层是恢复层。 比如 promptFingerprint 、inputDigest 、resume --from-run 。它们的目标不是炫技,而是让中断之后不用靠人脑捡现场,也不用全量重跑。

    关于 SKILL.md 的瘦身

    另外这次变更还把主 SKILL.md 从 474 行压到了 99 行。之前它太像一个巨型总控 prompt ,什么都写在里面。这样越复杂,越依赖模型一次性记住,最后又回到"让模型自己记流程"的老路。

    现在主 Skill 只保留入口、不变量和索引。长流程、runtime 命令、Evidence Wave 、platform driver 、hooks ,都拆到 references 里按需读取。

    4 replies    2026-06-04 17:42:14 +08:00
    clemente
        1
    clemente  
       1 day ago
    Harness != skill
    echoVic
        2
    echoVic  
    OP
       1 day ago
    @clemente Skill 定义能力边界agent 能做什么、怎么做。Harness 定义信任边界做到哪了、产物是否落盘、门禁是否通过、中断后能否恢复。

    以前这两层混在一个 SKILL.md 里,结果就是 prompt 越写越长,越长越依赖模型记忆,越依赖记忆越脆弱。现在拆开,skill 轻量化只保留入口和不变量,harness 用事件流和工程结构兜底。两层各管各的,互不牵连。
    clemente
        3
    clemente  
       23h 20m ago
    @echoVic references 也是 skill 的一部分

    skill 服从 渐进式披露 原则 按需加载 skill ,只是 skill 的 desc+name+ CLAUDE.md 或者 AGENTS.md 是默认加载的
    utodea
        4
    utodea  
       20h 49m ago
    看介绍和实现好像不应该再叫 boss-skil 了,可能 oh-my-boss 更符合?
    About     Help     Advertise     Blog     API     FAQ     Solana     5592 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 06:31 PVG 14:31 LAX 23:31 JFK 02:31
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86