给 OpenClaw 做了个安全插件,希望能让主力机器也放心运行 OpenClaw - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
lznwpu

给 OpenClaw 做了个安全插件,希望能让主力机器也放心运行 OpenClaw

  •  1
     
  •   lznwpu 3 月 23 日 950 次点击
    这是一个创建于 32 天前的主题,其中的信息可能已经有所发展或是发生改变。
    最近做了个 OpenClaw 的安全插件,叫 SecurityClaw 。

    主要是因为我自己越来越觉得:
    AI Agent 一旦开始有文件读写、命令执行、插件调用这些能力,风险模型就和普通对话型 AI 完全不一样了。

    但很多本地 Agent 工具在安全这块还比较早期。
    能力发展很快,边界、审计、审批这些机制相对落后。

    现在主流的安全策略还是依赖 prompt 约束,这很依赖模型遵循指令的能力。

    所以我做了个插件,想让 OpenClaw 更安全一些。

    现在大概支持这些功能:

    运行时拦截高危工具调用
    高风险操作审批
    敏感信息检测和脱敏
    OpenClaw 配置安全检查,一键修复
    插件 / skill 风险分析
    事件审计和 dashboard

    开源仓库在这里:

    https://github.com/znary/securityclaw

    这东西还在继续打磨,不过我比较想听真实使用场景下的反馈,而不是闭门造车。

    比较关心几个问题:

    如果 Agent 跑在你的主力机器上,你最在意的风险点是什么?
    你会希望哪些操作默认被拦住?
    你觉得“审批”这件事在日常使用里会不会太打断体验?

    如果大家有想法,欢迎拍砖。
    3 条回复    2026-03-24 09:43:28 +08:00
    samzong
        1
    samzong  
       3 月 23 日   1
    想法很好,而且挺全面的,点个 star
    kylehuangyu
        2
    kylehuangyu  
       3 月 24 日 via iPhone
    我认为如果完全要防止 agent 做任何恶意的行为很难,prompt injection 还有欺骗总能绕开。只有在 container 里面运行,限制 container 的权限
    lznwpu
        3
    lznwpu  
    OP
       3 月 24 日
    @kylehuangyu 嗯,是的,但大部分有实质性的破坏还是通过 tool call 实现的,比如删文件,窃取验证码等,在这一层管控一下会好很多
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2814 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 40ms UTC 11:48 PVG 19:48 LAX 04:48 JFK 07:48
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86