如何实现自我进化的 AI 的 Skills? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
mlfirst

如何实现自我进化的 AI 的 Skills?

  •  
  •   mlfirst 2 天前 443 次点击

    有没有办法能让 ai 自进化,例如实现下面这个需求 我需要使用 playwright-cli + playwright skills 对一个程序进行测试 我告诉他需要测试这个页面或者说爬取某些数据 假设这个平台为 B 站然后我需要获取 B 站热搜条目的前十个视频的链接

    第一次 通过语义识别并自动保存为 skills 或者脚本

    第二次 相同目标直接运行该 Skill 并对每次操作进行综合评分并计算总评分

    第三次 运行 skills 或者脚本 如果出现意外情况 需要降级到下面

    实现: 如果出现错误的操作 重新实现操作 如果存在更优秀的操作 记录该操作 如果出现没必要的操作就删除该操作

    统计分析: 完成后重新计算每步评分和总评分并判断是否需要更新 Skill

    错误回滚: 无法完成该步骤 就会回滚 到该步骤评分最高方法 如果还无法完成 就会回滚 总评分最高的 skills

    主要实现目标 Skill 复用 执行过程评分 反馈优化 Skill 失败回滚 + 策略选择 自我进化

    期望是 能支持本地 cli 直接调用 例如 使用 claude -p "/playwright-cli xxxx" 去安全沙盒执行同时支持多种 cli 做出来的 skill 需要支持版本管理 和 可复用 跨平台使用 这里会使用到 多 skills 怎么让他读取完全部上下文而不丢失 实现持久化对话 和 支持 给 skills 扩充功能 需要返沪数据提取并持久化 支持定时任务 去执行某个任务

    johnsun0821
        1
    johnsun0821  
       2 天前
    你的这个思路,其实就是 hermes agent 的实现逻辑呀,强化了自我反思和持续运行机制。
    实现逻辑
    用户交互 → 工具调用 → 任务完成

    自主技能创建 → 技能自我改进

    持久化记忆 (MEMORY.md, USER.md)

    FTS5 会话搜索 + LLM 摘要

    Honcho 辩证式用户建模

    下次对话:注入记忆 + 用户模型 → 更好的响应
    Zephyrrr2333
        2
    Zephyrrr2333  
       2 天前

    这段视频介绍了 TanStack AI Code Mode ,一种优化应用中 LLM 工具调用的新方式。传统的工具调用方法往往效率不高,导致上下文占用高,并且需要多次往返服务器( 0:00 - 1:56 )。
    Code Mode 的主要特性包括:
    **基于 TypeScript 的执行:**
    Code Mode 不再强制让 LLM 直接调用工具,而是让 LLM 生成 TypeScript 代码,然后在隔离环境中执行( 2:03 - 2:36 )。对于数据处理和计算这类任务,这种方式明显更快,也更准确( 2:38 - 3:14 )。
    **性能提升:**
    视频展示了在执行复杂任务(例如计算产品的平均成本)时,LLM 调用次数大幅减少(从 4 次降到 2 次),上下文使用量也显著下降(从 9.8KB 降到 1.7KB )( 2:38 - 2:50 )。
    **Code Mode Skills:**
    这一功能允许 LLM 保存并复用它生成过的有价值代码片段,把它们转化为可重复使用的技能。对于重复性任务,这会进一步提升性能( 4:35 - 5:43 )。
    **广泛的能力:**
    Code Mode 可以与多种后端集成,包括数据库,用于生成 SQL 和动态 UI 组件,从而动态处理复杂的报表任务( 5:48 - 7:10 )。
    Jack Herrington 鼓励开发者克隆 TanStack AI 的 monorepo ,亲自探索这些功能,包括数据库集成和动态 UI 示例( 7:13 - 7:40 )。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2950 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 29ms UTC 01:57 PVG 09:57 LAX 18:57 JFK 21:57
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86