[开源] 视觉状态机 + Electron,让 AI 自己操作微信/企微/WhatsApp - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
jacsice

[开源] 视觉状态机 + Electron,让 AI 自己操作微信/企微/WhatsApp

  •  
  •   jacsice 10 天前 1269 次点击

    写了个东西,开源了:sightflow.dev (代码会在本周同步在 GitHub ,同步在网站上)

    一句话:给大模型装眼睛和手。它能自己打开微信、企业微信、WhatsApp ,像人一样看界面、读消息、打字回复。

    不是 API 套壳因为这几个平台根本没给开发者开放可用的 API 。

    核心方案:

    • 视觉自动化状态机(看窗口、切任务)
    • Electron 跨桌面
    • 键盘模拟 + 状态流转

    最难的部分(视觉执行层)我已经啃完了,代码已开源。上层留了一个本地 Skill Server ,你只需要写业务逻辑(比如自动客诉、销售跟进、群回复),不用碰底层。

    适用场景:

    • 无 API 的私域自动化(客服、销售、运营)
    • 跨 WhatsApp / 微信 / 企微的统一消息处理
    • 任何需要“AI 模拟人操作桌面软件”的场景

    为什么搞这个? 因为全球 5000 万+ 企业用 WhatsApp Business ,中国 1200 万+ 企业微信用户,但官方接口要么没有,要么贵得离谱。AI Agent 想落地到最赚钱的业务场景,绕不开这些平台。

    现状:

    • 视觉执行层稳定,可直接 clone 跑 demo

    有场景的开发者欢迎 clone 下来跑一跑,也欢迎讨论。

    第 1 条附言    7 天前
    19 条回复    2026-04-18 15:52:11 +08:00
    MoozLee
        1
    MoozLee  
       10 天前
    关注下,可以在 rpa 数据采集中使用吗
    partner666
        2
    partner666  
       10 天前
    能把我打副本吗
    510908220
        3
    510908220  
       10 天前
    看起来很有意思,体验体验
    xialaoban
        4
    xialaoban  
       10 天前
    识别速度能做到打游戏的话!
    cairnechen
        5
    cairnechen  
       10 天前
    怎么解决模型视觉识别的坐标漂移的啊? opus4.6 视觉识别 800×600 的图片都会缩放 官方说的 1580px 根本做不到
    haoxuexiaoyao
        6
    haoxuexiaoyao  
       10 天前
    网址呢
    v1
        7
    v1  
       10 天前
    但官方接口要么没有,要么贵得离谱

    你猜猜能撑多久不封号?
    Ghostsss
        8
    Ghostsss  
       9 天前
    视觉应该是后面发展的一个方向。不过识别 定位 理解 执行 这一串流程,我到现在都没有完全走通,期待
    Ghostsss
        9
    Ghostsss  
       8 天前
    非常不错的思路,使用归一化坐标,从来没想过的方向。
    jacsice
        10
    jacsice  
    OP
       7 天前
    cairnechen
        16
    cairnechen  
       7 天前
    @jacsice op 你有用通用模型试过这套流程吗?
    caoyang5689
        17
    caoyang5689  
       7 天前
    npm error command git --no-replace-objects ls-remote ssh://[email protected]/shiflow2023/robotjs.git
    npm error [email protected]: Permission denied (publickey).
    这个依赖没放开,win 可以推一个安装包到 git 不
    510908220
        18
    510908220  
       7 天前
    @cairnechen #16 npm error An unknown git error occurred
    npm error command git --no-replace-objects ls-remote ssh://[email protected]/shiflow2023/robotjs.git
    npm error [email protected]: Permission denied (publickey).
    npm error fatal: Could not read from remote repository.
    jacsice
        19
    jacsice  
    OP
       6 天前
    @cairnechen 跑过,能正常运行的
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     999 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 4ms UTC 22:58 PVG 06:58 LAX 15:58 JFK 18:58
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86