有大佬用过 browser use 吗?效果怎么样? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
guiyumin
V2EX    程序员

有大佬用过 browser use 吗?效果怎么样?

  •  
  •   guiyumin
    guiyumin 16 小时 42 分钟前 1341 次点击

    似乎很火,但不知道效果如何

    都用于什么方面呢?爬虫?

    如果搞一个 app use 会有人用吗

    第 1 条附言    13 小时 9 分钟前
    https://github.com/mobile-dev-inc/maestro

    我昨天发现这个

    感觉很牛逼的样子

    所以特此来问问有什么应用场景
    10 条回复    2025-10-15 17:52:15 +08:00
    BingoW
        1
    BingoW  
       14 小时 36 分钟前
    之前用过,效果一般。现在用 codex 配合 chrome Devtools mcp ,效果挺不错的。你自己研究搞搞可以的,想商用赚钱就算了,因为大厂出新产品太快了,你细细打磨一年的产品,人家看到了觉得不错,分分钟出个替代品。
    sacuba
        2
    sacuba  
       13 小时 51 分钟前
    还有 nana browser ,都是反应太慢了,得有特定场景然后针对性微调模型之后才可用。
    ygweric
        3
    ygweric  
       13 小时 47 分钟前
    我研究过源码,写的很精妙。

    用处主要是:智能助力、UI 测试,这样子成本可以和应届生的工资比较便宜很多。

    爬虫不可能,非常慢,而且 token 的图片识别还是非常贵的,不划算。
    yejjgo
        4
    yejjgo  
       13 小时 16 分钟前
    最开始尝试用来结合大模型做自动化测试,效果不稳定,后来换成生成自动化脚本再使用的方式还挺不错
    guiyumin
        5
    guiyumin  
    OP
       12 小时 53 分钟前 via iPhone
    @yejjgo 嗯,对的,大模型还是不稳定
    cz5424
        6
    cz5424  
       12 小时 16 分钟前
    一般用来让 ai 调试网页进行 debug
        7
    coefu  
       11 小时 18 分钟前
    底层实现是用的 playwright ,只是把人看到的 web 页面上的 物件 利用 LLM 对话 映射到 playwright 里的组件,做的就是中间这层转换。实际效果不会太好。
    gongym
        8
    gongym  
       10 小时 26 分钟前
    说到无头浏览器,我发现了这个好像很牛
    https://github.com/lightpanda-io/browser
    GiantHard
        9
    GiantHard  
       7 小时 8 分钟前
    我试了 playwright-mcp 跟 chrome-devtools-mcp ,主要场景是用 claude code 帮我执行 UI 测试,这俩 mcp 主要用 Accessbility API 给 LLM 描述页面的状态,在 playwright-mcp 中,这个功能叫 snapshot ;而现有的系统在可访问性方面做的不太好,以至于 GLM 4.5/Claude Sonnet 4 都会被很简单 UI 交互卡住,例如,滚动 Antd 4 Tree 组件的虚拟列表,我手动截图页面让 LLM 识别的话,LLM 都能知道应该用滚轮事件向下滚动,但如果只提供 Snapshot 的话,这些模型会被卡住很久并最终撂挑子。所以个人感觉在 UI 测试的场景中,还是基于视觉( screenshot )的方案更优。

    最近再调研的时候,发现 Google 整了一个新的 Computer Use 模型,能够基于截图跟浏览器交互,看演示视频的效果还不错,但是限定只能用 gemini-2.5 的一个实验性版本。
    Cheez
        10
    Cheez  
    PRO
       5 小时 27 分钟前
    @ygweric 你可能想错了。以前是 website -> 手写代码 -> data or error -> 再次手写代码
    现在是 website -> AI 代码 -> data or error -> 再次 AI 代码

    也就是说,是用 AI 来制作 website to data 的算法,而不是让 AI 去当这个“算法”。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2667 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 15:19 PVG 23:19 LAX 08:19 JFK 11:19
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86