坏了, 我成 eventloop 了 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
cellsyx

坏了, 我成 eventloop 了

  •  
  •   cellsyx 2 月 12 日 2696 次点击
    这是一个创建于 71 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我算是理解为什么网上有多开浏览器窗口和多开终端 Agent 的流程了.

    等待 Gemini 3 Pro 返回选型方案, 等待 GPT 5.2 Pro 生成详细设计文档, 等待 Claude Opus 4.6 生成项目框架, 等待 Gemini 3 Pro 生成前端代码, 等待 GPT-5.3-Codex 生成后端代码和 /review, 等待 Gemini 3 Pro 执行 E2E 测试 等待 Gemini 3 Flash 更新文档和生成 git commit message

    我感觉自己现在和代码里的 eventloop 一样, 处理各个 Agent 的执行完成时的 callback, 期间倒杯水, 站起来走走, 有种在现实世界扮演 async 代码的感觉.

    5 条回复    2026-02-13 11:53:21 +08:00
    cairnechen
        1
    cairnechen  
       2 月 12 日   1
    排除吹逼成分,怎么确定哪个 agent 更适合某个工作的?
    cellsyx
        2
    cellsyx  
    OP
       2 月 12 日   1
    主要考虑的点有两个: 成本, 以及特定需求下的输出质量

    Gemini 3 Flash 是这上面成本最低的模型, 且指令遵从性比 Gemini 3 Pro 要好的多. 从生成 commit message 中的统计文件改动数量和类型以及输出格式这个任务就可以看出来.

    Gemimi 3 Pro 是这上面成本第二低的模型, 拿来生成前端 React 代码还行, 出错不多. 但是 Debug 消耗的对话轮次和要求用户输入额外提示信息要明显多于 5.3-Codex 和 Opus 4.6. 有时候改个 3-4 轮可以解决 bug, 但是代价就是代码越改越乱. 后端代码我目前只大量生成过 Python, 但是经常会有重复代码, 偶尔遗漏修改或者误删代码. 即便有 GEMINI.md 规定代码格式要求, 还是有不遵守指令的情况, 比如 import 会无理由地放在函数内而不是文件顶部, 即时你写明了 Rules也一样会出现. 明明没有循环引用这个问题, 它还是倾向于把改动放到一块连续的区域, 不考虑整体代码需求.

    5.3-Codex 的成本比 Opus 4.6 低, 生成后端 Python 代码的质量显著高于 Gemini 3 Pro , 而且工程的严谨性更强. 最明显的就是 5.3-Codex 写出的测试代码质量更高, 生成项目过程中的返工次数和 Bug 明显更少.

    Opus 4.6/4.5 成本最高, 我是拿他来生成框架或者解决前几个模型尝试多次都解决不了的需求. 比如在前端实现一个搜索并预览本地 PDF 文件, 预览界面需要高亮关键词. 这个需求由于要处理 PDF 中特殊的文字切分或者编码以及字体情况, Gemini 3 pro 对话 5-6 轮都实现不了, Opus 3 轮完成任务.
    Claude 系模型(4.5) 在 windows 环境下(Antigravity 中) Debug 时 Agent 执行动作的准确率不如 Gemini 3 pro, 经常是在 cmd 或者 powershell 中使用 linux 的命令格式. 4.6 的 Agent 表现我还没怎么测, 正在使用中.
    songer
        3
    songer  
       2 月 12 日   1
    我的主观体验是:Gemini Pro 擅长优化前端页面,其他太拉。Codex 擅长严肃的后端开发,具有一定的架构设计能力,速度慢但效果好,claude sonnet 适合需要快速实现的部分功能,主观能力差,适合干脏活。
    lizhiping886
        4
    lizhiping886  
       2 月 13 日
    这不就是自己变成主 agent ,编排其他的 agent
    veightz
        5
    veightz  
       2 月 13 日 via Android
    @songer 同感,claude 用的不多,不做评价,codex 写后端真的不错。gemini 处理非前端也真的不太行…
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2609 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 65ms UTC 10:50 PVG 18:50 LAX 03:50 JFK 06:50
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86