看到论坛里面不少人借助 AI 可以轻松搞定某某小项目,我试了下怎么感觉 AI 的输出问题很多啊 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
xFrank
V2EX    程序员

看到论坛里面不少人借助 AI 可以轻松搞定某某小项目,我试了下怎么感觉 AI 的输出问题很多啊

  •  
  •   xFrank 9 天前 4793 次点击
    我在尝试搞一个安卓的记忆游戏相关应用(原来有过一些安卓开发经验,不多)。
    AI 的输出大部分问题很多,都要经过大量修改优化才行。

    相对而言,谷歌的 Gemini 输出最好( 2.5pro ,免费额度比较少)。
    豆包、grok 、chatgpt4 、Qwen3-Coder 输出质量都非常差,大部分连编译都过不了,游戏逻辑也无法满足基本要求。
    业余时间搞了两周了也还没搞定

    你们的 AI 都这么好用么。。。
    42 条回复    2025-10-09 15:42:25 +08:00
    lxz6597863
        1
    lxz6597863  
       9 天前   1
    claude sonnet
    Alias4ck
        2
    Alias4ck  
       9 天前
    试试 codex 和 claude code 就知道了 豆包是什么东西
    Alias4ck
        3
    Alias4ck  
       9 天前
    而且使用 agent 工作不要问答的 问答反馈很慢
    kamikaze472
        4
    kamikaze472  
       9 天前
    V 友都是 Claude Code 和 Codex, 你用 GPT-4 当然编不出来
    kelo6
        5
    kelo6  
       9 天前
    写完之后让他自己写单元测试,自己修复问题
    kelo6
        6
    kelo6  
       9 天前
    不过你说的这几个模型是不行
    SeduceQAQ
        7
    SeduceQAQ  
       9 天前 via iPhone   29
    大伙儿都是劳斯莱斯奔驰,你坐马自达
    AastroLula
        8
    AastroLula  
       9 天前   1
    @SeduceQAQ 谢谢你给我开启的快乐的一天
    Mystery0
        9
    Mystery0  
       9 天前
    https://xgkb.mystery0.vip 昨天花 5 个小时左右 vibe 出来的,不过这上面的文案图标这些是以前就有的
    全程除了搭建项目是问 gemini 给的步骤之外,代码生成全部是 webstorm 的 junie 做的
    xFrank
        10
    xFrank  
    OP
       9 天前
    @SeduceQAQ 纯玩团,没有奔驰预算
    94
        11
    94  
       9 天前
    如果 [免费模式] 的都在几轮简单对话中达成预期,那么 [付费模式] 应该是一种什么样的畅想了……
    做一个完整的项目 VibeCoding 出来的多多少少会有一些问题。但是一般都能跑起来,跑不起来直接把报错贴出来给 AI ,让他自己解决就好了。

    大概可以参考 2 年前林亦 LYi 关于机器学习项目的实践中的 AI Chat History
    [street-fighter-ai/README_CN.md at master linyiLYi/street-fighter-ai]( https://github.com/linyiLYi/street-fighter-ai/blob/master/README_CN.md)
    whoosy
        12
    whoosy  
       9 天前
    codex ,claude code ,你是一点细糠都不肯吃啊
    SayHelloHi
        13
    SayHelloHi  
       9 天前
    现在用 AI

    先把大需求分割成小需求

    有问题就修改直到当个小需求基本上是正确的+可运行的

    自己把小需求合并起来 基本上没啥大问题了 修修补补用下

    PS:

    一开始就丢一个完整的需求给 AI AI 有时候真的是一本正经的胡说八道
    jko123
        14
    jko123  
       9 天前
    AI 生成雏形 10 分钟,让 AI 整改 N 小时-N 天
    yjxjn
        15
    yjxjn  
       9 天前
    你要是一句话说你给我做个淘宝,那肯定 AI 达不到。
    首先,模型要选好,CC ,CodeX 最佳。
    其次,提示词要好好写,Rules 也要有,要把所有需求一步一步拆解(对于开发来说就容易多了)
    再次,做完一部分发现没问题就 commit ,防止瞎改。
    这是我前期模板靠 AI 生成,后期需求自己改+AI 改做的一款 markdown 笔记。
    https://github.com/jetyu/NoteWizard
    Asimov01
        16
    Asimov01  
       9 天前
    @Mystery0 请问下朋友,是指 https://xgkb.mystery0.vip 网页,还是 西瓜课表 这个 APP 呢?我看这个 App 的仓库有 700+ commit ,不像是 5 个小时能弄出来的
    mightybruce
        17
    mightybruce  
       9 天前
    直接用 AI 是无法感知上下文和做一些复杂地功能地,除非你自己去写一个编程 agent 来做各种上下文管理以及 MCP 、长短记忆以及执行,所以你需要先去用用 claude code 以及 codex cli, 等你懂了如何开发 AI agent, 可以自己写一个更加贴近业务的 agent 出来,这个根据公司内部脚手架(未开源的那种)代码和文档以及各种架构图设计就能自动生成公司的项目已经是搞 AI 创业 和一些软件公司的产品方向,随便给一个比赛,大家可以看看

    https://competition.atomgit.com/competitionInfo?id=1a3e1f9990e267464c8d1bbef2bee337#heading-1-0


    赛题 3:复杂代码生成 DeepCodeResearch

    赛题描述

    本赛题要求参赛者设计并实现复杂代码生成任务,让智能体先做自主研究,再设计和实现项目代码。



    支持多技术文档输入,如方案详细设计文档、paper 、流程图、技术框图等形式;文档类型涵盖 PDF 、PPT 、DOCX 、TXT 等格式

    先做深度研究,再做代码生成

    支持 web search

    产出 repo-level code

    自主探索、自主设计、自主编码实现/调试/修复

    支持 human-in-the-loop


    技术考察点:



    Agent 对于外部文档/知识库的自主深度理解和洞察的能力

    多模态知识检索的能力( Multimodal RAG )

    长短期记忆依赖与超长上下文管理

    Code Agent 的自我反思能力( bug shooting )
    j6711
        18
    j6711  
       9 天前
    @SeduceQAQ 谢谢你,比喻侠
    Mystery0
        19
    Mystery0  
       9 天前
    @Asimov01 网页 app 是我自己写的
    ynxh
        20
    ynxh  
       9 天前   2
    hengshenyu
        21
    hengshenyu  
       9 天前 via Android
    @Mystery0 深色模式切换有点 bug ,会闪一下。
    Kimipoker
        22
    Kimipoker  
       9 天前
    @Mystery0 junie 这个是用的什么模型呢? 自己配置吗
    fbu11
        23
    fbu11  
       9 天前
    想免费白嫖个好用的是不可能的,只有花钱,当然像“Claude Code”这种,你想给它花钱也麻烦,毕竟 Anthropic 已经……
    lscho
        24
    lscho  
       9 天前
    1.大伙儿都是劳斯莱斯奔驰,你坐马自达
    2.都是劳斯莱斯车技也分高下,prompt 也是一门严谨的学科
    AreYou0k
        25
    AreYou0k  
       9 天前
    @SeduceQAQ #7 保守了, 它这直接问, 都没上 cli 或者工具, 撑死算是电动车
    asdf12303116
        26
    asdf12303116  
       9 天前
    @Kimipoker 设置可改 gpt5/sonnet3.7/sonnet4,默认 gpt5
    hnbcinfo
        27
    hnbcinfo  
       9 天前
    别用那么多乱七八糟的东西了,你这个需求,找个 AI 编程助手,如 Cursor 或 augment code ,随便选一个用就够了。输出的基本没啥问题
    wick
        28
    wick  
       9 天前
    我觉得我用 cursor 什么都能写 除了原子弹不能造
    luworld
        29
    luworld  
       9 天前
    @SayHelloHi 如何分割为小需求?是分割成一个一个的小模块,然后函数调用吗?
    liyi123
        30
    liyi123  
       9 天前
    先构建整体架构,如何安装功能模块一个一个让 AI 开发,每个功能模块开发完成提交代码到 GitHub ,测试每一个功能模块是否存在问题,智能体开发时选择对应的工作文件空间,这样子成型的项目比较好,同样模型选择也是比较重要:claude 泛化比较好,可以用来做架构设计开发,codex 幻觉小一点可以局部修改
    wxw752
        31
    wxw752  
       9 天前
    鉴定为需要氪金,走了去下一贴
    Promtheus
        32
    Promtheus  
       9 天前
    你讲的那些谁用啊 不都是 claude sonnet 吗
    visper
        33
    visper  
       9 天前
    论零元党萌新和氪金大佬的区别。
    florentino
        34
    florentino  
       9 天前
    有没有 jetbrains 下面能用的啊
    Mystery0
        35
    Mystery0  
       9 天前 via Android
    @Kimipoker 刚刚打开 ide 看了一下,是默认的 gpt-5 ,没有调过
    Mystery0
        36
    Mystery0  
       9 天前 via Android
    @hengshenyu pc 和移动端都没有复现呀
    ovtfkw
        37
    ovtfkw  
       9 天前 via iPhone
    出来了就吃点好的先
    Mystery0
        38
    Mystery0  
       9 天前 via Android
    @florentino junie 不就能用吗
    Mystery0
        39
    Mystery0  
       9 天前
    @Mystery0 #9
    附上相关使用记录,左侧的数字表示我给它分配了 19 次任务,单个任务基本上都是让它写组件,我给它描述页面上的东西,还有页面的大概布局,PLAN 那个地方是它自己解析任务信息之后生成的执行步骤,然后单个步骤就去走它自己的 LLM 逻辑了
    julyclyde
        40
    julyclyde  
       8 天前
    如果不说成“轻松搞定”还怎么起号吸引流量呢?
    julyclyde
        41
    julyclyde  
       8 天前
    有挺多人,性格上会沉迷于修工具而忘记最终目标
    诚然,对“AI 本身”的发展来说,沉迷于修工具的人是有益处的
    但是对于需要结果的行业、对于需要发展的人来说,其实并不会有什么收益
    catamaran
        42
    catamaran  
       16 小时 6 分钟前
    如果只是简单的逻辑,模型不是关键,deepseek/qwen 不是一点都不能打,关键你要把需求说清楚。你这么想,我把这个东西丢给同事,啥都不说,他能不能按照文档把游戏做出来。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1222 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 23:48 PVG 07:48 LAX 16:48 JFK 19:48
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86