怎么快速判断 AI 是否降智 我现在心态已经崩了..........一直在跟 ai 说三字经........ - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dreamkuo
V2EX    Claude

怎么快速判断 AI 是否降智 我现在心态已经崩了..........一直在跟 ai 说三字经........

  •  
  •   dreamkuo 64 天前 1955 次点击
    这是一个创建于 64 天前的主题,其中的信息可能已经有所发展或是发生改变。

    遇到一个很头疼的问题,希望大家帮忙想想办法:

    问题描述: 在使用 AI 协助工作时,经常遇到 AI"智商下降"的情况,但这种状态很难被直观识别导致浪费大量时间。

    核心难点: AI 智商高低都会犯错,关键区别在于纠错模式:

    高智商状态:虽然会犯错,但经过几轮纠正后能走向正确方向,最终解决问题

    低智商状态:会在错误的道路上反复纠错,每次纠错又产生新的错误,形成恶性循环,越纠越偏

    识别困难: 低智商 AI 依然表现得"很努力在解决问题",看起来积极主动,但实际上是在错误的路径上越走越远。因为高智商 AI 也会犯错,所以单纯看"是否出错"无法区分。

    实际影响: 今天就遇到了这种情况,AI 花了几个小时在一个本来很简单的任务上打转,明显已经没有能力完成需求了,但从表现上看不出来。

    求助内容: 有没有什么快速测试方法,能在短时间内(比如 5 分钟内)判断 AI 当前是否处于"降智"状态?避免在低效状态下浪费时间?

    8 条回复    2025-09-08 10:12:20 +08:00
    gelen98
        1
    gelen98  
       64 天前 via Android
    推荐火山引擎的 豆包 1.6
    1 开启思考模式,很难降智。
    2 便宜,使用 API 一个月 100 不到
    3 辅助开发效果很好,把文档给 ai ,写清楚需求,基本上都可以两遍改好。

    openai 有经常降智的骚操作不推荐。
    各种整合平台,都很有可能降智,不然他们怎么赚钱?也不推荐。

    claude 拉动美国和中国人的对立,是一家忠实的美国公司,虽然不会降智,不过不推荐用。

    豆包虽然没有像 qwen 那样开源,不过用 API 都是一样付费的。貌似还便宜一点?
    cest
        2
    cest  
       64 天前
    靠经验,看回复的口音
    每个人的 prompt 写法都不太一样
    不同 model 回你的定型文也不太一样

    用多了,就能听出 llm 说话就是那几个口音(每个 model 都有自己的几个)
    如果来了个口音重的,你脑海里都是那味道了
    就该知道这个 session 已经完了,请到无敌嘴炮王了

    不如重新开始,重写初始 prompt
    祈祷这次能 roll 到好分支上,召唤到有用的大神
    xuejianxianzun
        3
    xuejianxianzun  
       64 天前
    @cest 哈哈,原来这也有随机要素
    sublime8
        4
    sublime8  
       64 天前
    重新开一个会话。因为上下文被严重压缩,所以看起来一直在绕圈圈,不开新会话没法解决。
    likooo125802023
        5
    likooo125802023  
       64 天前
    快来看,有人用 AI 用的魔怔了。
    ijse
        6
    ijse  
       64 天前
    再开另一个 AI 监视它的回答,把问题抛给另一个 AI 解决
    aarontian
        7
    aarontian  
       63 天前
    同 2L ,我觉得就是凭经验,辨别口音,和能力(不太好观察,除非能力有明显下降)

    想精准点就只能是跑 benchmark 之类的,但可能不太适合个人去做
    julyclyde
        8
    julyclyde  
       63 天前
    三字经也算钱哦
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3221 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 11:37 PVG 19:37 LAX 03:37 JFK 06:37
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86