
陆陆续续花了上万 RMB ,攒了点心得,也攒了一堆困惑。
1 、MAX 和 HIGH 之间的边界,一直摸不太清。
不知道什么场景下用 HIGH 就够了。让它帮我调个版式,HIGH 确实 OK ,但聊着聊着就会延伸到架构、流程优化那这时候我是不是得立马切 MAX ?大家遇到这种"任务中途升级"的情况,是怎么处理的?
2 、MAX 也并不是万能的。
大大小小的问题照样会出,尤其是面对复杂工程,或者它对别人写的引擎理解不到位的时候,反复出错,找不到根因,而且确实绕不过一些弯子,也找不到那些非常有"灵感"、比较 Hack 向的手法。
3 、可能之前对"Agent 全自动化流程"有个误解。
后来才意识到:Agent 参与的全自动化流程,本质上约等于人工参与的流程,它一样会犯错,一样需要兜底。所以我认为 Agent 更应该帮我沉淀出连 Agent 都不必介入的稳定 flow 。
4 、上下文( context )的重要性,远比我想象的更关键。
钱花到一定程度才愈发觉得 context 很混乱(我总是让 OPUS 自动帮我考虑 context 该如何优化)。尤其是 4.6 切到 4.7 这段时间,把之前的错误全部纠正了一遍,才意识到也许我多花了 50% 的经费?
5 、多设备 / 多 Agent / 多 Session 协作方案,大家是怎么搭的?
我目前的配置是:Air 作为移动工作平台,办公室里 2 台 PC + 1 台 Mac mini ,4 台机器协同作业。想听听大家的架构和经验,有没有什么值得借鉴的玩法?
顺便,OPUS 真的太贵了,想转战性价比了,因为 context 、skill 都铺了个大概,现在也对 OPUS 顶配祛魅了。大家给点推荐!
模型像员工,我真不一定要溢价用最高级的。好的流程和规范,还是能让具备基本水平的 Agent 做出有价值的项目;而真正需要突破性能力的环节,当下所谓"顶配"模型其实也不见得比次一档高出多少。
(可能略显愚笨,望轻喷)
1 maocat 2 天前 我只有 2 个经验: 1. 善用/compact xxx, 为接下来的工作做准备 2. 总结成功的动作,如获取 token 过程,项目运行重启方式等等 |
2 sddyzm PRO 我的使用经验: 1.想要更好的效果,等 2.没了 |
3 0x0x 2 天前 陆陆续续花了上万 RMB ? 这是一直在用 api ? 大部分人没你玩的这么 6 ,只是单一设备通过 ai 来提效而已。 目前使用 opus 的主要一个比较好的体验是:通过 plan 指定好计划后,基本上能够正常跑完整个流程,同时最终的代码是可以直接编译的(不是没有 bug ,bug 还要 review 然后让 ai 继续修或者自己修) 其他的模型可能会偷懒,没有编译过就放弃了,然后继续修改代码。 最终的成品是无法编译的 |
4 jjymup1 2 天前 我们都捡路边的垃圾吃,大佬是真大佬啊!! |
5 sampeng 2 天前 via iPhone 你要用 4.6 的关闭自动推断思考程度才有效,4.7 的 max 是路边一条。你试试 4.6 关闭了强制 max 和最大思考 token 。除了慢,还是我们熟悉的那个 opus |
6 alexfu 2 天前 最近 200 刀的 plan 4.7 都不够用 5 天就爆周限额 而且天天搁那 check malware 感觉是越来越拉了 同求便宜的替代 |
7 viskem OP @sampeng …………兄弟,谢谢你,当我 4.7 越用越绝望的时候……我换到了你说的那样,似乎真的找回了一些感觉!你说的最大思考是指 thinking 模式 还是 1M 上下文? |
8 sampeng 22 小时 11 分钟前 via iPhone @viskem "env": { "CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING": 1, "MAX_THINKING_TOKENS": "128000" 然后思考等级最少是 high ,特别难得地方用 max 。我用 high 就够了。 |