V2EX maolon 的所有回复 第 1 页 / 共 16 页
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX    maolon    全部回复第 1 页 / 共 16 页
回复总数  305
1  2  3  4  5  6  7  8  9  10 ... 16  
是的输出变多了,速度也更快了,问题就是太贵了,他那个价格已经到了夸张的 $5 Input/$30 Output,
这个价格已经超过 opus 4.7 的 $5 I/$25 O 了
他要超不过 opus4.7 我反而有意见
done !
不认可 spec 说明他 p 都不懂, 不过毕竟他是你老板他给钱照他说的做就是了
codex 是法典的意思啊,一个完整的英文单词为什要拆开读
13 天前
回复了 razios 创建的主题 问与答 大家觉得 gemini 和 gpt 哪个好用?
gemini 用一个词形容就是“戏精”,你让他分析问题很快就开始给你上情绪,什么“深刻的洞察”,“直击要害”,虽然上情绪没啥毛病毕竟舔用户讨喜,但是也连带着带歪他自己的分析。

gpt 情绪就少得多,而且感觉不说人话的原因是因为他回复的时候为了节省 token ,每句话永远少那么一两个字,什么“给这个方案一刀”,“我现在就断”之类摸不着头脑的中文。但是分析,执行能力还是不错的
不过现在分析问题最稳,合作水平最好的反而是 opus 。

agent 能力的话 gemini 更是灾难,有一个很反直觉的地方就是 gemini 的 pro agent 能力反而不如 flash ,gpt 就不用说了,agent 能力稳定的强。
虽然纯 ai 驱动没啥问题, 但是至少要他做质量检查? mj 和 cc 图都裂了我不知道用的人会怎么想 https://i.imgur.com/ZoSX6zw.png
连 cursor 都不会用只会对着 gpt 网页 cv 那还叫 ai 工程师?楼上说的对,培训机构出来的
我觉得不是很妥,
1. 怎么算是事实? 观察,推断,需求,结果这些被塞在一起,agent 本身就很容易判断出错,一旦树的上层出现错误就会级联影响下层的结果
2. 虽然 agent 的编排基于事实自然生长看上去更优雅,但是没有解决复杂度的问题,只是把复杂度从谁命令谁变成了谁来定义事实,谁来做冲突解决,谁来撤回和重跑
3. llm 现在本身也不是为“事实治理”训练出来的,而是任务驱动的,基于事实治理的任务成功率存疑
4. 多 agent 至少目前不是版本答案,在很多问题 domain 里单 agent 系统( SAS ) ,效果并不差甚至是最优的选择,多 agent 一般在任务可拆解(上下文容易隔离),可探索,低耦合的任务上占优,所以也不是说什么任务都需要一个事实总线
5. 最后收敛条件是什么,谁来决定收敛(这也就是为什么 planner- excuter 被这么广泛的被使用的原因),没有这个系统会无限扩展下去
https://i.imgur.com/9gEUsFy.png

你确定你问对了 ai ?
凡是觉得 agent 搞多一堆角色就好用实用任何场合都应该这么用的都应该去看看谷歌的论文 https://arxiv.org/abs/2512.08296
3 月 30 日
回复了 badboy200600 创建的主题 Apple 请问 m 芯片真的很强吗?
光看 gb6 单核(因为对于桌面端 gb6 多核没有什么参考性),
算你 i7 7700k,imac 上 1650 分,m5 的 gb6 是 4300 分,
理论跑分差不多高了 3 倍,更不要说编译实际也吃 io 速度,实际快个 5-8 倍甚至更高都应该不是什么问题
高楼必有傻逼,没想到 v2 也这样了,楼主这不挺好的分享,有些人看不惯就算了还输不起
攻击性略强啊 lol
https://i.imgur.com/hjeOwNT.png
mcp 的重要性不高了,anthropic 自己都不怎么聊他了。

对于用户而言 mcp 普遍浪费 token 不说,最大的矛盾是现在的 llm 实际非常擅长调用 cli 和 api ,和写脚本解决问题,那他这个“ai agent 时代的 usbc”这个 value proposition 就不是特别立的住了(因为对于用户来说他不管你是怎么解决问题的,能解决就行了)。

对于开发而言,mcp 服务因为带上了 context ,调试难度成倍上升,如果不带 context 那和传统 api 也没多大区别,开发者的动力也没那么高,很多服务都是有 mcp ,但不好用(或者永远是 beta )

另外最后对于 agent 而言,最重要的是 context management ,mcp 相当于是一个隔离层,你的信息过去之后就是隔离的了,不像 cli 还可以 tail 来看 log ,agent 可以自主 debug/recover 状态,同样也是一个 anti pattern for current agent design

最后 skill 是 skill ,mcp 是 mcp 解决的不是一个问题,不要混为一谈
网上你不可能说服任何人(当然没那么绝对),同理任何人也不可能说服你,你所有的观点,立场都是给观众看的(我的观点和楼上老哥其实很像),

另外我管不了别人,我管好我自己就行了,他要喜欢杠难道我还能阻止他杠么
@BeautifulSoap 是的,去年就是因为这个原因从 cc max 转到 codex ,
然后最近只能两边都用了,cc 那边 opus 也是消耗惊人根本扛不了一周, 两边都用 200 账号才堪堪够用
@yaidev 要我说看 codex team 怎么处理这次事故, 他们之前的做法是一有问题就重置用量,但是这次他们是一点动静没有,
这次的问题很可能是因为 gpt5.4 的 cache 命中率只有之前模型不到一半导致的,所以你上 pro 也没用,我上周的 pro 没扛到 5 天就没了
codex 这几天用量炸了,觉得用的快不是你的问题而是 codex 开发那边又搞出什么幺蛾子,这还是目前是 2x 用量情况下
以前 plus 账号能用几天,现在 10 个小时就能走了一周 75%
@LandCruiser 你看,人的原话是:“we don't know if the models are conscious”, 而不是 “models are conscious”,
“不要断章取义” “要断章取义”
100 亿其实也不多啊,我光是一个 codex 都跑了 400 亿了...
另外凡是觉得长期任务不行的都可以看看 openai 说了啥: https://openai.com/zh-Hans-CN/index/harness-engineering
阿里说不行,openai 说行,你说有没有一种可能其中一个有点菜
1  2  3  4  5  6  7  8  9  10 ... 16  
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3698 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 80ms UTC 04:33 PVG 12:33 LAX 21:33 JFK 00:33
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86