V2EX maolon 的所有回复第 1 页 / 共 16 页

gemini 用一个词形容就是“戏精”，你让他分析问题很快就开始给你上情绪，什么“深刻的洞察”，“直击要害”，虽然上情绪没啥毛病毕竟舔用户讨喜，但是也连带着带歪他自己的分析。

gpt 情绪就少得多，而且感觉不说人话的原因是因为他回复的时候为了节省 token ，每句话永远少那么一两个字，什么“给这个方案一刀”，“我现在就断”之类摸不着头脑的中文。但是分析，执行能力还是不错的
不过现在分析问题最稳，合作水平最好的反而是 opus 。

agent 能力的话 gemini 更是灾难，有一个很反直觉的地方就是 gemini 的 pro agent 能力反而不如 flash ，gpt 就不用说了，agent 能力稳定的强。

14 天前

回复了 fnd 创建的主题分享创造一个 AI 纯度百分百的网站（不吹）

虽然纯 ai 驱动没啥问题，但是至少要他做质量检查？ mj 和 cc 图都裂了我不知道用的人会怎么想 https://i.imgur.com/ZoSX6zw.png

21 天前

回复了 hoky 创建的主题职场话题尴尬了，可能招聘了一个不会手写代码的 AI 工程师

连 cursor 都不会用只会对着 gpt 网页 cv 那还叫 ai 工程师？楼上说的对，培训机构出来的

21 天前

回复了 tftNExtLife 创建的主题程序员共享现实驱动的 Agent 协调理论，关于 multi-agent 的一些个人见解

我觉得不是很妥，
1. 怎么算是事实？观察，推断，需求，结果这些被塞在一起，agent 本身就很容易判断出错，一旦树的上层出现错误就会级联影响下层的结果
2. 虽然 agent 的编排基于事实自然生长看上去更优雅，但是没有解决复杂度的问题，只是把复杂度从谁命令谁变成了谁来定义事实，谁来做冲突解决，谁来撤回和重跑
3. llm 现在本身也不是为“事实治理”训练出来的，而是任务驱动的，基于事实治理的任务成功率存疑
4. 多 agent 至少目前不是版本答案，在很多问题 domain 里单 agent 系统（ SAS ），效果并不差甚至是最优的选择，多 agent 一般在任务可拆解（上下文容易隔离），可探索，低耦合的任务上占优，所以也不是说什么任务都需要一个事实总线
5. 最后收敛条件是什么，谁来决定收敛（这也就是为什么 planner- excuter 被这么广泛的被使用的原因），没有这个系统会无限扩展下去

23 天前

回复了 xFrank 创建的主题 Python 发现 Python 一个有意思的小特性，发现很合适搞成面试题。问了 AI 都不行:)，欢迎来挑战~

https://i.imgur.com/9gEUsFy.png

你确定你问对了 ai ？

23 天前

回复了 lynn1su 创建的主题程序员这种三省六部的 agent 架构有没有用？有用过的麻？

凡是觉得 agent 搞多一堆角色就好用实用任何场合都应该这么用的都应该去看看谷歌的论文 https://arxiv.org/abs/2512.08296

3 月 30 日

回复了 badboy200600 创建的主题 Apple 请问 m 芯片真的很强吗?

光看 gb6 单核（因为对于桌面端 gb6 多核没有什么参考性），
算你 i7 7700k,imac 上 1650 分，m5 的 gb6 是 4300 分，
理论跑分差不多高了 3 倍，更不要说编译实际也吃 io 速度，实际快个 5-8 倍甚至更高都应该不是什么问题

3 月 23 日

回复了 XR843 创建的主题分享创造一个人搞了个佛学文献搜索引擎，整合了全球 500+ 个数据源，开源了

高楼必有傻逼，没想到 v2 也这样了，楼主这不挺好的分享，有些人看不惯就算了还输不起

3 月 21 日

回复了 largep 创建的主题分享创造一个晚上撸出来的<V2EX 用户画像分析>小工具

攻击性略强啊 lol
https://i.imgur.com/hjeOwNT.png

3 月 20 日

回复了 287854442 创建的主题程序员 MCP 是不是已经死了？没人再提这个了

mcp 的重要性不高了，anthropic 自己都不怎么聊他了。

对于用户而言 mcp 普遍浪费 token 不说，最大的矛盾是现在的 llm 实际非常擅长调用 cli 和 api ，和写脚本解决问题，那他这个“ai agent 时代的 usbc”这个 value proposition 就不是特别立的住了（因为对于用户来说他不管你是怎么解决问题的，能解决就行了）。

对于开发而言，mcp 服务因为带上了 context ，调试难度成倍上升，如果不带 context 那和传统 api 也没多大区别，开发者的动力也没那么高，很多服务都是有 mcp ，但不好用（或者永远是 beta ）

另外最后对于 agent 而言，最重要的是 context management ，mcp 相当于是一个隔离层，你的信息过去之后就是隔离的了，不像 cli 还可以 tail 来看 log ，agent 可以自主 debug/recover 状态，同样也是一个 anti pattern for current agent design

最后 skill 是 skill ，mcp 是 mcp 解决的不是一个问题，不要混为一谈

3 月 19 日

回复了 meetyuan 创建的主题问与答为什么会有这样的人？总喜欢杠，但是又很难证明他是错的！就让人很难受。

网上你不可能说服任何人（当然没那么绝对），同理任何人也不可能说服你，你所有的观点，立场都是给观众看的（我的观点和楼上老哥其实很像），

另外我管不了别人，我管好我自己就行了，他要喜欢杠难道我还能阻止他杠么

3 月 19 日

回复了 yaidev 创建的主题 Vibe Coding 刚刚入手了 Codex Plus 订阅，感觉良好，只不过这个额度真的够用吗？

@BeautifulSoap 是的，去年就是因为这个原因从 cc max 转到 codex ，
然后最近只能两边都用了，cc 那边 opus 也是消耗惊人根本扛不了一周，两边都用 200 账号才堪堪够用

3 月 19 日

回复了 yaidev 创建的主题 Vibe Coding 刚刚入手了 Codex Plus 订阅，感觉良好，只不过这个额度真的够用吗？

@yaidev 要我说看 codex team 怎么处理这次事故，他们之前的做法是一有问题就重置用量，但是这次他们是一点动静没有，
这次的问题很可能是因为 gpt5.4 的 cache 命中率只有之前模型不到一半导致的，所以你上 pro 也没用，我上周的 pro 没扛到 5 天就没了

3 月 19 日

回复了 yaidev 创建的主题 Vibe Coding 刚刚入手了 Codex Plus 订阅，感觉良好，只不过这个额度真的够用吗？

codex 这几天用量炸了，觉得用的快不是你的问题而是 codex 开发那边又搞出什么幺蛾子，这还是目前是 2x 用量情况下
以前 plus 账号能用几天，现在 10 个小时就能走了一周 75%

3 月 19 日

回复了 jiirouwei 创建的主题职场话题阿里巴巴与中山大学花了 100 亿 token 证明目前 ai 编程无法承担长期任务

@LandCruiser 你看，人的原话是：“we don't know if the models are conscious”, 而不是 “models are conscious”,
“不要断章取义” “要断章取义”

3 月 19 日

回复了 jiirouwei 创建的主题职场话题阿里巴巴与中山大学花了 100 亿 token 证明目前 ai 编程无法承担长期任务

100 亿其实也不多啊，我光是一个 codex 都跑了 400 亿了...
另外凡是觉得长期任务不行的都可以看看 openai 说了啥： https://openai.com/zh-Hans-CN/index/harness-engineering
阿里说不行，openai 说行，你说有没有一种可能其中一个有点菜

1 2 3 4 5 6 7 8 9 10 ... 16