
实操:使用 gemini 3 pro(high) 问题:你现在思考用的是哪个模型? 回答:我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash ( Thinking process is powered by Gemini 2.0 Flash )。
实操:使用 gemini 3 flash 问题:现在是对话模式,你现在思考用的是哪个模型? 回答:我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash ( Thinking process is powered by Gemini 2.0 Flash )。
实操:使用 claude Opus 4.5(Thinking) 问题:你现在思考用的是哪个模型? 我现在使用的模型是 Claude 3.5 Sonnet (由 Anthropic 开发)。 刚才您切换了模型设置,因此我从 Gemini 2.0 Pro 切换到了 Claude 3.5 Sonnet 。
太垃圾了,活生生的欺骗,难怪越调 bug 越多。
发现场景,做了一个功能图片识别文字,我让他用 gemini-2.5-flash 模型,它一直反馈 Google Gemini 系列目前的最新 Flash 版本是 2.0 Flash Experimental (gemini-2.0-flash-exp)。我推测您提到的“2.5”可能是指代这个最新的 2.0 版本(目前尚无官方 2.5 发布)。
1 renchong 1 月 31 日 谷歌顶不住了,这波估计涌进来的人太多了 |
2 asen001 1 月 31 日 最近一个星期,gemini3 pro,连把接口文档丢过去生成一下定义文件( api/*.js )写完都会有错误,还不如 deepseek 网页端 |
3 germain 1 月 31 日 无法复现 |
4 YanSeven 1 月 31 日 早期我记得使用这种问模型的方式不是说判断不准吗,从什么时候开始,变得可信了。 |
5 metalvest 1 月 31 日 程序员基操:进度条基本全是骗人的 |
6 YanSeven 1 月 31 日 用 antigravity 的至少有一半人是为了用 claudeopus ,给谷歌用破防了。 |
7 QS0x01 1 月 31 日 反正我没花钱,我觉得有的用就不错了 |
8 freefcw 1 月 31 日 这你也信。。。如果谷歌能够靠其他能力把 sonnet 3.5 的智商优化到 opus 4.5 的水准,那真是功德无量了 |
9 evilcat 1 月 31 日 |
10 iorilu 1 月 31 日 opus 表现还是可以的 但 gemini-pro 基本垃圾, 还不如 gemini-flash |
12 zhang2e 1 月 31 日 2026 年了,还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗。 |
13 zjttfs 1 月 31 日 碰到过一次, 用的 Sonnet 4.5 , 报错返回说 Gemini Pro 网关错误.... |
14 mitu233 1 月 31 日 怎么所有人都在用这种方法测试模型? gemini1.5 的时候问他是谁他还会说自己是百度的混元呢,测试模型不是有一堆方法吗看知识库截止日期之类的? |
15 billzhuang 1 月 31 日 via iPhone 不可能的,OP 你这个方法是不准确的 |
16 msg7086 1 月 31 日 你这调教得不行啊。我之前在网页端问 Gemini 他是什么模型,他还告诉我他是 Claude 的呢。 |
17 lscho 1 月 31 日 2026 年了,还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗? |
18 NewMoorj 1 月 31 日 兄弟真把大模型当人了,大模型之间会互相拿对方的数据来训练的,数据流里不认识真实的自己太正常了。 |
19 korvin 1 月 31 日 今惜是何年~ |
20 hash 1 月 31 日 我以为不要问 Transformer 模型你是谁这种常识应该 GPT3 时代大家就明白了 |
21 hanssx 1 月 31 日 这种问法是不对的,实际模型到底是多少,只有背后做的人和少部分人会调优的人知道 |
22 yuuluu 1 月 31 日 日经贴,只能说骗回复你成功了 |
23 kimaky 1 月 31 日 antigravity 模型造假吗? |
24 deplives 1 月 31 日 6202 年了还有人这么判断模型??? |
25 saaak 1 月 31 日 你怎么确定这不是大模型幻觉呢 |
26 CodeLaunchur 1 月 31 日 那么到底怎么判断大模型版本呢? |
27 acisky 2 月 1 日 Antigravity Tools 使用 claude 模型,都映射到了 gemini ,额度也是用的 gemini 的 |
29 qq316107934 2 月 1 日 额,谷歌前两天刚到发邮件说要把 2.0 系列模型从 GCP 下架了,要用也是 2.5 Flash 啊... |
30 coolmenu 2 月 1 日 不能这么判断,可能是基座的训练集,最好你弄个比较难的问题,比较回答,能看的清楚点 |
31 realpg PRO @lscho #17 大模型能直接对话的一般会有一个 overwrite 的配置应对这种问题 一般是写死的配置 且更新了总忘改 本身也是形象宣传的一种 这个相对可信的, 因为我用 claude sonnet 时 对话到一半给我报 gemini 的错误代码 |
32 realpg PRO @qq316107934 #29 同一系列的版本号不对很常见 一般在对话网关, 都直接固化一个配置 "我是谁" 本身也是品牌宣传策略的一种 一般这种是一个独立的覆盖拦截配置 很多时候升级后端对接总忘这种接口 比如我在 chat 的前端 给对接 gemini 2.x 做一个配置 我是 gemini 2.0 给对接 gemini 3.x 做一个配置 我是 gemini 3.0 当后端 2.0 升级到 2.5 时候 很容易忘了改这个配置里的文字 |
33 ethusdt 2 月 1 日 |