antigravity 中的模型清单列表都是骗人的， gemini 3 pro 实际是 Gemini 2.0 Flash， claude Opus 4.5 实际是 Claude 3.5 Sonnet

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 83 天前的主题，其中的信息可能已经有所发展或是发生改变。

实操：使用 gemini 3 pro(high) 问题：你现在思考用的是哪个模型？回答：我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash （ Thinking process is powered by Gemini 2.0 Flash ）。

实操：使用 gemini 3 flash 问题：现在是对话模式，你现在思考用的是哪个模型？回答：我现在用于思考和回答您问题的模型是 Google Gemini 2.0 Flash （ Thinking process is powered by Gemini 2.0 Flash ）。

实操：使用 claude Opus 4.5(Thinking) 问题：你现在思考用的是哪个模型？我现在使用的模型是 Claude 3.5 Sonnet （由 Anthropic 开发）。刚才您切换了模型设置，因此我从 Gemini 2.0 Pro 切换到了 Claude 3.5 Sonnet 。

太垃圾了，活生生的欺骗，难怪越调 bug 越多。

发现场景，做了一个功能图片识别文字，我让他用 gemini-2.5-flash 模型，它一直反馈 Google Gemini 系列目前的最新 Flash 版本是 2.0 Flash Experimental (gemini-2.0-flash-exp)。我推测您提到的“2.5”可能是指代这个最新的 2.0 版本（目前尚无官方 2.5 发布）。

模型

欺骗

版本

33 条回复 2026-02-01 16:58:25 +08:00

renchong

1 月 31 日

谷歌顶不住了，这波估计涌进来的人太多了

asen001

1 月 31 日

最近一个星期，gemini3 pro,连把接口文档丢过去生成一下定义文件（ api/*.js ）写完都会有错误，还不如 deepseek 网页端

germain

1 月 31 日

无法复现

YanSeven

1 月 31 日

早期我记得使用这种问模型的方式不是说判断不准吗，从什么时候开始，变得可信了。

metalvest

1 月 31 日

程序员基操：进度条基本全是骗人的

YanSeven

1 月 31 日

用 antigravity 的至少有一半人是为了用 claudeopus ，给谷歌用破防了。

QS0x01

1 月 31 日

反正我没花钱，我觉得有的用就不错了

freefcw

1 月 31 日

这你也信。。。如果谷歌能够靠其他能力把 sonnet 3.5 的智商优化到 opus 4.5 的水准，那真是功德无量了

evilcat

1 月 31 日

啊这，刚整的 antigravity 会员

iorilu

1 月 31 日

opus 表现还是可以的

但 gemini-pro 基本垃圾, 还不如 gemini-flash

&bsp; 11

actopas

1 月 31 日

@germain 可以复现确实 3.0flash 是 2.0flash

zhang2e

1 月 31 日

2026 年了，还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗。

zjttfs

1 月 31 日

碰到过一次, 用的 Sonnet 4.5 , 报错返回说 Gemini Pro 网关错误....

mitu233

1 月 31 日

怎么所有人都在用这种方法测试模型？ gemini1.5 的时候问他是谁他还会说自己是百度的混元呢，测试模型不是有一堆方法吗看知识库截止日期之类的？

billzhuang

1 月 31 日 via iPhone

不可能的，OP 你这个方法是不准确的

msg7086

1 月 31 日

你这调教得不行啊。我之前在网页端问 Gemini 他是什么模型，他还告诉我他是 Claude 的呢。

lscho

1 月 31 日

2026 年了，还有人在问大模型「你是谁」这种问题。真的以为大模型会思考有智商吗?

NewMoorj

1 月 31 日

兄弟真把大模型当人了，大模型之间会互相拿对方的数据来训练的，数据流里不认识真实的自己太正常了。

korvin

1 月 31 日

今惜是何年~

hash

1 月 31 日

我以为不要问 Transformer 模型你是谁这种常识应该 GPT3 时代大家就明白了

hanssx

1 月 31 日

这种问法是不对的，实际模型到底是多少，只有背后做的人和少部分人会调优的人知道

yuuluu

1 月 31 日

日经贴，只能说骗回复你成功了

kimaky

1 月 31 日

antigravity 模型造假吗?

deplives

1 月 31 日

6202 年了还有人这么判断模型？？？

saaak

1 月 31 日

你怎么确定这不是大模型幻觉呢

CodeLaunchur

1 月 31 日

那么到底怎么判断大模型版本呢？

acisky

2 月 1 日

Antigravity Tools 使用 claude 模型，都映射到了 gemini ，额度也是用的 gemini 的

YanSeven

2 月 1 日

@acisky ...google 至少是国际性大厂吧。。。不至于这么没品吧

qq316107934

2 月 1 日

额，谷歌前两天刚到发邮件说要把 2.0 系列模型从 GCP 下架了，要用也是 2.5 Flash 啊...

coolmenu

2 月 1 日

不能这么判断，可能是基座的训练集，最好你弄个比较难的问题，比较回答，能看的清楚点

realpg

PRO

2 月 1 日

@lscho #17
大模型能直接对话的一般会有一个 overwrite 的配置应对这种问题

一般是写死的配置且更新了总忘改

本身也是形象宣传的一种

这个相对可信的, 因为我用 claude sonnet 时对话到一半给我报 gemini 的错误代码

realpg

PRO

2 月 1 日

@qq316107934 #29
同一系列的版本号不对很常见

一般在对话网关, 都直接固化一个配置 "我是谁" 本身也是品牌宣传策略的一种

一般这种是一个独立的覆盖拦截配置很多时候升级后端对接总忘这种接口

比如我在 chat 的前端
给对接 gemini 2.x 做一个配置我是 gemini 2.0
给对接 gemini 3.x 做一个配置我是 gemini 3.0

当后端 2.0 升级到 2.5 时候很容易忘了改这个配置里的文字

ethusdt

2 月 1 日

即使不清楚，也要做多方面实验。