昨天 QWEN 今天 KIMI 都发布了新基座模型,测了几个前端用例 KIMI 还略好于 gemini3 pro 和 claude4.5 sonet ,有点惊喜。Qwen 看 benchmark 很厉害,实际用有点已读乱回的意思...

1 jaleo Jan 27 千问已经有了 qwen 里还没更新 |
2 Meteora626 Jan 27 qwen 测试的是工具集群吧,官网的单模型差点意思, |
3 RandyLuo Jan 27 via Android Kimi2.5thinking 很行,qwen 不太行 |
4 chunhuitrue Jan 27 @RandyLuo 怎么对比的,详细说说? |
5 germain Jan 27 Qwen3 太贵了,昨天用这个新 Model 小刷了一下一个简单的前端 UI ,刷掉我 200 人民币,还没刷好,我惊了。也不知道是不是 Token 计费结算有什么问题。 |
7 RandyLuo Jan 27 @chunhuitrue https://livebench.ai/ 这个网站的最新测试集没法刷,23 年就有的榜,基本和体感一致。我有个很长链路的音响系统的问题,opus 、gemini3pro 都没解决,qwen 更不用说了,就 gpt5.2 一次就回答对,kimi k2.5thinking 只有很小的地方偏了点,一次提示后就纠正解决问题了。 |
9 Sezxy Jan 28 via Android kimi k2.5+opencode,感觉很不错,我今天几个需求都用它俩解决 |
10 zhonghao01 Jan 28 昨天对比了下 Qwen3-Max-Thinking 和 GLM 4.7 ,相同的提示词,做出来的效果都不如 GLM ,qwen 做出来的网页很粗糙,效果也不是想要的效果,GLM 做的要好看,基本符合要求。 |
11 letitbesqzr Jan 28 @Sezxy #9 请问是如何配置 让 kimi k2.5 搭配 opencode 的? 我这边配置后 直接提示: Kimi For Coding is currently only available for Coding Agents such as Kimi CLI, Claude Code, Roo Code, Kilo Code, etc. |
12 Sezxy Jan 28 @letitbesqzr #11 我没有买它的 coding 套餐,之前刚出来的时候送的 50 元我还没用完 |
14 zuosiruan Jan 28  kimi 网站挂了 |
16 chunhuitrue Jan 28 @RandyLuo 赞,看来靠谱。 |