30B 尺寸哪个小模型编码能力会好一些

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

这是一个创建于 85 天前的主题，其中的信息可能已经有所发展或是发生改变。

很久没本地跑小模型了，之前用的 QWen3-30B-A3B 2507 效果最佳，现在想咨询下哪个模型效果会更好些

11 条回复 2026-02-12 17:26:03 +08:00

xtreme1

1 月 29 日

卡死 32G 显存么, 还得留点给上下文吧.

summerLast

1 月 29 日

@xtreme1 用量化后的，32G 还有 10G 左右给上下文

slowgen

1 月 29 日

GLM-4.7-Flash

summerLast

1 月 29 日

@slowgen 思维链模型吗

h4ckm310n

2 月 3 日

试试 nemotron 3 nano

summerLast

2 月 4 日

@h4ckm310n 好的，我下载下来跑一下

kennylam777

2 月 7 日 via Android

你用哪 Coding agent 的？我用 Qwen3 30B A3B coder ，配 Roo coder 基本不行，大部份的 prompt 都的，用 Devstral 24B 好一但不快，而且 32GB 配 MoE 的 context 才能比大

summerLast

2 月 7 日

GLM-4.7-Flash QWen3-30B-A3B 都有在用，但是效果不佳，打算试试 Nemotron-3-Nano-30B-A3B

mewking

2 月 7 日

前几天阿里刚发布了个 Qwen3-Coder-Next-80B-A3B

GLM-4.7-Flash 哪些方面不行？看来是刷分刷出来的呀

summerLast

2 月 9 日

@mewking 指令跟随上效果不佳

summerLast

2 月 12 日

@mewking 对了，还有一个，就是会陷入 token 输出循环，这个就很不友好