V2EX kennylam777
kennylam777

kennylam777

V2EX member #90581, joined on 2015-01-08 01:22:38 +08:00
Today's activity rank 19229
Per kennylam777's settings, the topics list is only visible after you sign in
Deals info, including closed deals, is not hidden
kennylam777's recent replies
@squarefong17 , 即使是 DGX Spark 些小器, VRAM 足但跑 20B 以上的 Dense 模型都太慢, 唯一寄望是 Active 位字的 MoE

我本地用片 3090 + NVLink, 用 vllm 跑 Gemma4 31B FP8 打 Tensor Parallel, 吃了 800W 力才好有 60 tps
我也是 context 度的而不是的, 一 chat session 活太降智把之前做好的西都改回, 愈小的模型愈有感, 竟小模型的注意力比有限能像大模型般全都兼
喔我看懂了, 思路是把切小, 小模型能理, 一步一步能自我修

的, 即使是 Cluade Code 的 context management 比 OpenCode 是太多, 以前用 Roo Code 在 4090 上跑 local LLM 基本上 tool calling fail 是基本, 在用 Qwen3.6 + 5090 好一但是有差

我也用看
Roo code 也不做了, 你在才始?
同型的有 OpenCode 在做, 中模型也有首配的, 子不要自己造吧。

不我建你用 claude code 配 local model 看, llama.cpp 支援 Anthropic API
https://huggingface.co/blog/ggml-org/anthropic-messages-api-in-llamacpp

只要定好境就能用 claude code, 不用 login 也不怕被 ban
ANTHROPIC_BASE_URL=http://127.0.0.1:8080 claude
ANTHROPIC_AUTH_TOKEN=local
Apr 25
Replied to a topic by archxm Local LLM 大伙有想过二次训练吗?
@archxm 早就有了, vast.ai 很多人在用

是你所的二次, 其有分 CPT 及 SFT 的, 一般用 SFT 已足付任, CPT 效果不佳而且你之後是要回一次 SFT
Antigravity + Codex, 竟 Flash 3 便宜量大
Codex 做 review, 我是喜用 app 版不太想用 CLI
Mar 23
Replied to a topic by drymonfidelia Google Gemini Gemini 真是天才
有一次整套 toolchain 的改, 用 Gemini 3.1 Pro, 它自行定花了一大堆 token 去逐 library 的.h/.c 改一, 改到 library 我不, 它什要做, 它那是 MUST do blah blah blah, 最後我叫它去 make script 加一 flag 就好, 然最後改好了, 但也真的要小心
@lessurliu 跟 agent 後面接的 system promopt 有, 以前在 SFT 制模型被到是回答, 在好像因影性能而不了, 都直接在 system prompt 填的, claude code 自家品通常都在 system prompt 先填模型名, 但 Antigravity 的 system prompt 模型介
用 AI 不用看人 schedule 不用排 tasks, 直接手先看看及, 也不用解太多, 直接一段文字就可以始, 奏由你掌控, 不不能足你的控制欲?
Feb 23
Replied to a topic by extrem 程序员 求推荐大手人体工学鼠标
用了垂直 Mouse 年回, 我用 MX Vertical, 唯一不好是有大, 但你手大的好
About     Help     Advertise     Blog     API     FAQ     Solana     3347 Online   Highest 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 12ms UTC 13:49 PVG 21:49 LAX 06:49 JFK 09:49
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86