V2EX sentinelK
 sentinelK's recent timeline updates
@kop1989 @kop1989smurf
三转
May 31, 2023
我本将心向明月,奈何明月照沟渠。
May 30, 2023
sentinelK
ONLINE

sentinelK

V2EX member #631792, joined on 2023-05-30 20:41:02 +08:00
Today's activity rank 2624
kop1989的三转小号
sentinelK's recent replies
代码结构、AI 上下文可见性、程序架构,这三者是风马牛不相及。

并不会互相影响。
@zsj1029 我在某硬件平台,租了个 5090 平台测试,Q4_K_M 版本,使用 llama.cpp 运行 262114 上下文,显存占用 26GB ,prefill 大概 3000t/s,decode 稳定在 70t/s

感觉是不是楼主的 A100 参数还有优化的空间。体感上 5090 跑 qwen3.6-27B,输出不比官网 v4-flash 慢
@zsj1029 借楼,A100 运行 qwen3.6-27B ,是全量版本、上下文开满吗? prefill 和 decode 分别性能是多少?
统计学模型最容易发挥优势的地方就在于“统计”。

也就是“规则复杂维度多,基础数据庞大检索困难,难以通过人力归纳总结收敛最优解,甚至需要制定一些反效率的框架与流程来束缚一线从业者能力上限,从而提高生产成功率”的领域。

比如编程就是上述描述的典型场景。

对应的,医疗、法律建议,科学研究,合同分析,新闻解析等,也都如此。目前 AI 沁润比较深的也都是以上行业。
你通过什么手段进行的结果审核?如果没有 result review ,会大幅度的消耗你的精力。

你是否通过提示词指导了 AI 如何生成素材?游戏里的视觉效果,五成靠骗,四成凑合,一成靠画。如果你是业余的前提下,主观客观上指导了 AI 如何实现视觉效果,其实绝大多数情况都是误导。
花了一点时间,几乎是穷举,吧八格的必胜法走出来了……

1 、开局走马。
2 、通过移动车,逼对方马前跳
3 、让对方的王吃掉自己的马,否则会逼和。
4 、车吃掉对方前跳的马。
@SteveRogers 要等 M5 Max 版本的 studio 出来才行。M4 MAX 的性能比这代低很多,另外,mac 的统一内存是够放满血版本(非量化)的 qwen3.6 27B 的,但是因为内存带宽,所以性能很差。
@hello365 目前的话,qwen3.6-27B 4bit 量化的 mlx 版本模型,M5 MAX 128GB 的 macbookpro ,decode 输出可以跑到 30t/s ,prefill 输入可以跑到 700t/s

如果是 moe 模型,比如 qwen3.6-35B-A3B ,能到 100t/s 的输出。
@skuuhui 这个直觉没错的,但是对应的账应该反过来算。
1 、你降低了你自己的心智负担,你就更有时间、精力来给模型兜底。
2 、目前主流的 Agent 思路是 loop + 审核抽卡,所以误差的积累很大程度上可以靠增多多抽卡次数来抹平。也就是靠烧更多的 token 来换你更少的干预。
3 、目前模型的能力更强了,最优解的统计学优势更明显,即便上下文有一系列错误,也会无视或者自行纠错。
About     Help     Advertise     Blog     API     FAQ     Solana     3066 Online   Highest 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 25ms UTC 15:01 PVG 23:01 LAX 08:01 JFK 11:01
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86