V2EX swmjjy 的所有回复 第 1 页 / 共 2 页
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX    swmjjy    全部回复第 1 页 / 共 2 页
回复总数  25
1  2  
我这也是, 63 小时活动时间, 122T 读取 36T 写入

https://i.imgur.com/uam9VAu.png
@wclebb 然后能做到的预算我头上就说了, 4bit 671b 跑到 10token/s 以上只需要 3w 预算而已
@wclebb 我哪里提到云 api 了, 我说的是权重, 没人说 mac 不能跑, 说的是 mac 跑性价比极低, 低价不如 ktransformers 方案低, 高吞吐性价比比正规方案差 10 倍以上
@wclebb 首先 4bit 671b 3w 就能跑到 10token/s 以上的速度, 然后 ds 官方的权重就是 8bit fp 的, 哪门子没有公开, 美团也公开了 8bit int 的权重, 并且合并了相应的更改到 sglang
你没去了解=没有
217 天前
回复了 886106 创建的主题 Apple Studio M4max 128G 是否合适跑大模型
@newbeelity 这并不是什么问题, 主流推理框架全都正式支持至少一种并行方式, 而且都不必选依赖 nvlink 或者对应 GPU 的同等通信方式, exo 仅仅属于在 mac 社区里比较知名的简单山寨实现而已
217 天前
回复了 886106 创建的主题 Apple Studio M4max 128G 是否合适跑大模型
@BernieDu 要求带宽的是 GPU 和自身显存之间的通信, 而 GPU 之间几乎只是每层(甚至可以是每 N 层)进行一次简单的中间状态交互, 带宽要求可以非常低

举例, 8 张 3060, Qwen2.5-72B 4bit 量化
promp prefill: 470token/s
decode bs=1: 37token/s
decode 高并发: 430token/s

(这几个数据对于 m4 max 而言是 ~50token/s, ~12token/s, ~30token/s)

https://i.imgur.com/Tr9FqiF.png
https://i.imgur.com/CSDIACm.png
https://i.imgur.com/T7kKqNQ.png
https://i.imgur.com/tfyILe7.png
2023-06-07 12:17:04 +08:00
回复了 polobug 创建的主题 Apple 库克的内存和存储还是那么抠,可吐了
@wy315700 一般是没有...但这个一般大概不包括真的把 mac 的内存当显存并据此认为价格合理的那些
2023-06-07 11:49:48 +08:00
回复了 polobug 创建的主题 Apple 库克的内存和存储还是那么抠,可吐了
@dlwlrm 除非你说的是推理而不是训练, 正常训练数据集预处理逻辑吃内存随随便便上百 G, 老黄给 gh200 配单节点 96G HBM3+480GB lpddr5x 这个比例足够体现主流需求的显存内存消耗占比了
2023-06-07 11:40:23 +08:00
回复了 polobug 创建的主题 Apple 库克的内存和存储还是那么抠,可吐了
@dlwlrm 我说的就是炼丹啊, 内存吃的远比显存多
不吹的人能现在就体验?
2023-06-06 15:59:47 +08:00
回复了 ShadowPower 创建的主题 Apple 什么样的用户会需要新款 Mac Pro?
@terrysnake 什么专业计算卡会考虑往要供电没供电要驱动没驱动的 macpro 上插...
2023-06-06 15:29:59 +08:00
回复了 polobug 创建的主题 Apple 库克的内存和存储还是那么抠,可吐了
@dlwlrm 这多少自我 pua 了, 通常能用 20g 显存的项目跑起来少说得用个百来 g 内存
2023-02-03 13:50:26 +08:00
回复了 xd880616 创建的主题 Aple 为什么对于是否买 mbp 的评价都是能否用它赚钱?
你说的这 4 点 "易上手;软件生态;全家桶;隐私"
就我的使用体验而言 易上手和软件生态 mac 是最烂的那一档, 还不如 ubuntu
全家桶确实还算好用
隐私不予置评
2022-10-25 19:01:23 +08:00
回复了 18115692244 创建的主题 Apple 的产品,哪一点最让你觉得不爽。
教我怎么用
2022-10-22 04:07:28 +08:00
回复了 xstress 创建的主题 Apple 想问一下大家的 iPad pro 用处大吗?
纯吃灰,用了一阵就意识到没有任何实际的使用场景
想记笔记,很快就意识到记了也绝对不会翻出来看,完全就是伪需求
想看剧,端着手酸,小屏不如手机大屏不如躺着看显示器
2022-09-19 17:21:16 +08:00
回复了 stroh 创建的主题 Apple IPhone14pro 的灵动岛,不会用一年就弃了吧?
灵动岛都能夸, 买椟还珠不过如此
2022-09-19 16:08:51 +08:00
回复了 noahhhh 创建的主题 Apple 苹果应该是电子垃圾占比最少的厂商吧
你有没有想过一种可能性, 别人根本就不当厂家粉, 靠信仰坚持用垃圾的就那么一小撮人, 而靠信仰的那一部分果粉花着最多的钱用着最多的垃圾
2022-09-18 14:12:47 +08:00
回复了 BMPixel 创建的主题 MacBook Pro mbp 何时有望换掉刘海屏
都变成产品 logo 了, 怕是能换掉也不会换掉了
1  2  
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3246 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 25ms UTC 11:51 PVG 19:51 LAX 04:51 JFK 07:51
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86