V2EX mushuanl
 mushuanl 最近的时间轴更新
mushuanl

mushuanl

V2EX 第 183086 号会员,加入于 2016-07-21 18:46:44 +08:00
mushuanl 最近回复了
大模型主要瓶颈在内存访问速度,直接上 mac 然后 llama.cpp, 大于 13B 的也能玩
因为 13B 简单玩几次就腻烦了,参数越高性能越好
2023-12-31 16:49:32 +08:00
回复了 shuiguomayi 创建的主题 Linux 使用版本制的 Linux 大拿遇到系统更新是怎么做的?
一般应用和业务运行在 docker 或 k8s 内,主系统升级不影响
2023-09-19 22:18:04 +08:00
回复了 sunmacarenas 创建的主题 NVIDIA Nvidia Jetson AGX Ori 开发者套件
全尺寸模型,也就是 gpu 内存要求很大微调成本很高。一般就租云服务器去练习。
2023-09-19 22:16:52 +08:00
回复了 sunmacarenas 创建的主题 NVIDIA Nvidia Jetson AGX Ori 开发者套件
企业微调要求全尺寸 nv gpu ,个人玩可以用量化模型。另外现在企业微调的效果并不是很好,包括 rag(提供上下文进行推理),所以现在大模型开始有点冷了,就看看谷歌出的模型如何了。
2023-09-19 20:49:38 +08:00
回复了 sunmacarenas 创建的主题 NVIDIA Nvidia Jetson AGX Ori 开发者套件
现在开源大模型除了企业研究外其他普通人一般就用来生成 s 文和 s 聊天,功能太弱,最大的那个 180b 刚出,看看有没人调教,我体验过基本超过 gpt3.5 但是没到 gpt4, 不知道是否有人能发挥出它的性能
2023-09-19 20:45:05 +08:00
回复了 sunmacarenas 创建的主题 NVIDIA Nvidia Jetson AGX Ori 开发者套件
要跑 llama213b 那么 13900+ddr5 也够了, llama.cpp 大概 1 秒 5token ,跟得上自己的速度。但是关键是现在没有 ai 应用场景,也就是除了 gpt4 场景外 其他的比较弱,如果你不喜欢玩 roleplay ,并且没有自己的 ai 想法,那么可能过段新鲜感时间后基本就不玩了
2023-09-19 13:56:00 +08:00
回复了 sunmacarenas 创建的主题 NVIDIA Nvidia Jetson AGX Ori 开发者套件
计算力上去后大模型主要跟内存速度有关,要跑大模型并且想简单,还是建议 mac + llama.cpp, 800gb/s 速度可以直接跑 falcon 180b (得 192g 内存版本的) 个人觉得这个模型虽然微调难度大,但微调结果超过 gpt3.5
2023-09-05 08:03:04 +08:00
回复了 aldehyde 创建的主题 程序员 想接触硬件开发,从哪入手比较合适?
硬件学习曲线高试错成本高,都找科班出身的
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5962 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 16ms UTC 02:28 PVG 10:28 LAX 19:28 JFK 22:28
Do have faith in what you're doing.
ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86