想请一位 K8S 和虚拟机专家来帮帮我, 虚拟机 GPU 容器的问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ALXG
V2EX    Kubernetes

想请一位 K8S 和虚拟机专家来帮帮我, 虚拟机 GPU 容器的问题

  •  
  •   ALXG 2022-11-22 17:04:00 +08:00 2356 次点击
    这是一个创建于 1053 天前的主题,其中的信息可能已经有所发展或是发生改变。
    几个要素: WSL, PVE, RKE2, Ubuntu Server, Rancher, CUDA, OpenCL,
    想用 Rancher 管理 RKE2 集群, 包括这么几个 nodes/workloads
    1. PVE(PCI 直通 HD8570)+Ubuntu/RKE2+MESA/视频推流
    2. PVE(PCI 直通 Tesla P4)+Ubuntu/RKE2+CUDA
    3. PVE(PCI 直通 Tesla P40)+Ubuntu/RKE2+CUDA
    4. PVE(PCI 直通 Tesla K20)+Ubuntu/RKE2+CUDA
    5. WSL(Win 驱动 HD6770/Tesla M40)+Ubuntu/RKE2+OpenCL/CUDA
    6. WSL(Win 驱动 HD7770/Tesla K20)+Ubuntu/RKE2+OpenCL/CUDA
    7. WSL(RTX 2070 主显卡)+Ubuntu/RKE2+OpenCL/CUDA
    8. WSL(RTX 3060 主显卡)+Ubuntu/RKE2+OpenCL/CUDA
    9. WSL(RTX 3090 主显卡)+Ubuntu/RKE2+OpenCL/CUDA
    10. PVE(GTX 1080 主显卡)+Ubuntu/RKE2+OpenCL/CUDA
    研究了一下感觉似乎是可以的. 感觉自己心力憔悴, 想请一位牛人出出主意.
    出咨询费, 有信心的牛人不用客气, 主要是要解决问题, 具体价格好说.
    有想讨论技术的, 直接跟帖也好.
    11 条回复    2022-12-15 01:40:42 +08:00
    ALXG
        1
    ALXG  
    OP
       2022-11-22 17:05:10 +08:00
    我是垃圾佬, 不知不觉就捡了这么多垃圾, 实在是想用起来.
    tftk
        2
    tftk  
       2022-11-22 19:38:06 +08:00
    请问怎么联系
    ALXG
        3
    ALXG  
    OP
       2022-11-22 21:07:18 +08:00
    @tftk d2VjaGF0OiBhbGV4LWdlb21ldHJ5
    defunct9
        4
    defunct9  
       2022-11-23 09:45:39 +08:00
    比较麻烦。把各个显卡通过 kvm 放进虚机,然后虚机再搭 docker ,上 k8s 比较好。不喜欢 rancher ,装一大堆乱七八糟的东西
    ALXG
        5
    ALXG  
    OP
       2022-11-23 13:34:28 +08:00
    @defunct9 如果 runtime 是 docker 的话, RKE 似乎也可以, 主要是我命令行苦手, 解决苦难还行, 日常使用就会特别难受.
    defunct9
        6
    defunct9  
       2022-11-23 14:55:43 +08:00
    反之,看见 dashboard 就烦,手撸 k8s 各种 yaml
    ALXG
        7
    ALXG  
    OP
       2022-11-24 08:14:24 +08:00
    @defunct9 我是记性不太好, 要是没有明显的形状就记不住
    senhtry
        8
    senhtry  
       2022-12-02 09:28:38 +08:00
    PVE 可以 passthrough 显卡到虚拟机里面,然后装 nvidia-container-runtime ,然后 rke ( k8s )用 nvidia 的 device-plugin 来使用 gpu 容器。
    PVE 因为是 pci 完全 passthrough 的,驱动这些应该和宿主机的用法差不多,没啥不同。
    WSL 应该有点问题,WSL 里面用的是 nv windows 的驱动,在上面使用 ubuntu 的方式来装 nvidia-container-runtime ,应该是有点问题的,不知道能不能直接使用。
    ALXG
        9
    ALXG  
    OP
       2022-12-07 01:23:42 +08:00
    @senhtry 我看 nv 的文档说 WSL 是可以直接用的 https://docs.nvidia.com/cuda/wsl-user-guide/index.html
    senhtry
        10
    senhtry  
       2022-12-12 09:00:46 +08:00
    @ALXG #9 可以看下,我这边没有问题了。如果能在 wsl2 上装 k8s ,那应该问题不大。
    ALXG
        11
    ALXG  
    OP
       2022-12-15 01:40:42 +08:00
    @senhtry K8S 能装, 这个已经证实了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2582 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 15:22 PVG 23:22 LAX 08:22 JFK 11:22
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86