1. 如何单独获取大模型的 modelfile 文件
我的服务器是内网,所以只能手动导入从其他地方下载的模型,然后导入到服务器中。
这个时候就出现一个问题:如果直接从 ollama 下载镜像,会顺带下载 modelfile 文件。
而我模型是自己导入的,每个大模型的 modelfile 文件都不一样,请问有什么单独获取 modelfile 的途径嘛?
2. 怎么部署大模型到指定显卡上
我的服务器有 2 块显卡,现在希望每块显卡都跑一个不同的大模型。
比如,我想让第一块显卡跑 qwen 大模型;第二块显卡跑 deepseek 。怎么如何指定呢?
