osmosis model 命令组下:列出、查看、部署、停用都通过 LoRA model 名称操作。
Base Models
Base models 从 Hugging Face 导入,并作为在 Osmosis 上训练的起点。受支持的 Base Models
我们当前支持:| Model | Description |
|---|---|
Qwen/Qwen3.6-35B-A3B | Qwen 3.6 35B,3B active parameters(MoE) |
Qwen/Qwen3.5-122B-A10B | Qwen 3.5 122B,10B active parameters(MoE) |
受支持模型列表会继续扩展。请查看平台 dashboard,或运行
osmosis model list --type base 获取最新可用 base models。列出 Base Models
LoRA Models
LoRA models 是 training runs 产生的已训练 checkpoints。Models 页面会将它们与 base models 分开列出,并显示 training run、checkpoint step、training reward、creation date,以及您的账号可用 inference deployment 时的 deployment status。查看 LoRA Models
列出 LoRA models:2 of 5 inference deployments used)。
部署 LoRA Model
训练任务完成后,先列出其 LoRA models 以选择要部署的一个:deploy 会重新激活它。对 already-active 的 LoRA model 再次执行 deploy 是 no-op。
调用 Inference Endpoint
已部署的 LoRA models 通过 OpenAI-compatible chat completions endpoint 提供服务:osmosis model info 提供的 canonical model 值。该 model 值格式为 <base_model_path>:<lora-model-name>。
如果您的账号不可用 inference deployment,deployment status、deployment quota 和 endpoint snippets 可能会被隐藏。
Undeploy
将 LoRA model 的部署切换为 inactive:undeploy 只会将 serving deployment 转为 inactive。undeploy 是幂等的 —— 对已处于 inactive 的 model 调用它是 no-op。
要求
- 在 workspace directory 中运行 model 命令,以便 CLI 可以从 Git
origin解析连接的 workspace。 - LoRA model 必须属于同一个 workspace 中的训练任务。
- 您的账号必须可用 inference deployment。部署 models 还需要 active subscription。
- GitHub 设置必须健康,训练才能产出新的 LoRA models。
下一步
数据集
上传并验证 evaluation runs 和 training runs 使用的数据集。
Training Runs
提交训练任务并查看其 LoRA models。
Command Reference
查看 model 和 deployment 命令及选项。