Documentation Index
Fetch the complete documentation index at: https://docs.osmosis.ai/llms.txt
Use this file to discover all available pages before exploring further.
数据集
数据集提供驱动 RL 训练的训练提示词和标准答案。数据集中的每一行都会成为模型学习的训练样本。数据集格式
Osmosis 接受 JSONL、CSV 或 Parquet 格式的数据集,单个文件最大 5 GB。必需列
| 列名 | 描述 |
|---|---|
system_prompt | 为该样本提供给模型的系统提示词。 |
user_prompt | 模型需要回答的用户提示词或问题。 |
ground_truth | 期望的正确答案或参考输出。平台 UI 也接受 label 作为此列的别名。 |
可选列
| 列名 | 描述 |
|---|---|
metadata | 附加到每个样本的任意 JSON 元数据。可在 Grader 中通过 extra_info 访问。 |
JSONL 示例
上传数据集
| 状态 | 描述 |
|---|---|
| pending | 上传已接收,等待处理。 |
| processing | 数据集正在验证和索引中。 |
| uploaded | 数据集已就绪,可用于训练任务。 |
| error | 处理失败 —— 请检查列名和文件格式。 |
| cancelled | 上传在处理完成前被取消。 |
本地验证
上传前,可在本地验证数据集以尽早发现格式问题:预览数据集
预览已上传数据集的前几行:管理数据集
模型
支持的基础模型
Osmosis 使用从 HuggingFace 导入的模型作为 RL 训练的起点。目前支持的训练兼容模型包括:| 模型 | 描述 |
|---|---|
Qwen/Qwen3.5-35B-A3B | Qwen 3.5 35B,3B 活跃参数 (MoE) |
Qwen/Qwen3.5-122B-A10B | Qwen 3.5 122B,10B 活跃参数 (MoE) |
支持的模型列表正在持续扩展。请查看平台仪表板或运行
osmosis model list 获取最新可用模型。模型管理
私有模型
要使用 HuggingFace 上的私有模型,请在工作区设置的 Secrets 页面配置您的 HuggingFace 访问令牌。这允许平台在训练期间拉取受限或私有模型。 详情请参见监控与设置中的密钥管理说明。下一步
训练任务
使用数据集和模型提交并管理训练任务。
监控与设置
跟踪训练进度并配置工作区设置。