数据集与模型

数据集

数据集提供驱动 RL 训练的训练提示词和标准答案。数据集中的每一行都会成为模型学习的训练样本。

数据集格式

Osmosis 接受 JSONL、CSV 或 Parquet 格式的数据集，单个文件最大 5 GB。

必需列

列名	描述
`system_prompt`	为该样本提供给模型的系统提示词。
`user_prompt`	模型需要回答的用户提示词或问题。
`ground_truth`	期望的正确答案或参考输出。平台 UI 也接受 `label` 作为此列的别名。

可选列

列名	描述
`metadata`	附加到每个样本的任意 JSON 元数据。可在 Grader 中通过 `extra_info` 访问。

JSONL 示例

{"system_prompt": "You are a helpful math tutor.", "user_prompt": "What is 15 * 23?", "ground_truth": "345"}
{"system_prompt": "You are a helpful math tutor.", "user_prompt": "Simplify 3/9.", "ground_truth": "1/3"}

上传数据集

osmosis dataset upload data/train.jsonl

上传后，数据集进入处理流水线。您可以查看其状态：

状态	描述
pending	上传已接收，等待处理。
processing	数据集正在验证和索引中。
uploaded	数据集已就绪，可用于训练任务。
error	处理失败 —— 请检查列名和文件格式。
cancelled	上传在处理完成前被取消。

本地验证

上传前，可在本地验证数据集以尽早发现格式问题：

osmosis dataset validate data/train.jsonl

这会检查列名、数据类型和文件格式，而不上传到平台。

预览数据集

预览已上传数据集的前几行：

osmosis dataset preview my-dataset --rows 5

管理数据集

# 列出当前工作区中的所有数据集
osmosis dataset list

# 删除数据集
osmosis dataset delete my-dataset

删除数据集不会影响已经使用过它的训练任务，但数据集本身无法恢复。

模型

支持的基础模型

Osmosis 使用从 HuggingFace 导入的模型作为 RL 训练的起点。目前支持的训练兼容模型包括：

模型	描述
`Qwen/Qwen3.5-35B-A3B`	Qwen 3.5 35B，3B 活跃参数 (MoE)
`Qwen/Qwen3.5-122B-A10B`	Qwen 3.5 122B，10B 活跃参数 (MoE)

支持的模型列表正在持续扩展。请查看平台仪表板或运行 osmosis model list 获取最新可用模型。

模型管理

# 列出工作区中可用的模型
osmosis model list

# 部署已训练的模型
osmosis model deploy my-model

# 将模型导出到 HuggingFace
osmosis model export my-model

私有模型

要使用 HuggingFace 上的私有模型，请在工作区设置的 Secrets 页面配置您的 HuggingFace 访问令牌。这允许平台在训练期间拉取受限或私有模型。详情请参见监控与设置中的密钥管理说明。

平台

Documentation Index

​数据集

​数据集格式

​必需列

​可选列

​JSONL 示例

​上传数据集

​本地验证

​预览数据集

​管理数据集

​模型

​支持的基础模型

​模型管理

​私有模型

​下一步

训练任务

监控与设置

数据集

数据集格式

必需列

可选列

JSONL 示例

上传数据集

本地验证

预览数据集

管理数据集

模型

支持的基础模型

模型管理

私有模型

下一步