跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.osmosis.ai/llms.txt

Use this file to discover all available pages before exploring further.

数据集

数据集提供驱动 RL 训练的训练提示词和标准答案。数据集中的每一行都会成为模型学习的训练样本。

数据集格式

Osmosis 接受 JSONLCSVParquet 格式的数据集,单个文件最大 5 GB

必需列

列名描述
system_prompt为该样本提供给模型的系统提示词。
user_prompt模型需要回答的用户提示词或问题。
ground_truth期望的正确答案或参考输出。平台 UI 也接受 label 作为此列的别名。

可选列

列名描述
metadata附加到每个样本的任意 JSON 元数据。可在 Grader 中通过 extra_info 访问。

JSONL 示例

{"system_prompt": "You are a helpful math tutor.", "user_prompt": "What is 15 * 23?", "ground_truth": "345"}
{"system_prompt": "You are a helpful math tutor.", "user_prompt": "Simplify 3/9.", "ground_truth": "1/3"}

上传数据集

osmosis dataset upload data/train.jsonl
上传后,数据集进入处理流水线。您可以查看其状态:
状态描述
pending上传已接收,等待处理。
processing数据集正在验证和索引中。
uploaded数据集已就绪,可用于训练任务。
error处理失败 —— 请检查列名和文件格式。
cancelled上传在处理完成前被取消。

本地验证

上传前,可在本地验证数据集以尽早发现格式问题:
osmosis dataset validate data/train.jsonl
这会检查列名、数据类型和文件格式,而不上传到平台。

预览数据集

预览已上传数据集的前几行:
osmosis dataset preview my-dataset --rows 5

管理数据集

# 列出当前工作区中的所有数据集
osmosis dataset list

# 删除数据集
osmosis dataset delete my-dataset
删除数据集不会影响已经使用过它的训练任务,但数据集本身无法恢复。

模型

支持的基础模型

Osmosis 使用从 HuggingFace 导入的模型作为 RL 训练的起点。目前支持的训练兼容模型包括:
模型描述
Qwen/Qwen3.5-35B-A3BQwen 3.5 35B,3B 活跃参数 (MoE)
Qwen/Qwen3.5-122B-A10BQwen 3.5 122B,10B 活跃参数 (MoE)
支持的模型列表正在持续扩展。请查看平台仪表板或运行 osmosis model list 获取最新可用模型。

模型管理

# 列出工作区中可用的模型
osmosis model list

# 部署已训练的模型
osmosis model deploy my-model

# 将模型导出到 HuggingFace
osmosis model export my-model

私有模型

要使用 HuggingFace 上的私有模型,请在工作区设置的 Secrets 页面配置您的 HuggingFace 访问令牌。这允许平台在训练期间拉取受限或私有模型。 详情请参见监控与设置中的密钥管理说明。

下一步

训练任务

使用数据集和模型提交并管理训练任务。

监控与设置

跟踪训练进度并配置工作区设置。