跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.osmosis.ai/llms.txt

Use this file to discover all available pages before exploring further.

Osmosis Platform 是用于管理 LLM 强化学习训练的 Web dashboard。它处理 workspace 设置、GitHub 仓库连接、GPU 配置、训练编排、指标采集和 checkpoint 部署,让您专注于定义 agent 行为和评估逻辑。

核心能力

Workspaces

通过基于角色的权限管理团队、数据集、训练任务、模型、deployments 和 workspace repository 访问。

Training Runs

用可配置的超参数和 checkpoint cadence 提交、监控和管理 RL 训练任务。

Datasets

上传并验证最大 5 GB 的 JSONL、CSV 或 Parquet 训练数据集。

Models

列出受支持的 base models,并使用已训练 checkpoints 进行部署。

Monitoring

跟踪训练任务状态、指标、checkpoints 和 outputs。

Git Integration

创建或连接 workspace repository,以自动同步 rollouts 和 configs。

工作方式

从设置到部署 checkpoint 的典型流程分为五个阶段:
1

完成 onboarding

Onboarding 开始,创建或加入平台 workspace、连接 GitHub、clone workspace repository、安装 CLI,并验证本地 workspace context。
2

选择第一个工作流

使用内置 Multiply 示例 跑通一条已知可用的首次训练路径;如果您已经有任务或数据集,请使用 创建自己的 Rollout
3

本地评估

在训练前,用本地数据集测试 rollout 行为。local eval 可以尽早发现 dataset、dependency、workflow 和 grader 问题。
4

Push、同步并训练

将 rollout 修改 push 到 GitHub。Git Sync 会发布训练使用的代码版本,然后 osmosis train submit 启动训练任务。
5

监控并部署

在 dashboard 中跟踪指标、checkpoints 和 outputs。训练任务完成后,部署 checkpoint。

准备开始?

Onboarding

按完整 workspace 设置流程操作,适用于创建者和被邀请成员。

Quickstart

Onboarding 后,运行内置 example,从 local eval 到训练。