第 1 步:创建您的账户
- 前往 platform.osmosis.ai 并注册
- 创建一个新的工作空间(或通过团队邀请加入现有工作空间)
- 您将进入工作空间仪表板
第 2 步:安装 SDK
安装 Osmosis Python SDK 并进行身份验证:osmosis login 命令会打开浏览器进行平台身份验证,并将 CLI token 存储在本地。
第 3 步:创建项目
在您的工作空间仪表板中:- 点击 New Project
- 为其命名并添加描述
- 选择您的 rollout 模式 —— 这决定了您如何连接代码:
- Local Rollout:连接包含 reward 函数和工具的 GitHub 仓库
- Remote Rollout:指向您托管的 rollout 服务器
第 4 步:选择您的路径
Local Rollout
将 reward 函数、rubric 和 MCP 工具推送到 GitHub —— Osmosis 自动同步并运行所有内容。
Remote Rollout
构建并托管您自己的 agent 服务器,完全控制 rollout 逻辑和工具执行。
第 5 步:配置训练
当您的代码已连接(通过 Local Rollout 或 Remote Rollout)后:- 在您的项目中导航至 Training Runs
- 点击 New Training Run
- 选择基础模型、数据集、reward 函数和工具
- 配置超参数(或使用默认值)
- 点击 Start Training
第 6 步:监控与导出
训练运行期间:- 在监控仪表板上查看实时指标
- 查看训练日志和检查点
- 满意后,合并检查点并导出到 Hugging Face