UniRL 文档
指南

数据和模型

Prompt 数据契约、本地数据集、模型代码包和 checkpoint 挂载。

数据契约

用户数据以 prompt 为核心。已提交的 prompt 列表在 datasets/ 下(如 datasets/pickscore/train.txt),更大的数据集建议挂载或 symlink 到 datasets/,并通过 DATA_PATH 或 recipe 的 data_source 块传入:

DATA_PATH=/abs/path/train.json \
bash examples/run_experiment_single_node.sh diffusion/sd3_trainside

prompt 文件格式和单条 prompt schema 见 数据准备

模型代码

模型实现包位于 unirl/models/。包结构和扩展契约以生成的 Model Package README 为准。

本地模型挂载

仓库根目录的 models/ 只用于本地 artifact(如 models/local/),不是 Python model code。Experiment YAML 和 model config 通过 Hydra 环境插值提供 HuggingFace 回退,例如:

pretrained_model_ckpt_path: ${oc.env:PRETRAINED_MODEL,stabilityai/stable-diffusion-3.5-medium}

不要提交 .bin.safetensors.pt.pth.ckpt 等大模型权重。

目录