跳转到内容

模型库

模型说明链接
Qwen2.5-VL-3B-Action扩展 Qwen2.5-VL 词表,加入 fast tokens(用于将连续动作离散化为 token 的特殊词表扩展)Hugging Face
Qwen3-VL-4B-Action扩展 Qwen3-VL 词表,加入 fast tokens(同上)Hugging Face
pi-fastpi-fast 动作 tokenizer 权重Hugging Face

Bridge 是 WidowX 桌面操作数据集,Fractal 是 Google RT-1 机器人操作数据集。

模型框架基座 VLM说明WidowX链接
Qwen2.5-FAST-Bridge-RT-1QwenFastQwen2.5-VL-3BBridge + Fractal58.6HF
Qwen2.5-OFT-Bridge-RT-1QwenOFTQwen2.5-VL-3BBridge + Fractal41.8HF
Qwen2.5-PI-Bridge-RT-1QwenPIQwen2.5-VL-3BBridge + Fractal62.5HF
Qwen2.5-GR00T-Bridge-RT-1QwenGR00TQwen2.5-VL-3BBridge + Fractal63.6HF
Qwen-GR00T-BridgeQwenGR00TQwen2.5-VL-3B仅 Bridge71.4HF
Qwen3VL-OFT-Bridge-RT-1QwenOFTQwen3-VL-4BBridge + Fractal42.7HF
Qwen3VL-GR00T-Bridge-RT-1QwenGR00TQwen3-VL-4BBridge + Fractal65.3HF
Florence-GR00T-Bridge-RT-1QwenGR00TFlorence-2Bridge + Fractal(小模型方案)-HF

WidowX 列:在 SimplerEnv 中 WidowX 机器人任务上的成功率(%),越高越好。

LIBERO 包含 4 个任务套件(Spatial、Object、Goal、Long Horizon),共 40 个任务。所有检查点均为 4 套件联合训练。详见 LIBERO 评测文档

模型框架基座 VLM链接
Qwen2.5-VL-FAST-LIBERO-4in1QwenFastQwen2.5-VL-3BHF
Qwen2.5-VL-OFT-LIBERO-4in1QwenOFTQwen2.5-VL-3BHF
Qwen2.5-VL-GR00T-LIBERO-4in1QwenGR00TQwen2.5-VL-3BHF
Qwen3-VL-OFT-LIBERO-4in1QwenOFTQwen3-VL-4BHF
Qwen3-VL-PI-LIBERO-4in1QwenPIQwen3-VL-4BHF

RoboCasa GR1 Tabletop Tasks,24 个桌面 Pick-and-Place 任务。详见 RoboCasa 评测文档

模型框架基座 VLM链接
Qwen3-VL-GR00T-Robocasa-gr1QwenGR00TQwen3-VL-4BHF
Qwen3-VL-OFT-RobocasaQwenOFTQwen3-VL-4BHF

RoboTwin 2.0 双臂操作基准,50 个任务。详见 RoboTwin 评测文档

模型框架基座 VLM链接
Qwen3-VL-OFT-Robotwin2-AllQwenOFTQwen3-VL-4BHF
Qwen3-VL-OFT-Robotwin2QwenOFTQwen3-VL-4BHF

BEHAVIOR-1K 家庭任务基准,使用 R1Pro 人形机器人。详见 BEHAVIOR 评测文档

模型说明链接
BEHAVIOR-QwenDual-taskall全部 50 个任务联合训练HF
BEHAVIOR-QwenDual-task1单任务训练HF
BEHAVIOR-QwenDual-task6-40k6 任务联合训练HF
BEHAVIOR-rgp-seg分割观测实验HF

数据集说明链接
LLaVA-OneVision-COCOVLM 联合训练用图文数据集(ShareGPT4V-COCO 子集)HF
RoboTwin-CleanRoboTwin 2.0 的 clean 演示数据(每任务 50 条)HF
RoboTwin-RandomizedRoboTwin 2.0 的 randomized 演示数据(每任务 500 条)HF
RoboTwin-Randomized-targz同上,tar.gz 打包格式(适合批量下载)HF
数据集说明链接
BEHAVIOR-1KBEHAVIOR-1K 基准的仿真环境配置HF
BEHAVIOR-1K-datasetsBEHAVIOR-1K 训练数据集HF
BEHAVIOR-1K-datasets-assetsBEHAVIOR-1K 场景与物体资源HF
BEHAVIOR-1K-VISUALIZATION-DEMOBEHAVIOR-1K 可视化演示HF
behavior-1k-task0单任务训练数据样例HF

下载检查点并启动策略服务器:

Terminal window
# 下载(需要安装 huggingface_hub)
huggingface-cli download StarVLA/Qwen3VL-GR00T-Bridge-RT-1 --local-dir ./results/Checkpoints/Qwen3VL-GR00T-Bridge-RT-1
# 启动策略服务器
python deployment/model_server/server_policy.py \
# steps_XXXXX 是训练步数,请替换为你下载的 checkpoint 中实际的文件名
# 例如 steps_50000_pytorch_model.pt,可通过 ls 查看具体文件名
--ckpt_path ./results/Checkpoints/Qwen3VL-GR00T-Bridge-RT-1/checkpoints/steps_XXXXX_pytorch_model.pt \
--port 5694 \
--use_bf16

然后参照你要测试的 Benchmark 评测指南进行评测(如 SimplerEnvLIBERORoboCasaRoboTwinBEHAVIOR)。