コンテンツにスキップ

RoboCasa評価

RoboCasaは大規模な家事シミュレーションベンチマークです。ここでは GR1 Tabletop Tasks サブセットを使用し、Fourier GR1ヒューマノイドロボット(上半身、双腕)による24のテーブルトップPick-and-Placeタスクを行います。

このドキュメントでは実験結果を再現するための手順を提供します。

評価プロセスは以下の2つの主要な部分で構成されています:

  1. robocasa 環境と依存関係のセットアップ。
  2. starVLArobocasa の両方の環境でサービスを起動して評価を実行。

このワークフローは NVIDIA A100 GPUで正常に動作することを確認しています。


TaskGR00T-N1.6StarVLA-GR00T-Qwen3StarVLA-π-Qwen3StarVLA-OFT-Qwen3StarVLA-FAST-Qwen3
PnP Bottle To Cabinet Close51.546.026.030.038.0
PnP Can To Drawer Close13.080.062.076.044.0
PnP Cup To Drawer Close8.554.042.044.056.0
PnP Milk To Microwave Close14.048.050.044.044.0
PnP Potato To Microwave Close41.528.042.032.014.0
PnP Wine To Cabinet Close16.546.032.036.014.0
PnP Novel From Cuttingboard To Basket58.048.040.050.054.0
PnP Novel From Cuttingboard To Cardboardbox46.540.046.040.042.0
PnP Novel From Cuttingboard To Pan68.568.060.070.058.0
PnP Novel From Cuttingboard To Pot65.052.040.054.058.0
PnP Novel From Cuttingboard To Tieredbasket46.556.044.038.040.0
PnP Novel From Placemat To Basket58.542.044.032.036.0
PnP Novel From Placemat To Bowl57.544.052.058.038.0
PnP Novel From Placemat To Plate63.048.050.052.042.0
PnP Novel From Placemat To Tieredshelf28.518.028.024.018.0
PnP Novel From Plate To Bowl57.060.052.060.052.0
PnP Novel From Plate To Cardboardbox43.550.040.050.030.0
PnP Novel From Plate To Pan51.054.036.066.048.0
PnP Novel From Plate To Plate78.770.048.068.050.0
PnP Novel From Tray To Cardboardbox51.538.034.044.028.0
PnP Novel From Tray To Plate71.056.064.056.034.0
PnP Novel From Tray To Pot64.550.044.062.046.0
PnP Novel From Tray To Tieredbasket57.036.050.054.036.0
PnP Novel From Tray To Tieredshelf31.516.028.030.016.0
平均47.647.843.948.839.0

注意: すべての値は成功率(%)です。24タスクすべてに対して単一のモデルでトレーニングされています。結果はタスクあたり50回のロールアウトで報告されています。


0. チェックポイントのダウンロード

Section titled “0. チェックポイントのダウンロード”

まず、以下からチェックポイントをダウンロードします:

環境をセットアップするには、まず公式RoboCasaインストールガイドに従って、ベースの robocasa-gr1-tabletop-tasks 環境をインストールしてください。

次にソケットサポートをインストールします:

Terminal window
pip install tyro

ステップ1. サーバーの起動(starVLA環境)

Section titled “ステップ1. サーバーの起動(starVLA環境)”

最初のターミナルで starVLA conda環境をアクティベートして実行します:

Terminal window
python deployment/model_server/server_policy.py \
--ckpt_path ${your_ckpt} \
--port 5678 \
--use_bf16

ステップ2. シミュレーションの起動(robocasa環境)

Section titled “ステップ2. シミュレーションの起動(robocasa環境)”

2番目のターミナルで robocasa conda環境をアクティベートして実行します:

Terminal window
export PYTHONPATH=$(pwd):${PYTHONPATH}
your_ckpt=StarVLA/Qwen3-VL-OFT-Robocasa/checkpoints/steps_90000_pytorch_model.pt
python examples/Robocasa_tabletop/eval_files/simulation_env.py\
--args.env_name ${env_name} \
--args.port 5678 \
--args.n_episodes 50 \
--args.n_envs 1 \
--args.max_episode_steps 720 \
--args.n_action_steps 12 \
--args.video_out_path ${video_out_path} \
--args.pretrained_path ${your_ckpt}

GPUが複数ある場合は、バッチ評価スクリプトを使用できます:

Terminal window
bash examples/Robocasa_tabletop/batch_eval_args.sh

注意: batch_eval_args.sh で正しいチェックポイントパスを指定していることを確認してください。


ステップ0: トレーニングデータセットのダウンロード

Section titled “ステップ0: トレーニングデータセットのダウンロード”

HuggingFaceからPhysicalAI-Robotics-GR00T-X-Embodiment-Simディレクトリのデータセットを playground/Datasets/nvidia/PhysicalAI-Robotics-GR00T-X-Embodiment-Sim ディレクトリにダウンロードします。

関連するファインチューニングフォルダのみをダウンロードするには、GR00T-N1.5リポジトリの手順を参照してください。

または、スクリプトを使用して *_1000 フォルダをダウンロードします:

Terminal window
python examples/Robocasa_tabletop/download_gr00t_ft_data.py

ステップ1: トレーニングの開始

Section titled “ステップ1: トレーニングの開始”

パラメータ data_mix を変更することで異なるデータセットを選択でき、以下のスクリプトを使用して *_1000 データセットのファインチューニングを行えます:

Terminal window
bash examples/Robocasa_tabletop/train_files/run_robocasa.sh