콘텐츠로 이동

RoboCasa 평가

RoboCasa는 대규모 가정용 시뮬레이션 벤치마크입니다. 여기서는 Fourier GR1 휴머노이드 로봇(상체, 양팔)이 수행하는 24개의 테이블탑 Pick-and-Place 태스크로 구성된 GR1 Tabletop Tasks 서브셋을 사용합니다.

이 문서는 실험 결과 재현 방법을 안내합니다.

평가 과정은 크게 두 부분으로 구성됩니다:

  1. robocasa 환경 및 의존성 설정.
  2. starVLArobocasa 환경 모두에서 서비스를 시작하여 평가 실행.

이 워크플로우는 NVIDIA A100 GPU에서 정상 작동이 확인되었습니다.


태스크GR00T-N1.6StarVLA-GR00T-Qwen3StarVLA-π-Qwen3StarVLA-OFT-Qwen3StarVLA-FAST-Qwen3
PnP Bottle To Cabinet Close51.546.026.030.038.0
PnP Can To Drawer Close13.080.062.076.044.0
PnP Cup To Drawer Close8.554.042.044.056.0
PnP Milk To Microwave Close14.048.050.044.044.0
PnP Potato To Microwave Close41.528.042.032.014.0
PnP Wine To Cabinet Close16.546.032.036.014.0
PnP Novel From Cuttingboard To Basket58.048.040.050.054.0
PnP Novel From Cuttingboard To Cardboardbox46.540.046.040.042.0
PnP Novel From Cuttingboard To Pan68.568.060.070.058.0
PnP Novel From Cuttingboard To Pot65.052.040.054.058.0
PnP Novel From Cuttingboard To Tieredbasket46.556.044.038.040.0
PnP Novel From Placemat To Basket58.542.044.032.036.0
PnP Novel From Placemat To Bowl57.544.052.058.038.0
PnP Novel From Placemat To Plate63.048.050.052.042.0
PnP Novel From Placemat To Tieredshelf28.518.028.024.018.0
PnP Novel From Plate To Bowl57.060.052.060.052.0
PnP Novel From Plate To Cardboardbox43.550.040.050.030.0
PnP Novel From Plate To Pan51.054.036.066.048.0
PnP Novel From Plate To Plate78.770.048.068.050.0
PnP Novel From Tray To Cardboardbox51.538.034.044.028.0
PnP Novel From Tray To Plate71.056.064.056.034.0
PnP Novel From Tray To Pot64.550.044.062.046.0
PnP Novel From Tray To Tieredbasket57.036.050.054.036.0
PnP Novel From Tray To Tieredshelf31.516.028.030.016.0
평균47.647.843.948.839.0

참고: 모든 값은 성공률(%)입니다. 단일 모델로 24개 전체 태스크를 학습했습니다. 결과는 태스크당 50회 롤아웃 기준입니다.


먼저 다음에서 체크포인트를 다운로드합니다:

환경 설정을 위해 먼저 공식 RoboCasa 설치 가이드를 참고하여 기본 robocasa-gr1-tabletop-tasks 환경을 설치하세요.

그런 다음 소켓 지원을 설치합니다:

Terminal window
pip install tyro

첫 번째 터미널에서 starVLA conda 환경을 활성화하고 실행합니다:

Terminal window
python deployment/model_server/server_policy.py \
--ckpt_path ${your_ckpt} \
--port 5678 \
--use_bf16

2단계. 시뮬레이션 시작 (robocasa 환경)

섹션 제목: “2단계. 시뮬레이션 시작 (robocasa 환경)”

두 번째 터미널에서 robocasa conda 환경을 활성화하고 실행합니다:

Terminal window
export PYTHONPATH=$(pwd):${PYTHONPATH}
your_ckpt=StarVLA/Qwen3-VL-OFT-Robocasa/checkpoints/steps_90000_pytorch_model.pt
python examples/Robocasa_tabletop/eval_files/simulation_env.py\
--args.env_name ${env_name} \
--args.port 5678 \
--args.n_episodes 50 \
--args.n_envs 1 \
--args.max_episode_steps 720 \
--args.n_action_steps 12 \
--args.video_out_path ${video_out_path} \
--args.pretrained_path ${your_ckpt}

GPU가 더 있다면 일괄 평가 스크립트를 사용할 수 있습니다:

Terminal window
bash examples/Robocasa_tabletop/batch_eval_args.sh

참고: batch_eval_args.sh에서 올바른 체크포인트 경로를 지정했는지 확인하세요.


HuggingFace에서 PhysicalAI-Robotics-GR00T-X-Embodiment-Sim 디렉토리 데이터셋을 playground/Datasets/nvidia/PhysicalAI-Robotics-GR00T-X-Embodiment-Sim 디렉토리에 다운로드합니다.

관련 파인튜닝 폴더만 다운로드하려면 GR00T-N1.5 저장소의 안내를 참고하세요.

또는 스크립트를 사용하여 *_1000 폴더를 다운로드합니다:

Terminal window
python examples/Robocasa_tabletop/download_gr00t_ft_data.py

data_mix 파라미터를 수정하여 다양한 데이터셋을 선택할 수 있으며, 다음 스크립트로 *_1000 데이터셋을 파인튜닝할 수 있습니다:

Terminal window
bash examples/Robocasa_tabletop/train_files/run_robocasa.sh