콘텐츠로 이동

RoboTwin 평가

RoboTwin 2.0은 50개의 태스크와 2가지 난이도(Easy / Hard, 서로 다른 장면 랜덤화)를 갖춘 양팔 로봇 조작 벤치마크로, 잡기, 쌓기, 도구 사용 등 다양한 조작 유형을 다룹니다.

이 문서는 RoboTwin 2.0에서의 실험 결과 재현 방법을 안내합니다.

평가 과정은 크게 두 부분으로 구성됩니다:

  1. robotwin 환경 및 의존성 설정.
  2. starVLArobotwin 환경 모두에서 서비스를 시작하여 평가 실행.

이 워크플로우는 NVIDIA 4090 GPU에서 정상 작동이 확인되었습니다.


RoboTwin 2.0 벤치마크 50개 태스크 결과:

Task NameStarVLA-OFT EasyStarVLA-OFT Hardπ0 Easyπ0 Hardπ0.5 Easyπ0.5 HardX-VLA EasyX-VLA HardMotus EasyMotus Hardlingbot-vla w/o depth Easylingbot-vla w/o depth Hardlingbot-vla w/ depth Easylingbot-vla w/ depth Hard
Adjust Bottle10099999510099100998993100100100100
Beat Block Hammer9392798496939288958887919289
Blocks Ranking RGB9998806392858383999792919291
Blocks Ranking Size798014549266774756366737670
Click Alarmclock585177689889999910010093269743
Click Bell23277148996610010010010032194336
Dump Bin Bigbin9194888392977977959197929797
Grab Roller100100989410010010010010010010099100100
Handover Block9793473166577337867380838395
Handover Mic98969797989700786394989499
Hanging Mug3429141118172327383832273453
Lift Pot1001008072968599100969910099100100
Move Can Pot9190684851558986347479848987
Move Pillbottle Pad98100674684617371939693949290
Move Playingcard Away1009874659684939810096969998100
Move Stapler Pad7490412456427873838574497448
Open Laptop981007181909693100959196969896
Open Microwave283943234777971959191759192
Pick Diverse Bottles8786693181715836909179868885
Pick Dual Bottles9193593793634736969082959990
Place A2B Left9095434787824849827986838985
Place A2B Right8895393487843636908774778080
Place Bread Basket9178624677648171919492939593
Place Bread Skillet8980664985667767868390899092
Place Burger Fries100100817694879494989895969894
Place Can Basket7575554662624952817668787572
Place Cans Plasticbox1009963459484979898949710010098
Place Container Plate99999792999597959899999999100
Place Dual Shoes9189595175757988938780838786
Place Empty Cup100100918510099100989998100100100100
Place Fan9495667187858075918791799287
Place Mouse Pad8794202060397070666882788679
Place Object Basket9394677080764439818790919088
Place Object Scale9393575286805274888584909088
Place Object Stand9998826891858688989797939388
Place Phone Stand8695495381818887878692939087
Place Shoe96100767692939695999799949999
Press Stapler9996443787839298939890888693
Put Bottles Dustbin9085655684797477817988929293
Put Object Cabinet8991736080794648887192868588
Rotate QRcode8890747089873433897393848682
Scan Object9491554272651436676691979296
Shake Bottle Horizontally10010098929999100100100981001009998
Shake Bottle1001009491999799100100979910010099
Stack Blocks Three948672529176610919592999695
Stack Blocks Two10010093799710092871009810010010099
Stack Bowls Three9591777577717686798772837177
Stack Bowls Two99100949595969693989892959097
Stamp Seal8690463379557682939276867477
Turn Switch6562414262544061847861656763
평균88.1888.3265.9258.4082.7476.7672.8072.8488.6687.0286.5085.3488.5686.68

참고: 50개 전체 태스크를 단일 모델로 학습했으며, 태스크당 50개의 클린 시연과 500개의 랜덤화된 시연으로 공동 학습했습니다.


환경 설정을 위해 먼저 공식 RoboTwin 설치 가이드를 참고하여 기본 robotwin 환경을 설치하세요.

그런 다음 추가 요구사항을 설치합니다:

Terminal window
pip install -r examples/Robotwin/eval_files/requirements.txt

그리고 examples/Robotwin/eval_files/eval.sh에서 ROBOTWIN_PATH를 편집합니다.


첫 번째 터미널에서 starVLA conda 환경을 활성화하고 실행합니다:

Terminal window
bash examples/Robotwin/eval_files/run_policy_server.sh

examples/Robotwin/eval_files/deploy_policy.ymlexamples/Robotwin/eval_files/run_policy_server.sh에서 체크포인트 경로를 편집하세요.


2단계. 시뮬레이션 시작 (robotwin 환경)

섹션 제목: “2단계. 시뮬레이션 시작 (robotwin 환경)”

두 번째 터미널에서 robotwin conda 환경을 활성화하고 실행합니다:

Terminal window
conda activate robotwin
cd examples/Robotwin/eval_files
bash eval.sh task_name demo_clean my_test_v1 0 0

eval.sh 스크립트는 5개의 위치 인자를 받습니다:

위치의미예시
1태스크 이름 (아래 목록 참조)adjust_bottle
2데이터 모드 (demo_clean 또는 demo_randomized)demo_clean
3실험 이름 (로깅용)my_test_v1
4시작 에피소드 인덱스0
5시뮬레이션용 GPU ID0

RoboTwin 2.0의 전체 태스크 목록:

adjust_bottle, beat_block_hammer, blocks_ranking_rgb, blocks_ranking_size,
click_alarmclock, click_bell, dump_bin_bigbin, grab_roller,
handover_block, handover_mic, hanging_mug, lift_pot,
move_can_pot, move_pillbottle_pad, move_playingcard_away, move_stapler_pad,
open_laptop, open_microwave, pick_diverse_bottles, pick_dual_bottles,
place_a2b_left, place_a2b_right, place_bread_basket, place_bread_skillet,
place_burger_fries, place_can_basket, place_cans_plasticbox, place_container_plate,
place_dual_shoes, place_empty_cup, place_fan, place_mouse_pad,
place_object_basket, place_object_scale, place_object_stand, place_phone_stand,
place_shoe, press_stapler, put_bottles_dustbin, put_object_cabinet,
rotate_qrcode, scan_object, shake_bottle_horizontally, shake_bottle,
stack_blocks_three, stack_blocks_two, stack_bowls_three, stack_bowls_two,
stamp_seal, turn_switch

모든 모드에는 demo_cleandemo_randomized가 포함됩니다.