StarVLA ドキュメント

モジュラーで拡張可能なコードベースで、Vision-Language-Actionモデルの構築、トレーニング、評価を行います。

StarVLAとは？

StarVLAは、Vision-Language Model（VLM）をVision-Language-Action（VLA）モデルに変換するためのモジュラーで柔軟なコードベースです。各コンポーネント（モデル、データ、トレーナー、設定、評価）は高凝集・低結合の設計原則に基づいており、プラグアンドプレイの研究と高速なイテレーションを可能にします。

ドキュメント一覧

🚀 クイックスタート

環境構築、動作確認、評価、トレーニングのワークフロー。

はじめる →

📖 プロジェクト概要

StarVLAの概要、現在の機能、主要リンク。

概要を読む →

🧩 レゴ式設計

StarVLAのモジュラー設計原則。

設計を見る →

🤖 モデルライブラリ

リリース済みモデルとファインチューニングのチェックポイント。

モデルライブラリを見る →

📚 よくある質問

設定、バックボーン、トレーニングに関するよくある質問。

FAQを読む →