コンテンツにスキップ

StarVLA ドキュメント

モジュラーで拡張可能なコードベースで、Vision-Language-Actionモデルの構築、トレーニング、評価を行います。

StarVLAは、Vision-Language Model(VLM)をVision-Language-Action(VLA)モデルに変換するためのモジュラーで柔軟なコードベースです。各コンポーネント(モデル、データ、トレーナー、設定、評価)は高凝集・低結合の設計原則に基づいており、プラグアンドプレイの研究と高速なイテレーションを可能にします。

🚀 クイックスタート

環境構築、動作確認、評価、トレーニングのワークフロー。

はじめる →

📖 プロジェクト概要

StarVLAの概要、現在の機能、主要リンク。

概要を読む →

📚 よくある質問

設定、バックボーン、トレーニングに関するよくある質問。

FAQを読む →