Aller au contenu

Documentation StarVLA

Construisez, entrainez et evaluez des modeles Vision-Langage-Action avec un codebase modulaire et extensible.

StarVLA est un codebase modulaire et flexible pour transformer des modeles de Vision-Langage (VLM) en modeles de Vision-Langage-Action (VLA). Chaque composant (modele, donnees, entraineur, configuration, evaluation) est concu pour une forte cohesion et un faible couplage, permettant une recherche plug-and-play et une iteration rapide.

🚀 Demarrage rapide

Configuration de l’environnement, verifications rapides, evaluation et workflows d’entrainement.

Commencer →

📚 FAQ

Questions frequentes sur les configurations, les backbones et l’entrainement.

Lire la FAQ →