🚀 Demarrage rapide
Configuration de l’environnement, verifications rapides, evaluation et workflows d’entrainement.
StarVLA est un codebase modulaire et flexible pour transformer des modeles de Vision-Langage (VLM) en modeles de Vision-Langage-Action (VLA). Chaque composant (modele, donnees, entraineur, configuration, evaluation) est concu pour une forte cohesion et un faible couplage, permettant une recherche plug-and-play et une iteration rapide.
🚀 Demarrage rapide
Configuration de l’environnement, verifications rapides, evaluation et workflows d’entrainement.
📖 Vue d'ensemble du projet
Ce qu’est StarVLA, ses capacites actuelles et les liens essentiels.
🧩 Conception modulaire
Les principes de conception modulaire derriere StarVLA.
🤖 Model Zoo
Modeles publies et checkpoints de fine-tuning.
📚 FAQ
Questions frequentes sur les configurations, les backbones et l’entrainement.