Zum Inhalt springen

StarVLA Dokumentation

Erstellen, trainieren und evaluieren Sie Vision-Language-Action-Modelle mit einer modularen, erweiterbaren Codebasis.

StarVLA ist eine modulare und flexible Codebasis zur Entwicklung von Vision-Language-Modellen (VLMs) zu Vision-Language-Action-Modellen (VLA). Jede Komponente (Modell, Daten, Trainer, Konfiguration, Evaluation) ist auf hohe Kohaesion und geringe Kopplung ausgelegt, was Plug-and-Play-Forschung und schnelle Iteration ermoeglicht.

🚀 Schnellstart

Umgebungseinrichtung, schnelle Pruefungen, Evaluations- und Trainings-Workflows.

Erste Schritte →

📖 Projektuebersicht

Was StarVLA ist, aktuelle Funktionen und wichtige Links.

Uebersicht lesen →

📚 FAQ

Haeufige Fragen zu Konfigurationen, Backbones und Training.

FAQ lesen →