🚀 Schnellstart
Umgebungseinrichtung, schnelle Pruefungen, Evaluations- und Trainings-Workflows.
StarVLA ist eine modulare und flexible Codebasis zur Entwicklung von Vision-Language-Modellen (VLMs) zu Vision-Language-Action-Modellen (VLA). Jede Komponente (Modell, Daten, Trainer, Konfiguration, Evaluation) ist auf hohe Kohaesion und geringe Kopplung ausgelegt, was Plug-and-Play-Forschung und schnelle Iteration ermoeglicht.
🚀 Schnellstart
Umgebungseinrichtung, schnelle Pruefungen, Evaluations- und Trainings-Workflows.
📖 Projektuebersicht
Was StarVLA ist, aktuelle Funktionen und wichtige Links.
🧩 Baukastenprinzip
Die modularen Designprinzipien hinter StarVLA.
🤖 Model Zoo
Veroeffentlichte Modelle und Feinabstimmungs-Checkpoints.
📚 FAQ
Haeufige Fragen zu Konfigurationen, Backbones und Training.