StarVLA Dokumentation

Erstellen, trainieren und evaluieren Sie Vision-Language-Action-Modelle mit einer modularen, erweiterbaren Codebasis.

Schnellstart Technischer Bericht Model Zoo GitHub

Was ist StarVLA?

StarVLA ist eine modulare und flexible Codebasis zur Entwicklung von Vision-Language-Modellen (VLMs) zu Vision-Language-Action-Modellen (VLA). Jede Komponente (Modell, Daten, Trainer, Konfiguration, Evaluation) ist auf hohe Kohaesion und geringe Kopplung ausgelegt, was Plug-and-Play-Forschung und schnelle Iteration ermoeglicht.

Dokumentation im Ueberblick

🚀 Schnellstart

Umgebungseinrichtung, schnelle Pruefungen, Evaluations- und Trainings-Workflows.

Erste Schritte →

📖 Projektuebersicht

Was StarVLA ist, aktuelle Funktionen und wichtige Links.

Uebersicht lesen →

🧩 Baukastenprinzip

Die modularen Designprinzipien hinter StarVLA.

Design ansehen →

🤖 Model Zoo

Veroeffentlichte Modelle und Feinabstimmungs-Checkpoints.

Model Zoo ansehen →

📚 FAQ

Haeufige Fragen zu Konfigurationen, Backbones und Training.

FAQ lesen →