🚀 Inicio Rápido
Configuración del entorno, verificaciones rápidas, evaluación y flujos de trabajo de entrenamiento.
StarVLA es una base de código modular y flexible para desarrollar modelos de Visión-Lenguaje (VLMs) en modelos de Visión-Lenguaje-Acción (VLA). Cada componente (modelo, datos, entrenador, configuración, evaluación) está diseñado con alta cohesión y bajo acoplamiento, permitiendo investigación plug-and-play e iteración rápida.
🚀 Inicio Rápido
Configuración del entorno, verificaciones rápidas, evaluación y flujos de trabajo de entrenamiento.
📖 Descripción del Proyecto
Qué es StarVLA, capacidades actuales y enlaces clave.
🧩 Diseño Tipo Lego
Los principios de diseño modular detrás de StarVLA.
🤖 Catálogo de Modelos
Modelos publicados y checkpoints de ajuste fino.
📚 Preguntas Frecuentes
Preguntas comunes sobre configuraciones, backbones y entrenamiento.