跳转到内容

StarVLA 文档

用模块化、可扩展的代码库构建、训练并评测视觉-语言-动作模型。

StarVLA 是一个用于开发视觉-语言模型(VLM)到视觉-语言-动作模型(VLA)的模块化代码库。模型、数据、训练、配置、评测等组件遵循高内聚低耦合原则,支持即插即用和快速迭代。

🚀 快速开始

覆盖环境配置、快速验证、评测与训练流程。

开始上手 →

📖 项目概览

了解 StarVLA 的定位、能力与关键入口。

阅读概览 →

🧩 乐高式设计

了解模块化设计原则与边界定义。

查看设计 →

📚 常见问题

配置、骨干模型与训练流程常见问答。

阅读 FAQ →