跳转到内容

StarVLA 文档

用模块化、可扩展的代码库构建、训练并评测视觉-语言-动作模型。

快速开始技术报告模型库 GitHub

StarVLA 是什么？

StarVLA 是一个用于开发视觉-语言模型（VLM）到视觉-语言-动作模型（VLA）的模块化代码库。模型、数据、训练、配置、评测等组件遵循高内聚低耦合原则，支持即插即用和快速迭代。

文档速览

🚀 快速开始

覆盖环境配置、快速验证、评测与训练流程。

开始上手 →

📖 项目概览

了解 StarVLA 的定位、能力与关键入口。

阅读概览 →

🧩 乐高式设计

了解模块化设计原则与边界定义。

查看设计 →

🤖 模型库

已发布模型与微调检查点汇总。

查看模型库 →

📚 常见问题

配置、骨干模型与训练流程常见问答。