文章目录
- 一、CVAT 简介与核心特性
- 1. 基本信息
- 2. 主要功能
- 3. 使用方式(简要)
- 二、类似工具对比
- 三、选型建议
CVAT(Computer Vision Annotation Tool)是一款由 Intel 开发并开源的、功能强大的计算机视觉数据标注工具,支持图像和视频的2D/3D 标注,广泛应用于目标检测、实例分割、关键点标注、动作识别等任务。
一、CVAT 简介与核心特性
1. 基本信息
- 官网:https://cvat.org
- 开源地址:https://github.com/cvat-ai/cvat
- 许可证:MIT(自 v2.0 起)
- 部署方式:支持 Docker 本地部署、云部署(如 CVAT.ai 托管版本)
2. 主要功能
- 支持标注类型:
- 矩形框(Bounding Box)
- 多边形(Polygon)
- 折线(Polyline)
- 关键点(Points / Skeletons)
- 语义/实例分割(Masks via polygons or brush)
- 跟踪(Interpolation across video frames)
- 3D 点云标注(需集成 Sensor Fusion)
- 协作功能:
- 多用户协作(项目权限管理、任务分配)
- 审核工作流(annotator → reviewer)
- 自动化辅助:
- 集成 AI 模型(如 Auto-Annotation 功能,可接入 OpenVINO、TensorFlow、PyTorch 模型)
- 支持 SAM(Segment Anything)、YOLO 等预训练模型辅助标注
- 数据格式支持:
- 导入:Images, Videos, ZIP, Image folders, YouTube 链接等
- 导出:COCO, Pascal VOC, YOLO, TFRecord, MOT, LabelMe, Datumaro 等
3. 使用方式(简要)
本地部署(推荐 Docker):
gitclone https://github.com/cvat-ai/cvatcdcvat docker-compose up -d默认访问
http://localhost:8080创建项目 → 上传数据 → 创建任务 → 标注 → 导出
AI 辅助标注:
- 在任务中启用 “Automatic Annotation” 模型(需先配置模型仓库)
- 或使用 “Interactive Annotation”(如用 SAM 点选分割)
二、类似工具对比
| 工具 | 类型 | 开源 | 多人协作 | 视频标注 | AI 辅助 | 3D/点云 | 部署难度 | 适合场景 |
|---|---|---|---|---|---|---|---|---|
| CVAT | Web | ✅ | ✅ | ✅(强) | ✅(强) | ✅(需配置) | 中 | 工业级、研究、团队协作 |
| LabelMe | 桌面/Web | ✅ | ❌ | ❌ | ❌ | ❌ | 低 | 小规模图像分割/多边形 |
| VIA (VGG Image Annotator) | Web(单文件 HTML) | ✅ | ❌ | 有限 | ❌ | ❌ | 极低 | 快速原型、教学 |
| AnyLabeling | 桌面(Qt) | ✅ | ❌ | ❌ | ✅(YOLO, SAM, GroundingDINO 等) | ❌ | 低 | 个人使用、AI 辅助强 |
| Roboflow Annotate | Web(SaaS) | ❌ | ✅ | ✅ | ✅ | ❌ | 无(云端) | 快速上手、中小项目 |
| SuperAnnotate | Web(SaaS) | ❌ | ✅ | ✅ | ✅ | ✅ | 无 | 企业级、高精度需求 |
| Label Studio | Web | ✅ | ✅ | ✅(需配置) | ✅(通过 ML backend) | 有限 | 中 | 多模态(文本/音频/图像) |
| Docker Annotator / RectLabel(Mac) | 桌面 | ❌(RectLabel) | ❌ | ❌ | 有限 | ❌ | 低 | 个人、Mac 用户 |
特别说明:
- AnyLabeling:如果你偏好桌面应用、且重视本地 AI 模型辅助(如实时 SAM 分割),它是 CVAT 的轻量级替代。
- Label Studio:如果你需要标注多模态数据(如图文对、语音+文本),它更灵活。
- CVAT在视频时序标注、团队协作、格式兼容性上综合优势明显。
三、选型建议
- 科研/工业级项目、需视频跟踪、多人协作→CVAT
- 个人快速标注 + AI 辅助 + 无需部署→AnyLabeling
- 纯图像、小数据集、教学演示→LabelMe或VIA
- 多模态(含文本、音频)→Label Studio
- 企业级、高精度、不想运维→Roboflow / SuperAnnotate(付费)