news 2026/3/24 18:30:36

【Labelme数据操作】LabelMe标注批量复制工具 - 完整教程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Labelme数据操作】LabelMe标注批量复制工具 - 完整教程

1. 脚本功能介绍

本脚本用于批量复制LabelMe标注信息,特别适用于以下场景:

  • 您有一批图片,其中物体位置、形状、大小基本相同
  • 您已经使用LabelMe标注了第一张图片
  • 您希望将第一张图片的标注信息快速复制到其他图片中
  • 需要自动适应不同图片的尺寸信息

核心功能:

  • 读取源JSON标注文件
  • 自动获取目标图片的尺寸信息
  • 保留所有标注形状、标签、颜色等信息
  • 为每张目标图片生成对应的LabelMe JSON标注文件
  • 支持多种常见图片格式

2. 环境依赖

2.1 安装必要的Python库

pipinstallopencv-python tqdm

2.2 依赖库说明

  • opencv-python: 用于读取图片获取尺寸信息
  • tqdm: 提供进度条显示,直观展示处理进度
  • json: 处理LabelMe的JSON标注文件
  • os: 文件路径操作
  • argparse: 命令行参数解析(当前版本已硬编码参数,但保留了扩展性)

3. 代码结构说明

3.1 主要函数

  • copy_labelme_annotations(): 核心功能函数,负责复制标注
  • main(): 程序入口,配置参数并调用核心函数

3.2 当前配置(您修改后的版本)

defmain():source_json="../1765555160.json"copy_labelme_annotations(source_json_path=source_json,image_dir="../bbbb",output_dir="../bbbb")

当前配置说明:

  • 源标注文件:../1765555160.json
  • 图片目录:../bbbb
  • 输出目录:../bbbb(标注文件将保存在同一目录)

4. 使用方法

4.1 方法一:直接运行(推荐新手使用)

  1. 创建目录结构

    your_project/ ├── copy_annotations.py # 本脚本 ├── 1765555160.json # 您的源标注文件 └── bbbb/ # 存放所有图片的目录 ├── image1.jpg ├── image2.jpg ├── image3.jpg └── ...
  2. 将脚本参数修改为您实际的路径

    defmain():source_json="../1765555160.json"# 修改为您的源JSON文件路径copy_labelme_annotations(source_json_path=source_json,image_dir="../bbbb",# 修改为您的图片目录output_dir="../bbbb"# 修改为输出目录)
  3. 运行脚本

    python copy_annotations.py

4.2 方法二:命令行参数方式(推荐高级用户)

如果您希望使用命令行参数,可以将main()函数修改为:

defmain():parser=argparse.ArgumentParser(description='批量复制LabelMe标注')parser.add_argument('--source_json',required=True,help='源标注JSON文件路径')parser.add_argument('--image_dir',required=True,help='图片目录路径')parser.add_argument('--output_dir',default=None,help='输出目录路径(可选,默认与image_dir相同)')args=parser.parse_args()copy_labelme_annotations(source_json_path=args.source_json,image_dir=args.image_dir,output_dir=args.output_dir)

命令行使用示例:

python copy_annotations.py\--source_json../1765555160.json\--image_dir../bbbb\--output_dir../bbbb

5. 参数详细说明

5.1 函数参数

参数名类型必需说明
source_json_pathstr源标注JSON文件路径,包含第一张图片的标注信息
image_dirstr存放所有图片的目录路径
output_dirstr输出目录路径,如果为None则使用image_dir

5.2 支持的图片格式

脚本支持以下图片格式(不区分大小写):

  • .jpg/.jpeg
  • .png
  • .bmp
  • .tiff/.tif

5.3 JSON文件结构说明

生成的JSON文件包含以下关键字段:

  • version: LabelMe版本号
  • flags: 标签标志
  • shapes: 标注形状列表(点、线、矩形、多边形等)
  • imagePath: 对应的图片文件名
  • imageHeight: 图片高度
  • imageWidth: 图片宽度
  • imageData: None(不包含图像数据,减小文件大小)

6. 运行示例

6.1 预期输出

源标注文件: ../1765555160.json 检测到 5 个标注对象 找到 15 张图片,将为 14 张图片复制标注 复制标注: 100%|██████████| 14/14 [00:02<00:00, 6.21it/s] 完成! 已为 14 张图片创建标注文件

6.2 生成的文件

../bbbb/目录下,每张图片都会生成对应的JSON文件:

bbbb/ ├── image1.jpg ├── image1.json # 自动生成 ├── image2.jpg ├── image2.json # 自动生成 ├── ... └── 1765555160.jpg # 源图片(不会重复生成)

7. 注意事项

7.1 重要前提条件

图片内容相似性:所有图片中的物体位置、形状、大小应基本相同
图片格式一致性:确保图片是脚本支持的格式
路径正确性:检查所有路径是否存在,特别是源JSON文件和图片目录

7.2 常见问题及解决

问题1:无法读取图片
警告: 无法读取图片 ../bbbb/image1.jpg, 跳过

解决方法:

  • 检查图片路径是否正确
  • 确认图片文件未损坏
  • 检查是否有权限读取该文件
问题2:JSON格式错误
JSONDecodeError: Expecting value: line 1 column 1 (char 0)

解决方法:

  • 用文本编辑器打开源JSON文件,检查是否是有效的JSON格式
  • 确保JSON文件是UTF-8编码
  • 重新使用LabelMe保存标注文件
问题3:标注位置不准确

解决方法:

  • 如果图片尺寸差异较大,复制的标注可能位置不准确
  • 建议在LabelMe中手动调整位置
  • 或者使用图像配准算法先对齐图片

7.3 性能优化

  • 大图片处理:如果图片很大,处理速度会变慢,建议先缩小图片尺寸
  • 批量处理:一次处理大量图片时,确保有足够的内存
  • 文件备份:运行前建议备份原始标注文件,防止意外覆盖

8. 高级用法

8.1 自定义修改标注

如果您需要在复制过程中修改标注,可以在循环中添加自定义逻辑:

# 在复制形状标注的循环中添加forshapeinsource_data['shapes']:new_shape=shape.copy()# 示例:修改所有矩形的标签ifnew_shape['shape_type']=='rectangle':new_shape['label']='modified_'+new_shape['label']# 示例:缩放所有坐标(适应不同尺寸)scale_x=width/source_data['imageWidth']scale_y=height/source_data['imageHeight']new_points=[[x*scale_x,y*scale_y]forx,yinnew_shape['points']]new_shape['points']=new_points new_data['shapes'].append(new_shape)

8.2 与其他工具集成

# 1. 先复制标注python copy_annotations.py --source_json template.json --image_dir images# 2. 然后用LabelMe验证和微调labelme images/

9. 完整代码(带注释版本)

importjsonimportosimportcv2fromtqdmimporttqdmimportargparsedefcopy_labelme_annotations(source_json_path,image_dir,output_dir=None):""" 将第一张图片的labelme标注信息复制到同一目录下的其他图片 参数: source_json_path: 第一张已标注图片对应的JSON文件路径 image_dir: 图片所在的目录 output_dir: 输出目录,如果为None则使用image_dir 功能流程: 1. 读取源JSON文件 2. 获取所有目标图片 3. 为每张目标图片: - 读取图片获取尺寸 - 创建新的标注数据 - 复制标注形状 - 保存JSON文件 """# 读取源JSON文件withopen(source_json_path,'r',encoding='utf-8')asf:source_data=json.load(f)print(f"源标注文件:{source_json_path}")print(f"检测到{len(source_data['shapes'])}个标注对象")# 获取源图片信息source_image_path=source_data['imagePath']source_image_name=os.path.basename(source_image_path)# 设置输出目录ifoutput_dirisNoneoroutput_dir.strip()=="":output_dir=image_dir# 创建输出目录(如果不存在)os.makedirs(output_dir,exist_ok=True)# 获取所有图片文件image_extensions=['.jpg','.jpeg','.png','.bmp','.tiff','.tif']all_images=[]forfinos.listdir(image_dir):ext=os.path.splitext(f)[1].lower()ifextinimage_extensions:all_images.append(f)# 排除源图片target_images=[imgforimginall_imagesifimg!=source_image_name]print(f"找到{len(all_images)}张图片,将为{len(target_images)}张图片复制标注")# 处理每张目标图片successful_count=0forimage_nameintqdm(target_images,desc="复制标注"):image_path=os.path.join(image_dir,image_name)# 读取图片获取尺寸try:img=cv2.imread(image_path)ifimgisNone:print(f"警告: 无法读取图片{image_path}, 跳过")continueheight,width=img.shape[:2]# 创建新的标注数据new_data={"version":source_data.get("version","5.0.1"),"flags":source_data.get("flags",{}),"shapes":[],"imagePath":image_name,"imageData":None,# 不包含图像数据以减小文件大小"imageHeight":height,"imageWidth":width}# 复制形状标注forshapeinsource_data['shapes']:new_shape=shape.copy()# 确保shape_type字段存在if'shape_type'notinnew_shape:new_shape['shape_type']='polygon'new_data['shapes'].append(new_shape)# 生成输出JSON文件名output_json_name=os.path.splitext(image_name)[0]+'.json'output_json_path=os.path.join(output_dir,output_json_name)# 保存新的JSON文件withopen(output_json_path,'w',encoding='utf-8')asf:json.dump(new_data,f,ensure_ascii=False,indent=2)successful_count+=1exceptExceptionase:print(f"处理图片{image_name}时出错:{str(e)}")continueprint(f"完成! 成功为{successful_count}/{len(target_images)}张图片创建标注文件")ifsuccessful_count<len(target_images):print(f"警告: 有{len(target_images)-successful_count}张图片处理失败,请检查日志")defmain():""" 主函数 - 当前配置版本 使用前请根据实际情况修改以下路径: """# ====== 请在此处修改您的路径配置 ======source_json="../1765555160.json"# 源标注JSON文件路径image_dir="../bbbb"# 图片目录路径output_dir="../bbbb"# 输出目录路径(可与image_dir相同)# ======================================print("="*50)print("LabelMe标注批量复制工具")print("="*50)print(f"配置信息:")print(f" 源标注文件:{source_json}")print(f" 图片目录:{image_dir}")print(f" 输出目录:{output_dir}")print("-"*50)# 检查文件和目录是否存在ifnotos.path.exists(source_json):print(f"错误: 源标注文件不存在 -{source_json}")returnifnotos.path.exists(image_dir):print(f"错误: 图片目录不存在 -{image_dir}")returncopy_labelme_annotations(source_json_path=source_json,image_dir=image_dir,output_dir=output_dir)if__name__=="__main__":main()

10. 总结

这个脚本能够大幅提升标注效率,特别适用于:

  • 工业检测中的相似产品图片
  • 监控视频中的连续帧
  • 产品展示的多角度照片
  • 任何具有重复模式的图像数据集

使用流程总结:

  1. 标注第一张图片(使用LabelMe)
  2. 配置脚本参数(修改路径)
  3. 运行脚本批量生成标注
  4. 使用LabelMe验证和微调标注
  5. 导出为所需格式(COCO、YOLO等)

通过这个工具,您可以将原本需要几小时的标注工作缩短到几分钟,大大提高数据准备效率!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/24 1:14:37

Boost 电路右半平面零点 (RHPZ) 的仿真与解析

. 右半平面零点 (RHPZ) 来源解析 Boost 电路的传递函数为&#xff1a; H ( s ) V g D ′ 2 D ′ 2 R − s L s 2 L C R s L R D ′ 2 该传递函数的零点位于 s D ′ 2 R L &#xff0c;由于零点符号为正&#xff0c;因此属于右半平面零点。 为了…

作者头像 李华
网站建设 2026/3/24 8:17:52

C++内存管理相关面试题图解

用香蕉尝试制作了一些面试题图解&#xff0c;主要是跟C的内存管理有关&#xff0c;方便大家更好地理解这些概念和准备相关的面试。有些文字生成的不够准确&#xff0c;但是基本上还是能够认出来&#xff0c;见谅。

作者头像 李华
网站建设 2026/3/16 7:08:15

QT之简陋版网络调试助手

1. 开发流程 1.1 Qtcp服务器的关键步骤 • 工程建立&#xff0c;需要在.pro加入网络权限 • 创建一个基于 QTcpServer 的服务端涉及以下关键步骤&#xff1a; 1. 创建并初始化 QTcpServer 实例&#xff1a; • 实例化 QTcpServer 。 • 调用 listen 方法在特定端口监听传入的连…

作者头像 李华
网站建设 2026/3/16 7:08:12

【万字长文】深度思考RAG流水线:从零构建智能agent架构,小白必学,程序员必收藏的大模型应用指南!

简介 本文介绍了一种深度思考RAG流水线&#xff0c;通过agent驱动的架构解决复杂查询问题。系统将查询分解为多步骤计划&#xff0c;执行自适应检索策略&#xff0c;结合反思机制和自我评估循环&#xff0c;实现真正的多步推理。与传统线性RAG相比&#xff0c;该架构能处理多源…

作者头像 李华
网站建设 2026/3/23 14:13:33

从静态到动态:探索LLM和RAG在自动更新知识图谱中的协同效应

摘要 在AI应用中&#xff0c;知识图谱&#xff08;KG&#xff09;的实时更新至关重要&#xff0c;但现有KG如Wikidata和DBpedia往往手动维护或 infrequent 重建&#xff0c;导致信息过时。本文提出一种利用大语言模型&#xff08;LLM&#xff09;和检索增强生成&#xff08;RA…

作者头像 李华
网站建设 2026/3/18 23:57:41

抓住2026年AI黄金窗口!普通人也能实现月薪翻倍的转型全指南!

深夜&#xff0c;一家互联网大厂的HR正为一份特殊的Offer绞尽脑汁——如何用有竞争力的薪酬&#xff0c;吸引一位顶尖院校的AI算法博士。与此同时&#xff0c;另一位非技术出身的运营专员&#xff0c;却通过熟练掌握AI工具&#xff0c;成功将自己主导的项目效率提升了300%&…

作者头像 李华