news 2026/2/7 1:43:12

中医药 AI 智能识别 中药材自动化分拣 建立基于深度学习YOLOV8中药检测系统 白茯苓 白芍 白术 栀子 甘草 当归 黄精 冬虫夏草 黄精 肉桂

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
中医药 AI 智能识别 中药材自动化分拣 建立基于深度学习YOLOV8中药检测系统 白茯苓 白芍 白术 栀子 甘草 当归 黄精 冬虫夏草 黄精 肉桂

医学中医-中草药检测数据集
45种中草药图集已标注,YOLO格式

训练集:8500张
验证集:1500张
每种中药有1000张图片


1

1


🌿 中草药检测数据集(YOLO格式)

总类别数:45 种
总图像数量:10,000 张
标注框总数:16,754 个
标签格式:YOLO(.txt)
文件格式:JPG / PNG

项目内容说明
数据集名称中草药检测数据集(45类)
类别数量45 类
总图像数量10,000 张
标注框总数16,754 个(平均每个图像约 1.68 个目标)
数据划分
– 训练集8,500 张
– 验证集1,500 张
每类样本数量原始设计为“每种中药有 1000 张”,但实际统计显示部分类别不足(如人参仅90张)
标注方式手动标注(使用 LabelImg 或类似工具),边界框(Bounding Box)
标签格式✅ YOLO 格式.txt文件:
class_id x_center y_center width height(归一化坐标)
• 支持直接用于 YOLOv5/v8 等模型训练
图像格式JPG / PNG(高清扫描图或实物拍摄)
图像分辨率多样化(常见 800×600 至 2048×1536,取决于拍摄设备)
背景复杂度包含纯白背景、木质桌面、药材堆叠等场景,适合真实应用
典型应用场景• 中药材智能识别
• 药材质量分级
• 中医AI辅助诊断系统
• 自动化分拣机器人

📊 类别统计表(前45类)

类别ID类别名称图片数量标注数量
0白茯苓309555
1白芍356860
2白术452853
3蒲公英177177
4甘草3941026
5栀子190190
6党参340522
7桃仁96172
8去皮桃仁164164
9地肤子280280
10牡丹皮5178
11冬虫夏草359675
12杜仲106112
13当归518925
14杏仁179180
15何首乌267598
16黄精298499
17鸡血藤146146
18枸杞477807
19莲须292341
20莲肉415613
21麦门冬141176
22木通201201
23玉竹228833
24女贞子258286
25肉苁蓉203271
26人参90108
27乌梅191191
28覆盆子167167
29瓜蒌皮164164
30肉桂330431
31山茱萸212212
32山药8686
33酸枣仁276298
34桑白皮122122
35山楂310474
36天麻9797
37熟地黄407508
38小茴香165165
39泽泻126186
40竹茹121130
41川贝母133228
42川芎5611173
43玄参149149
44益智仁265325
总计-10,00016,754

⚠️备注

  • 总图片数为 10,000 张,但部分类别远少于 1000 张(如“人参”仅90张,“山药”86张),可能为标注未完成或采样不均;
  • “川芎”类别标注最多(1173个),可能是多粒密集分布;
  • “蒲公英”和“鸡血藤”等类别标注数量等于图片数,说明每图仅一个目标。

📁 数据目录结构示例

herbal_dataset/ ├── images/ │ ├── train/ # 8500 张 │ ├── val/ # 1500 张 │ └── test/ # (可选) └── labels/ ├── train/ # 对应 .txt 文件 └── val/

✅ 支持的模型任务

任务类型是否支持说明
目标检测(YOLO)使用 YOLOv5/v8 可直接训练
分类任务可提取特征用于分类器
实例分割(Mask)无 mask 标注
多标签识别单目标为主

🛠️ 推荐训练方案(YOLOv8)

1. 创建data.yaml
# data.yamlpath:./herbal_datasettrain:images/trainval:images/valnc:45names:['白茯苓','白芍','白术','蒲公英','甘草','栀子','党参','桃仁','去皮桃仁','地肤子','牡丹皮','冬虫夏草','杜仲','当归','杏仁','何首乌','黄精','鸡血藤','枸杞','莲须','莲肉','麦门冬','木通','玉竹','女贞子','肉苁蓉','人参','乌梅','覆盆子','瓜蒌皮','肉桂','山茱萸','山药','酸枣仁','桑白皮','山楂','天麻','熟地黄','小茴香','泽泻','竹茹','川贝母','川芎','玄参','益智仁']
2. 训练代码(train.py
fromultralyticsimportYOLO model=YOLO('yolov8n.pt')# 或 yolov8s.ptresults=model.train(data='data.yaml',epochs=100,imgsz=640,batch=16,name='herbal_detection',device=0,patience=20,hsv_h=0.01,hsv_s=0.5,hsv_v=0.3,degrees=10.0)

🌱总结:该数据集是中医药 AI 智能识别的宝贵资源,适用于中药材自动化分拣、质量控制、中医教学系统等场景。尽管部分类别样本偏少,但整体覆盖广泛,适合构建高性能目标检测模型。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/3 19:43:53

Qwen3-VL-WEBUI保姆级教程:视频索引与检索系统

Qwen3-VL-WEBUI保姆级教程:视频索引与检索系统 1. 引言 随着多模态大模型的快速发展,视觉-语言理解能力正从“看图说话”迈向“深度感知与交互”。阿里云最新推出的 Qwen3-VL-WEBUI 正是这一趋势下的重要实践工具。它不仅集成了迄今为止 Qwen 系列最强…

作者头像 李华
网站建设 2026/2/5 14:11:24

如何用AI快速解析PDF?Poppler与AI结合实战

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个基于Poppler的PDF解析工具,能够自动提取PDF中的文本、图像和表格数据。要求:1. 使用Python语言实现 2. 集成Poppler的pdftotext功能 3. 添加AI文本…

作者头像 李华
网站建设 2026/2/5 17:48:46

Qwen3-VL-WEBUI GUI元素识别:界面自动化部署案例

Qwen3-VL-WEBUI GUI元素识别:界面自动化部署案例 1. 引言:为何需要视觉语言模型驱动的GUI自动化? 在现代软件测试、RPA(机器人流程自动化)和智能助手开发中,图形用户界面(GUI)的自…

作者头像 李华
网站建设 2026/2/3 19:17:10

Qwen3-VL-WEBUI新闻摘要生成:图文内容提炼部署案例

Qwen3-VL-WEBUI新闻摘要生成:图文内容提炼部署案例 1. 引言:为何需要图文并茂的新闻摘要系统? 在信息爆炸的时代,新闻内容往往包含大量文本与图像,传统纯文本摘要模型难以有效处理多模态信息。尤其在财经、科技、社会…

作者头像 李华
网站建设 2026/2/6 23:19:29

Qwen3-VL Kubernetes:集群管理指南

Qwen3-VL Kubernetes:集群管理指南 1. 引言:Qwen3-VL-WEBUI 与视觉语言模型的演进 随着多模态大模型在实际业务场景中的广泛应用,阿里云推出的 Qwen3-VL 系列标志着视觉-语言理解能力的一次重大飞跃。作为 Qwen 系列中迄今最强大的视觉语言…

作者头像 李华
网站建设 2026/2/4 0:54:20

如何用Qwen3-VL-WEBUI生成HTML/CSS?视觉编码增强应用详解

如何用Qwen3-VL-WEBUI生成HTML/CSS?视觉编码增强应用详解 1. 引言:从设计图到代码的智能跃迁 在现代前端开发中,将视觉设计稿快速转化为可运行的 HTML/CSS 代码是一项高频且耗时的任务。传统方式依赖人工编码,效率低、易出错。随…

作者头像 李华