20类常见香料与药用植物叶片数据集| 8000张YOLO植物识别数据集 适用于植物识别、农业智能检测与目标检测研究
一、数据集概述
本数据集是一个专为植物识别、农业智能检测及药用植物分类研究构建的高质量图像数据集,共包含8000张高分辨率、高质量标注的叶片图像。数据集聚焦于20种具有代表性的常见香料与药用植物叶片,涵盖日常生活中广泛使用的食材(如生姜、薄荷、洋葱)及传统中草药/功能植物(如芦荟、余甘子、圣罗勒、苦楝等),适用于YOLO系列、Faster R-CNN等主流目标检测算法的训练、验证与测试。
随着植物识别技术、智慧农业和传统医药现代化的快速发展,利用计算机视觉实现香料与药用植物的自动识别与分类已成为推动植物资源数字化管理、农业智能监测及中药材质量管控的重要手段。本数据集针对植物叶片识别场景中类间相似度高、生长状态多样、光照与背景复杂等问题进行专项构建,可为植物识别APP、农业智能巡检、药用植物资源普查及香料品质检测提供高质量数据支撑。
数据集下载
通过网盘分享的文件:20类常见香料与药用植物叶片数据集
链接: https://pan.baidu.com/s/1X7mTGG7YrAwPNzdm00Davg?pwd=8c71
提取码: 8c71
二、数据集基本信息
| 项目 | 内容 |
|---|---|
| 数据集名称 | 20类常见香料与药用植物叶片数据集 |
| 数据规模 | 8000张高分辨率标注图像 |
| 任务类型 | 目标检测(Object Detection) |
| 检测目标 | 20种常见香料与药用植物叶片 |
| 类别数量(nc) | 20类 |
| 标注方式 | Bounding Box目标框标注 |
| 数据格式 | YOLO标准格式 |
| 数据来源 | 真实农业种植、园林与野生环境采集 |
| 数据划分 | Train / Valid / Test |
| 适配模型 | YOLOv5、YOLOv8、YOLOv10、YOLOv11、Faster R-CNN等 |
三、数据集类别说明
本数据集为多类别细粒度目标检测数据集,共设置20个检测类别,涵盖20种具有代表性的常见香料与药用植物叶片,包括日常生活中广泛使用的食材香料(如生姜、薄荷、洋葱)及传统中草药/功能植物(如芦荟、余甘子、圣罗勒、苦楝等)。
类别配置
nc:20names:-aloevera-amla-coffee-drumstick-eucalyptus-ginger-hibiscus-jasmine-lemon-mango-mint-neem-onion-papaya-pea-pepper-pomegranate-rose-spinach-tulsi类别详情
| 类别ID | 中文名称 | 英文名称 | 备注/常见用途 |
|---|---|---|---|
| 0 | 芦荟 | Aloevera | 美容、药用、观赏 |
| 1 | 余甘子 | Amla | 印度醋栗,富含维C |
| 2 | 咖啡 | Coffee | 咖啡树叶片 |
| 3 | 辣木 | Drumstick | 营养极高的“奇迹树” |
| 4 | 桉树 | Eucalyptus | 芳香植物,精油来源 |
| 5 | 生姜 | Ginger | 常见香料,药用根茎对应叶片 |
| 6 | 木槿 | Hibiscus | 观赏植物,花茶原料 |
| 7 | 茉莉 | Jasmine | 著名香料与观赏花卉 |
| 8 | 柠檬 | Lemon | 柑橘类植物叶片 |
| 9 | 芒果 | Mango | 热带水果树叶片 |
| 10 | 薄荷 | Mint | 常见香草,清凉药用 |
| 11 | 苦楝 | Neem | 传统药用树,抗菌特性 |
| 12 | 洋葱 | Onion | 百合科植物叶片 |
| 13 | 木瓜 | Papaya | 热带水果树叶片 |
| 14 | 豌豆 | Pea | 豆科植物叶片 |
| 15 | 胡椒 | Pepper | 常见香料植物叶片 |
| 16 | 石榴 | Pomegranate | 水果树叶片 |
| 17 | 玫瑰 | Rose | 著名香料与观赏植物 |
| 18 | 菠菜 | Spinach | 常见叶菜类 |
| 19 | 圣罗勒 | Tulsi | 印度圣罗勒,重要药用植物 |
20类设计覆盖了四大功能群组:
- 香料植物:生姜、薄荷、胡椒、洋葱等
- 药用植物:芦荟、余甘子、苦楝、圣罗勒等
- 果树叶片:柠檬、芒果、木瓜、石榴等
- 观赏与芳香植物:玫瑰、茉莉、木槿、桉树等
类别构成兼顾了经济价值、药用价值与生态价值,为多场景应用提供了丰富的数据基础。
四、数据集结构说明
数据集采用标准YOLO目录结构组织,预划分为训练集、验证集和测试集,所有图像均为.jpg或.png格式,配有对应的YOLO格式标注文件。
database/ └── 20类常见香料与药用植物叶片数据集 ├── train │ └── images ├── valid │ └── images ├── test │ └── images └── data.yaml各数据集作用如下:
- train/images:训练集图像,用于模型参数学习与特征提取;
- valid/images:验证集图像,用于超参数调优、早停监控及防止过拟合;
- test/images:测试集图像,用于最终模型性能评估与泛化能力测试;
- data.yaml:数据集配置文件,定义路径与类别信息。
所有标签文件均采用标准YOLO格式,与图像文件一一对应,无需额外格式转换即可直接使用。
五、数据集核心优势
1. 真实农业与自然环境采集
数据全部来源于真实农业种植、园林绿化与野外自然环境,真实反映香料与药用植物叶片识别的实际应用场景,具有高度的工程实用价值。
覆盖场景包括:
- 香料种植基地与农田
- 药用植物种植园与种质资源圃
- 城市园林与家庭园艺
- 野生与半野生环境
- 不同种植方式(大田、温室、盆栽)
能够有效提升模型的实际部署效果。
2. 广泛的类别覆盖
20类植物覆盖了四大功能群组,满足多场景应用需求:
- 香料类:生姜、薄荷、胡椒、洋葱等日常烹饪香料
- 药用类:芦荟、余甘子、苦楝、圣罗勒等传统药用植物
- 果树类:柠檬、芒果、木瓜、石榴等经济果树
- 观赏芳香类:玫瑰、茉莉、木槿、桉树等观赏与芳香植物
丰富的类别构成使数据集适用于农业、医药、园艺、食品等多个领域。
3. 多样化的叶片形态覆盖
不同植物的叶片在形态上存在显著差异,同一植物在不同生长阶段叶片形态也有所变化:
- 不同叶形(椭圆形、披针形、心形、掌状等)
- 不同叶缘(全缘、锯齿、波状等)
- 不同叶脉类型(平行脉、网状脉等)
- 不同叶片质地(革质、纸质、肉质等)
- 不同生长阶段(嫩叶、成熟叶、老叶)
- 不同季节的叶片颜色变化
有助于提升模型对多样化叶片形态的检测与泛化能力。
4. 丰富的环境条件覆盖
数据覆盖:
- 不同光照条件(强光、散射光、阴影)
- 不同拍摄角度(俯视、侧视、平视)
- 不同拍摄距离(叶片特写、枝条整体)
- 不同背景(土壤、天空、其他植物、人工设施)
- 不同天气条件(晴天、阴天)
- 不同叶片状态(健康、病虫害、萎蔫)
能够有效增强模型在真实环境中的鲁棒性。
5. 高质量人工标注
所有图像均经过精细化人工标注与多轮审核:
- 边界框精准贴合叶片轮廓
- 20类植物判别标准统一
- 形态特征覆盖全面
- 无漏标现象
- 无类别混淆
有效保证模型训练质量。
6. 强泛化能力
数据涵盖:
- 不同地理区域与气候条件
- 不同种植与管理方式
- 不同季节与生长周期
- 不同品种与栽培变种
能够显著提升模型在实际植物识别任务中的泛化能力。
六、适用场景
植物识别APP与智能鉴别系统
为智能手机植物识别应用提供核心算法支持,帮助用户快速识别香料与药用植物。
农业智能巡检与种植管理
应用于香料及药用植物种植基地的自动化巡检,监测作物生长状态与病虫害情况。
药用植物资源普查
辅助中药材资源调查与种质资源鉴定,推动药用植物的数字化管理与保护。
香料品质检测与溯源
在香料加工与流通环节实现原料叶片的快速识别与品种验证,保障产品质量。
智能厨房与食材识别
帮助智能厨房设备识别新鲜香料食材,提供菜谱推荐与存储管理建议。
植物科普教育与园艺应用
作为植物学教育、园艺爱好者的智能识别工具,普及植物分类知识。
七、适用研究方向
本数据集可广泛应用于以下研究领域:
- 植物叶片识别与分类研究(20类)
- 细粒度目标检测与识别研究
- 多类别目标检测研究
- 农业计算机视觉与智慧农业研究
- 药用植物数字化研究
- 香料品质检测研究
- YOLO系列模型优化研究
- 轻量化检测模型与边缘部署研究
- 域适应与跨地域泛化研究
- 多任务学习(分类+检测)研究
- 植物表型分析与生长监测研究
- 生物多样性监测与生态保护研究
八、总结
20类常见香料与药用植物叶片数据集(Spices & Medicinal Plant Leaves)包含8000张高分辨率标注图像,采用标准YOLO格式构建,专注于香料与药用植物叶片的识别与分类任务。数据集覆盖芦荟、余甘子、咖啡、辣木、桉树、生姜、木槿、茉莉、柠檬、芒果、薄荷、苦楝、洋葱、木瓜、豌豆、胡椒、石榴、玫瑰、菠菜、圣罗勒20类常见植物,具有类别丰富、叶片形态多样、标注精准等特点,可广泛应用于植物识别APP、农业智能巡检、药用植物资源普查、香料品质检测等领域,是开展植物叶片智能识别算法研发与智慧农业系统建设的优质数据资源。