news 2026/1/11 15:36:06

基于深度学习的水果检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于深度学习的水果检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)

视频演示

基于深度学习的水果检测系统

1. 前言​

随着计算机视觉技术的快速发展,基于深度学习的目标检测方法在农业、食品工业及日常生活中的应用不断拓展。水果检测作为其中的重要场景,不仅能为采摘、分拣、销售等环节提供自动化支持,也在智能零售、营养分析与教育教学等领域展现出广泛价值。然而,现有水果检测系统在应对多品类、多形态、复杂背景的实际环境时,仍面临识别精度、检测速度及交互便捷性等方面的挑战。

当前主流方案多采用 YOLO 系列等单阶段检测算法,凭借其在速度与精度间的良好平衡,成为实时检测的热门选择。不少系统已实现图片、视频及摄像头输入的检测功能,但在用户体验上,仍存在界面参数调节不够直观、结果展示与统计功能分散、多场景切换不便等问题。同时,模型的训练与使用往往依赖固定权重或单一版本,缺乏灵活的模型切换与再训练机制,限制了系统在不同水果种类或新场景下的适应能力。在功能完整性方面,一些系统缺少用户权限管理、脚本化批量检测及训练流程可视化,难以满足科研实验与实际部署的双重需求。

针对以上现状,本文所介绍的水果检测系统,尝试在检测性能、交互设计与功能扩展之间取得平衡:既保留 YOLO 算法的高效检测能力,又通过直观的参数调节、类别统计与过滤、登录管理等模块,提高可用性与灵活性;同时提供脚本化检测与模型训练工具,使系统不仅能直接应用,还可根据需求持续优化与定制。此现状分析旨在明确当前同类系统的优势与不足,并为后续功能阐述与技术实现提供背景和方向。

2. 项目演示

2.1用户登录界面

登录界面布局简洁清晰,左侧展示系统主题,用户需输入用户名、密码及验证码完成身份验证后登录系统。

2.2新用户注册

注册时可自定义用户名与密码,支持上传个人头像;如未上传,系统将自动使用默认头像完成账号创建。

2.3主界面布局

主界面采用三栏结构,左侧为功能操作区,中间用于展示检测画面,右侧呈现目标详细信息,布局合理,交互流畅。

2.4个人信息管理

用户可在此模块中修改密码或更换头像,个人信息支持随时更新与保存。

2.5多模态检测展示

系统支持图片、视频及摄像头实时画面的目标检测。识别结果将在画面中标注显示,并在下方列表中逐项列出。点击具体目标可查看其类别、置信度及位置坐标等详细信息。

2.6多模型切换

系统内置多种已训练模型,用户可根据实际需求灵活切换,以适应不同检测场景或对比识别效果。

3.模型训练核心代码

本脚本是YOLO模型批量训练工具,可自动修正数据集路径为绝对路径,从pretrained文件夹加载预训练模型,按设定参数(100轮/640尺寸/批次8)一键批量训练YOLOv5nu/v8n/v11n/v12n模型。

# -*- coding: utf-8 -*- """ 该脚本用于执行YOLO模型的训练。 它会自动处理以下任务: 1. 动态修改数据集配置文件 (data.yaml),将相对路径更新为绝对路径,以确保训练时能正确找到数据。 2. 从 'pretrained' 文件夹加载指定的预训练模型。 3. 使用预设的参数(如epochs, imgsz, batch)启动训练过程。 要开始训练,只需直接运行此脚本。 """ import os import yaml from pathlib import Path from ultralytics import YOLO def main(): """ 主训练函数。 该函数负责执行YOLO模型的训练流程,包括: 1. 配置预训练模型。 2. 动态修改数据集的YAML配置文件,确保路径为绝对路径。 3. 加载预训练模型。 4. 使用指定参数开始训练。 """ # --- 1. 配置模型和路径 --- # 要训练的模型列表 models_to_train = [ {'name': 'yolov5nu.pt', 'train_name': 'train_yolov5nu'}, {'name': 'yolov8n.pt', 'train_name': 'train_yolov8n'}, {'name': 'yolo11n.pt', 'train_name': 'train_yolo11n'}, {'name': 'yolo12n.pt', 'train_name': 'train_yolo12n'} ] # 获取当前工作目录的绝对路径,以避免相对路径带来的问题 current_dir = os.path.abspath(os.getcwd()) # --- 2. 动态配置数据集YAML文件 --- # 构建数据集yaml文件的绝对路径 data_yaml_path = os.path.join(current_dir, 'train_data', 'data.yaml') # 读取原始yaml文件内容 with open(data_yaml_path, 'r', encoding='utf-8') as f: data_config = yaml.safe_load(f) # 将yaml文件中的 'path' 字段修改为数据集目录的绝对路径 # 这是为了确保ultralytics库能正确定位到训练、验证和测试集 data_config['path'] = os.path.join(current_dir, 'train_data') # 将修改后的配置写回yaml文件 with open(data_yaml_path, 'w', encoding='utf-8') as f: yaml.dump(data_config, f, default_flow_style=False, allow_unicode=True) # --- 3. 循环训练每个模型 --- for model_info in models_to_train: model_name = model_info['name'] train_name = model_info['train_name'] print(f"\n{'='*60}") print(f"开始训练模型: {model_name}") print(f"训练名称: {train_name}") print(f"{'='*60}") # 构建预训练模型的完整路径 pretrained_model_path = os.path.join(current_dir, 'pretrained', model_name) if not os.path.exists(pretrained_model_path): print(f"警告: 预训练模型文件不存在: {pretrained_model_path}") print(f"跳过模型 {model_name} 的训练") continue try: # 加载指定的预训练模型 model = YOLO(pretrained_model_path) # --- 4. 开始训练 --- print(f"开始训练 {model_name}...") # 调用train方法开始训练 model.train( data=data_yaml_path, # 数据集配置文件 epochs=100, # 训练轮次 imgsz=640, # 输入图像尺寸 batch=8, # 每批次的图像数量 name=train_name, # 模型名称 ) print(f"{model_name} 训练完成!") except Exception as e: print(f"训练 {model_name} 时出现错误: {str(e)}") print(f"跳过模型 {model_name},继续训练下一个模型") continue print(f"\n{'='*60}") print("所有模型训练完成!") print(f"{'='*60}") if __name__ == "__main__": # 当该脚本被直接执行时,调用main函数 main()

4. 技术栈

  • 语言:Python 3.10

  • 前端界面:PyQt5

  • 数据库:SQLite(存储用户信息)

  • 模型:YOLOv5、YOLOv8、YOLOv11、YOLOv12

5. YOLO模型对比与识别效果解析

5.1 YOLOv5/YOLOv8/YOLOv11/YOLOv12模型对比

基于Ultralytics官方COCO数据集训练结果:

模型

尺寸(像素)

mAPval 50-95

速度(CPU ONNX/毫秒)

参数(M)

FLOPs(B)

YOLO12n

640

40.6

-

2.6

6.5

YOLO11n

640

39.5

56.1 ± 0.8

2.6

6.5

YOLOv8n

640

37.3

80.4

3.2

8.7

YOLOv5nu

640

34.3

73.6

2.6

7.7

关键结论

  1. 精度最高:YOLO12n(mAP 40.6%),显著领先其他模型(较YOLOv5nu高约6.3个百分点);

  2. 速度最优:YOLO11n(CPU推理56.1ms),比YOLOv8n快42%,适合实时轻量部署;

  3. 效率均衡:YOLO12n/YOLO11n/YOLOv8n/YOLOv5nu参数量均为2.6M,FLOPs较低(YOLO12n/11n仅6.5B);YOLOv8n参数量(3.2M)与计算量(8.7B)最高,但精度优势不明显。

综合推荐

  • 追求高精度:优先选YOLO12n(精度与效率兼顾);

  • 需高速低耗:选YOLO11n(速度最快且精度接近YOLO12n);

  • YOLOv5nu/YOLOv8n因性能劣势,无特殊需求时不建议首选。

5.2 数据集分析

数据集中训练集和验证集一共7000张图片,数据集目标类别两种:正常肾脏,肾结石,数据集配置代码如下:

names: - Bitter melon - Brinjal - Cabbage - Calabash - Capsicum - Cauliflower - Garlic - Ginger - Green Chili - Lady finger - Onion - Potato - Sponge Gourd - Tomato - apple - apricots - banana - bell_pepper - bitter_gourd - carrot - coconut - cucumber - dragon fruit - grapes - guava - kiwi - lemon - orange - oren - peach - pear - pineapple - strawberry - sugar apple - zucchini nc: 35 path: D:\project\python\yolo_Fruit_Detection\train_data test: ../test/images train: ../train/images val: ../valid/images

上面的图片就是部分样本集训练中经过数据增强后的效果标注。

5.3 训练结果

混淆矩阵显示中识别精准度显示是一条对角线,方块颜色越深代表对应的类别识别的精准度越高。

F1指数(F1 Score)是统计学和机器学习中用于评估分类模型性能的核心指标,综合了模型的精确率(Precision)和召回率(Recall),通过调和平均数平衡两者的表现。

当置信度为0.542时,所有类别的综合F1值达到了0.94(蓝色曲线)。

mAP@0.5:是目标检测任务中常用的评估指标,表示在交并比(IoU)阈值为0.5时计算的平均精度均值(mAP)。其核心含义是:只有当预测框与真实框的重叠面积(IoU)≥50%时,才认为检测结果正确。

图中可以看到综合mAP@0.5达到了0.965(96.5%),准确率非常高。

6. 源码获取方式

源码获取方式:https://www.bilibili.com/video/BV1LxS7BAE2R

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/6 2:48:19

Android-packages/modules-由来及子目录介绍

Android AOSP packages/modules 详解 一、目录由来与演进 历史演变 Android 1.0-9.0:系统组件深度集成在 frameworks/ 中Android 10 (2019):引入 Project Mainline,创建 packages/modules目标:将关键系统服务模块化,支…

作者头像 李华
网站建设 2026/1/10 14:24:42

基于SpringBoot的鸟博士微信小程序设计与实现(程序+文档+讲解)

课题介绍在鸟类科普与养护服务个性化需求升级的背景下,传统鸟类知识获取存在 “信息零散、咨询响应慢、养护指导不精准” 的痛点,基于 SpringBoot 微信小程序构建的鸟博士平台,适配鸟类爱好者、养鸟用户、鸟类专家等角色,实现科普…

作者头像 李华
网站建设 2025/12/23 19:05:07

27、Linux 用户、组管理与文件系统操作指南

Linux 用户、组管理与文件系统操作指南 1. 用户与组管理 在 Linux 系统中,用户和组的管理是系统管理的重要部分,它涉及到用户账户的创建、删除、修改,以及用户组的管理等操作。 1.1 理解 /etc/passwd 文件 /etc/passwd 文件是所有用户账户的列表,它是一个文本文件,任…

作者头像 李华
网站建设 2025/12/20 21:31:51

c语言中的函数

什么是函数 在计算机科学中,子程序是一个大型程序中的某部分代码,由一个或多个语句块组成。它负责完成某项特定任务,而且相较于其他代码,具备相对的独立性。 ----------------------------------------------------------------…

作者头像 李华
网站建设 2025/12/20 13:41:32

langchain agent结构化输出

一.背景LangChain Agent 作为大模型驱动的自主决策智能体,核心价值在于通过工具调用与逻辑推理完成复杂任务,但原生 Agent 的输出多为非结构化自然语言文本 —— 这种 “自由文本” 形式在企业级应用中,难以满足数据存储、系统集成、自动化流…

作者头像 李华