news 2026/2/10 19:18:07

【计算机视觉论文写作模版】基于图卷积网络的多标签图像分类系统设计

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【计算机视觉论文写作模版】基于图卷积网络的多标签图像分类系统设计

基于深度学习的多标签图像分类系统设计与实现

摘 要

多标签图像分类是计算机视觉领域中重要的研究方向,旨在确定单幅图像中是否存在一种或多种不同的对象类别。随着数字图像的快速增长,图像标注、智慧医疗等领域对精准的多标签图像分类的需求日趋增加。近年来,深度学习技术在多标签图像分类任务研究中取得了瞩目的成就,但是大多数分类模型并未投入实际的应用当中。基于以上的问题,本文设计并实现了一个操作简便、分类准确的基于深度学习的多标签图像分类系统。

该系统具有以下功能模块:多标签图像分类模型模块,部署了ML-GCN和ADD-GCN两个精准的多标签图像分类模型,可以保证对图像分类的准确;个人信息管理模块,用户能够通过注册登录进入系统进行使用,可以修改用户名、密码等个人信息;图像处理模块,用户可以对图像进行尺寸裁剪、亮度调节、氛围渲染等处理操作,方便用户对图像的处理;图像分类模块,用户可以批量或者单张上传图像,选择使用的分类模型进行图像分类,分类结果将以可视化的方式展示给用户;历史记录模块,用户可以查看以往的详细操作记录和具体的分类任务详情,以供对过往的分类结果进行回溯。

该系统使用Pytorch深度学习框架对两个分类模型进行实现并使用Anaconda部署至本地,后端技术采用Springboot+Mybatis进行搭建,数据库的存储和访问使用MySQL,前端技术采用Vue和ElementUI。经过单元测试于集成测试,该系统实现了预定的功能。

关键词多标签图像分类;深度学习;图卷积网络;Springboot;Vue

Design and Implementation of Deep Learning Based Multi-Label Image Classification System

Abstract

Multi-label image classification is an important research direction in the field of computer vision, aiming at determining whether there are one or more different object classes in a single image. With the rapid growth of digital images, there is an increasing demand for accurate multi-label image classification in the fields of image annotation and smart healthcare. In recent years, deep learning techniques have made remarkable achievements in the research of multi-label image classification tasks, but most of the classification models are not put into practical applications. Based on the above problems, this paper designs and implements a deep learning-based multi-label image classification system with easy operation and accurate classification.

The deep learning-based multi-label image classification system has the following functional modules: multi-label image classification model module, which deploys two accurate multi-label image classification models, ML-GCN and ADD-GCN, to ensure the accuracy of image classification; personal information management module, which allows the user to enter the system by registering and logging in, and modify personal information such as the user name, password, etc.; image processing module, which allows the user to size the image and change the image size; and image processing module, which allows the user to change the size of the image. Image processing module, users can crop the size of the image, brightness adjustment, atmosphere rendering and other processing operations to facilitate the user's image processing; image classification module, users can upload images in batches or singly, choose to use the classification model to classify the image, the classification results will be displayed to the user in a visual way; history module, users can view the detailed records of previous operations and specific classification tasks. History module, where users can view detailed records of previous operations and specific classification tasks.

The system uses Pytorch deep learning framework to implement the two classification models and deployed locally using Anaconda, the front-end technology adopts Vue and ElementUI, the back-end technology adopts Springboot + Mybatis to build, and MySQL is used to store and access the database.After unit testing and integration testing, the system achieves the The system achieves the intended functionality.

KeywordsMulti-labelled image classification, Deep learning, Graph convolutional networks, Springboot, Vue

目 录

摘要 I

Abstract II

第1章 绪论

1.1 课题目的和意义

1.1.1课题目的

1.1.2 课题研究意义

1.2 国内外研究现状分析

1.3 论文的主要内容

第2章系统需求分析

2.1 可行性论证

2.1.1 系统目标

2.1.2 可行性分析

2.2 系统需求分析

2.2.1 系统功能需求概述

2.2.2 系统功能需求分析

2.2.3 其它非功能需求分析

2.3 本章小结

第3章 系统设计

3.1 系统概要设计

3.1.1系统总体架构设计

3.1.2系统功能结构设计

3.1.3系统时序图设计

3.2 系统功能模块设计

3.2.1用户管理模块设计

3.2.2 图像分类模块设计

3.2.3 历史记录模块设计

3.2.4 ML-GCN模型设计

3.2.5 ADD-GCN模型设计

3.3 数据库与数据集设计

3.3.1 多标签图像数据集

3.3.2 数据库概念模型设计

3.3.3 数据库逻辑模型设计

3.4 本章小结

第4章 系统实现与测试

4.1 部署环境

4.2 系统实现效果

4.3 系统测试

4.3.1 模型性能评测

4.3.2 功能测试

4.3.3 非功能测试

4.4 本章小结

结论

致谢

参考文献

  1. 绪论
    1. 课题目的和意义
      1. 课题目的

图像分类是当前人工智能研究的热点,被广泛的应用于安防监控、智慧医疗、电子商务等领域。传统的图像分类,每张图片只能包含单一的语义标签,即单标签图像分类,就能够解决大部分场景下的图像分类任务。但是,在很多场景中,一张图片包含多种语义标签,即多标签图像。例如,医疗影像中一张x光片可能包含多种疾病的症状;智慧交通监控需要同时监控行人、非机动车、机动车、以及监控对象的行为动作。为了解决上述出现的问题多标签图像分类应运而生。多标签图像分类的目的是让模型一次性预测出图像中多个语义标签,并学习这些标签之间的相关性。

深度学习技术是计算机视觉领域备受欢迎的研究方法之一。通过对数据进行多层次的非线性变换以实现对数据的自适应抽象,从而提取数据的高维特征。在给定合理的损失函数时,深度学习方法能够依据损失函数及所提供的数据集自适应地学习并获取特征。

      1. 课题研究意义

图像通常被分为单标签图像和多标签图像。多标签与单标签指的是,图片中包含物体的个数。单标签图像示例图如图1-1所示,1-1(a)、1-1(b)该图像中分别只包含有“斑马”、“飞机”单个物体。多标签实例图如图1-2所示,1-2(a)和1-2(b)分别包含有“人”、“树”和“巴士”三个物体,“狗”、“飞盘”这两个物体。

(a) 标签:斑马 (b) 标签:飞机

图1-1 单标签图像

(a) 标签:人 树 巴士 (b) 标签:狗 飞盘

图1-2 多标签图像

在实际生活中,随意的用手机或者相机拍摄,或者是从网上下载的图片大多是多标签的图片,这说明多标签图像比单标签图像在实际中更加常见实用。由于图像存在多个标签,如果简单地给图像打上单标签的图像标注会使同一张包含多个元素的图片需要在不同标签目录下重复存储所以,会造成极大的资源浪费,特别是对于图像检索来说,如果检索范围很小,那么检索的成功率是无法得到保证的。选择一个合适的机器学习方法,可以很好的完成对多标签图像的分类,提取图像所包含的语义内容,将其划分到某个语义类别当中,从而实现对图像的语义分类和标注,为图像检索等功能的实现提供了技术支持。对多标签场景图像分类的研究具有重大意义,可以使得用户在极短的时间内检索到想要的信息,促进搜索引擎的智能化发展,节省更多的人力、物力资源,提高资源利用率。

目前现有的多标签图像分类算法,大多只给出了算法的实现流程、需要配置的环境、需要安装的软件包等等,没有给出一个简洁容易交互的前端web应用界面。当这些算法运用到实际场景中,大部分操作人员可能并没有深度学习方面的知识,无法使用这些算法进行实际的运用,对于操作人员来说不太友好。设计并开发一个简单的多标签图像分类系统,系统提供一个直观的用户界面,用户可以方便地进行模型的选择、图片的分类等操作,避免不必要的技术壁垒。这样更多的领域从业者就可以有更多的机会和工具去使用深度学习技术来解决现实中的问题。

    1. 国内外研究现状分析

近年,深度学习依据自身的自动化特征提取和强大的非线性表征能力,引发计算机视觉模式在图像识别领域的研究热潮。目前深度学习技术已经走向产业化应用,并且在数字媒体以及工程开发等方面有着深刻的影响。学术研究上对于深度学习在多标签图像分类任务上进行了深度的研究,根据技术路线的不同形成了两条路线。一条路线为延续传统的机器学习,依赖人工设计特征与统计模型。另外一条路线为根据深度神经网络架构通过端到端的训练实现特征与分类器的联合优化。下图1-3展示了在深度学习角度上的图像多标签分类方法。

图1-3 多标签算法分类

基于深度学习的多标签算法主要涵盖二分类算法、特征相关性算法以及标签相关性算法这三类。运用二分类思想对深度多标签算法进行转换时,往往会忽视同一实例中标签共现的情况,导致标签间原本存在的关联性被弱化,因而在实际应用中的效果并不理想。鉴于二分类算法存在的这一缺陷,人们进而提出了利用特征相关性和标签相关性来实现转换的方法。所谓特征相关性算法,即是借助特征之间的相互关联性,来达成对同一实例进行多标签分类的目标。而标签相关性算法则是将分类提取的信息以显式或隐式的方式标注在标签域中,不再直接依赖原始数据,不过这种方式也带来了特征与信息丢失的问题。

在多标签图像识别领域,如何更有效地提取输入图像中的海量信息,充分挖掘各特征之间潜在的语义关联,进而实现标签间的关联学习,是深度学习技术不断探索的核心目标。随着研究的深入,大量基于深度学习的单标签图像分类网络被提出,较有代表性的如VGG[1]、GoogleNet[2] 、InceptionNet[3] 、ResNet[4] 、AlexNet [5] 等,这些网络均是卷积神经网络(Convolutional Neural Network,CNN)[6] 的拓展与延伸。除了上述典型的机器学习方法,还有其他诸多深度学习方法可用于多标签图像学习,如基于概率图模型、循环神经网络、图卷积神经网络等的方法,可用于提取图像与其表征标签间的语义信息,实现二者相互关联。

概率图模型的原理是借助数学概率构建图像标签间的语义相关性,以达成处理目的。Guo 等人提出了一种基于有向图的多标签分类算法[7] ,通过构建标签变量的完备连通依赖网络,高效发现标签间的依赖关系。2013 年,Guo 等人又提出了一种基于稀疏特征学习的多标签概率分类方法[8] ,能充分挖掘标签间的相关性,并结合共同预测结构优化模型。

Het al.提出了WARP模型解决多标签分类问题[9] ,其关键在于充分利用卷积神经网络的特征提取和对识别准确率关键因素的详细分析,包括预测结果分析和选择两个步骤,预测结果按概率大小排序选择,通常不超过三个。HCP算法[10]则采用“分割-聚合”思想,先分割输入图像,将多个部分输入相同网络进行卷积操作,最后经最大池化处理聚合得到多标签分类结果。实践证明,WARP和HCP模型分类效果良好,但忽略了标签间相关性对分类准确率的影响。随后,“链图”思想被Read等人[11]提出并利用。2014 年,Guo等人[12]为解决多标签图像分类中对象重叠问题提出概率增强模型算法。李等人在lasso框架[13]上扩展研发了CGL框架[14]来学习依赖图像间的标签结构,但基于概率图模型的扩展性相对较低,于是神经网络模型被引入任务处理。

RNN结构[15]具有记忆特性,可捕获长时依赖信息,通过环形神经网络构建标签间的关联关系,并融合卷积后的图像特征与标签矢量,实现标签间语义关系建模,代表性算法是CNN-RNN,输入标签图像经CNN与RNN 主导的特征向量映射和标签类别预测操作后,得到图像中最可能存在的类别,但学习过程中需事先设置好预测序列。RDAR、RLSD和RDAL [16]等模型也是利用循环神经网络对标签间关联进行建模的代表性成果,前两者利用卷积神经网络提取图像特征,借助RNN、LSTM等方法进行关联分析,并通过迭代操作定位标签位置,提高标签响应程度,最后用更新后的特征预测标签,基于增强学习理论的RDAL方法则有效解决了标签间的语义相关性问题,不过受限于循环神经网络顺序线性神经网络的特性,这些方法虽能提升多标签分类准确率,但在复杂数据集上的提升有限,如MS-COCO 数据集,且实际生活中图像标签数量不固定,增加了完整预测所有标签的难度。Chen等人在循环神经网络中嵌入“增强学习”模块,并引入注意力机制建立特殊区域间的标签依赖关系。图网络非拓扑结构方式被ML- GCN[18]选用构建标签间的结构关系,利用特征邻接矩阵和度矩阵建立标签相关性模型,学习标签节点间的语义关联关系,并在模型最后阶段将训练得到的标签节点与特征图相乘。

研究人员还将目光投向使用图像区域空间相关性对多标签图像分类任务的处理。例如,使用目标提案的HCP[19]算法。HCP算法通过提取出目标特征后再进行卷积与最大池化得到类别识别分数,但是这种方法对计算资源需求大、耗时长,限制了自身的应用范围。另外一种利用图像区域空间相关性的多标签图像分类方法是基于注意力机制方法。例如SRN[20]算法,该算法通过对各类特性图进行统计学习,利用卷积型的空间正则化方法来抑制未标记标签同时增强现有标签响应。该算法模型预测的最终分类结果由正则和非正则化的两部分特征计算预测结果融合得到。空间正则化方法的使用发掘了标签间空间位置关系,让SRN模型在多标签图像分类上具有了巨大的优势。

    1. 论文的主要内容

本文主要针对基于深度学习的多标签图像分类系统设计与实现,对系统进行了分析系统功能性需求和非功能性需求,规划系统概要设计、系统功能模块设计、数据库和数据集设计,确定系统的具体实现以及系统的测试工作。系统需要具有登录注册、图像分类(支持单张图、多张图)、图像预处理及查询历史记录等核心功能。同时从系统性能和安全性的角度出发对非功能需求进行确定。系统采用分层架构模式,分别为前端界面、后端服务、数据库和模型部署与调用层次,从而保证系统的可维护性与可拓展性。前端界面使用Vue进行实现,后端服务采用Springboot,选用Mysql数据库进行存储,Pytorch进行分类模型的实现。然后依据具体的功能需求实现相应的代码程序,在此基础上通过对ML-GCN与ADD-GCN多标签图像分类模型本地部署并打包成可调用接口的形式,达到使整个系统能够运行的目的;最后再通过功能性指标和非功能性指标来对系统的安全性、兼容性和可用性进行测试和检验。

  1. 系统需求分析
    1. 可行性论证
      1. 系统目标

本文所设计的基于深度学习的多标签图像分类系统,运用SpringBoot与Vue前后端分离架构,在本地部署ADD-GCN以及ML-GCN这两种图像分类模型,其目标在于搭建起一个既高效又对用户十分友好的多标签图像分类平台。从功能方面来讲,系统具有完备的用户管理机制,这其中包含用户注册、登录还有信息管理等各项功能。系统的核心功能主要集中在图像分类上,具备接收单张或者批量图像上传的能力,并且凭借在本地所部署的两个深度学习图像分类模型,快速且精准地完成多标签分类任务,将结果以直观的方式呈现给用户。系统提供图像预处理的功能,如对图片的裁剪、调亮暗度、渲染气氛等等,使用户能够根据自己的需要对图像做相应的处理、改进和优化,让分类更准确。系统能够完整的记录用户操作、分类任务,用户操作日志中包括用户登录、上传图片等行为和完成本次行为的时间,分类任务日志详细的记录了每次分类过程中的图像数据、预测值等,在需要的时候用户可以随时查询、回溯。

系统致力于提高分类准确率上,选取分类精准的多标签图像分类模型,充分发挥出两个本地模型的优势,使得多标签图像分类输出的每一类的精度都较为准确。除此之外,对于大批量图像数据来说,尽可能做到快速吞吐和及时返回结果。

      1. 可行性分析
        1. 经济可行性分析

从开发成本角度来看,本系统基于现有的Spring Boot和Vue开发框架进行构建,这两个框架均为开源且拥有庞大的开发者社区,丰富的文档资料和大量的插件资源,可大大节省开发过程中的学习成本和开发时间,进而降低人力成本投入。同时,深度学习模型的训练和部署主要依托于本地服务器资源,无需额外购买昂贵的商业软件,在硬件设备上,普通的服务器配置即可满足初期的模型训练和系统运行需求,降低了硬件采购成本。在云服务器上进行模型的深度训练需要租用服务器,但是现今算力资源充沛,租用服务器进行模型训练的费用完全在可接受范围内。此外,系统开发过程中主要涉及的是开发人员的人力成本,由于系统功能相对明确且开发技术较为成熟,开发周期可控制在合理范围内,人力成本也处于可接受水平。

从系统运行维护成本来看,由于系统部署在本地电脑上,所以系统的运行维护成本可以忽略不计。

        1. 技术可行性分析

从软件技术方面讲,前端使用了Vue框架进行开发,Vue框架有一个优点是轻量易用、组件化开发,可以很快地搭建出响应式的用户界面。与后端也可以很方便地进行数据交互。后端采用了SpringBoot框架进行开发,该框架本身有很多功能丰富的组件和插件可以实现快速搭建稳定、高效的后端服务架构,同时便于界面开发时的数据管理以及后期业务逻辑处理。最后前端与后端采用了前后端分离的设计模式来完成开发,既能灵活地进行前后端的开发与调试部署,又能让前后端分别独立开发,便于提高工作效率。

就深度学习技术而言,目前已有相当多的模型应用于图像分类任务当中,有较为成熟的各种模型架构可供参考使用,例如图卷积神经网络(GCN)、ResNet、Inception等。一些现有的图像分类模型在大体量的数据集进行图像识别的模型训练与验证之后,其在多标签图像分类任务上的准确性与召回率均有良好的表现,本系统选择的两个本地化的图像分类模型,可针对上面提到的现有的各种深度学习模型架构进行训练,并利用迁移学习技术让模型更好地适应于本系统所涉及的具体应用数据集;而常用的深度学习框架(例如PyTorch)都拥有优秀的工具与成熟的预训练模型框架,能方便地实现模型训练、调试、部署与调用,并能很好地同系统的后台服务衔接起来,使图像分类预测功能得以完善。

关于图像预处理的功能,为了完成图形截取、调整亮度值、渲染气氛等预处理的工作,可以直接通过已经成型的图像处理库(例如OpenCV)来实现,而且图像处理库自身的接口简洁易用,有很高的执行效率,并且经过大量的应用实例证明图像处理库的效果十分可靠、稳定。将这些图像预处理功能集成到系统中后,能够使系统的功能更为完善,更加实用。

综上所述,本系统在软件技术、深度学习技术以及图像处理技术等方面均有成熟的技术方案可供采用。

    1. 系统需求分析
      1. 系统功能需求概述

多标签图像的分析系统旨在构建一个高效、实用且用户友好的多标签图像分类平台,主要功能包括用户管理功能、图像分类功能、图像预处理功能、历史记录等功能,以下是该系统的业务需求概述:

1. 用户管理功能

注册与登录:用户利用用户名、密码、电子邮箱等数据完成用户注册操作。成功注册后,用户凭借注册时的邮箱账号以及密码来登录整个系统。

个人信息管理:用户成功登录系统后,能够在个人信息界面浏览或者更改自己的个人相关数据,像用户名、密码、电子邮件这类信息。

2. 图像分类功能

单图分类:用户能上传一幅图像,挑选相应的分类模型,系统借助本地部署的图像分类模型执行多标签分类预测作业,并将预测成果呈现于用户眼前。

多图分类:用户一次性上传多幅图像,系统依次对每一张图像开展分类预测作业,最终把所有图像的预测成果汇总后展示给用户。

3. 图像预处理功能

裁剪:用户能够对上传的图片进行尺寸裁剪,通过拖动裁剪框来裁剪图像的尺寸大小。

调整亮度:用户可以调整上传的图像的亮度,通过拖动亮度调节条来调整图像的亮度,系统将实时调整图像亮度并显示效果。

渲染气氛:用户可以从系统提供的多种图像气氛效果中进行挑选,如暖色调、冷色调、复古风格等。等到用户选择氛围效果后,系统将氛围效果应用到图像中并显示出来。

4. 历史记录功能

操作日志查询:系统可以记录用户的登录操作及时间、上传图片操作及时间和其他操作信息,用户可以在操作日志界面查看自己的操作,方便了解自己在系统中做了哪些事。

分类任务日志查询:系统可以详细的记录每一个分类任务的图像信息、分类结果、任务创建时间等详细的任务信息,用户可以在分类任务日志界面查看自己之前创建的所有分类任务的详细信息,方便查看以前的分类结果。

5. 部署与应用

完成模型训练和评估后,系统需要将训练好的模型部署到实际应用中。 这包括将模型集成到现有系统中或者设计新的应用接口,以便用户可以方便地使用该系统进行图像分类任务。

6. 可靠性

主要体现在用户上传图片后,系统应该能够可靠地对图片进行分类,确保准确性和稳定性。

7. 多格式图像数据处理能力

系统要能处理各种格式的数据图像,例如JPEG、PNG、BMP等格式,以及识别不同图像文件格式并对其进行预处理,要能够兼容不同的分辨率图像,可以灵活调整图像大小,以保证对图像的特征提取与分类工作可以正常进行,确保图像分类工作的有效性和准确性。

      1. 系统功能需求分析
        1. 系统用例图

系统整体用例图如下图2-1所示。该系统用例图描述了系统的功能模块以及用户与系统之间的交互过程。用户通过登录注册进入系统,然后用户可以进行图片上传、模型选择、图像分类和图像处理等系统功能。

图2-1 系统用例图

        1. 用户管理子系统

用户管理子系统向用户提供了注册页面,用户可以在该页面上填写自己的用户名、密码、确认密码以及电子邮箱等信息来完成注册,并且系统还会对用户所填写的信息进行判断,以确定是否符合要求(如密码强度判断、邮件格式校验等),如果用户信息没有问题,那么就会把用户信息存入数据库当中,并使其成为本系统的正式用户。

用户于登录界面填写个人账号与密码,点击登录按钮后,系统将对所填账号及密码开展校验工作。优先核查所填用户名是否对应注册在案的用户,若无此用户名,界面即刻提示 “该用户名无对应记录”;若用户名属实,紧接着检验所填密码是否与系统存档密码相匹配,只有用户名和密码悉数无误,才放行用户进入系统主页。与此同时,系统会记录下此次登录的具体时间及IP地址。当用户在设定的时长内再度访问该系统,系统可识别并免去输入账号密码环节,直接予以自动登录,提升访问便捷度。

用户登录系统后,可无障碍进入个人信息管理版块,在此版块内,用户有权查阅以及更改自身诸如用户名、密码、电子邮箱等各项信息。若用户有修改密码的需求,系统会要求用户先行输入当前正在使用的密码,以此作为身份验证的关键步骤,只有通过验证,用户才能继续设定新密码并落实修改操作,而且为保障账号安全,新密码必须与旧密码有所区别。用户管理子系统的用例图如图2-2所示。

图2-2 账户信息管理用例图

        1. 图像分类子系统

当用户点击单张图像上传区域,并上传一个图片文件后,系统能够接收常见的图片格式,如JPG、PNG等。用户挑选分类模型之后,系统会把图片文件传给后端。后端在收到接收方传来的图片文件后会对其先进行预处理,例如将整个图像大小均等化,然后再调模型进行多标签分类预测。其输出的是这个图像所有标签的概率,而后端再依据设置好的阈值决定最终的多标签分类结果(假如这幅图中标签出现的概率大于0.6,那就说明这张图就拥有这个标签)。后端还会将其分类的结果呈现出来,并返回至前端网页页面当中,显示出标签的名字以及对应的概率值。

除此之外,也可以直接在图像分类页面上点击“多图上传”,选择多张图片文件一起批量上传。选好图像及分类模型之后,系统将把所有图像文件批量发送到后端,在获取到图像文件之后,后端将每张图像文件按照单张图像分类预处理、分类预测的过程来做处理。直到所有图像处理完毕之后,后端再将所有的图像分类的结果汇总起来,最终形成列表形式的数据回传给前端页面显示出来。图像分类子系统的用例图如2-3所示。

图2-3图像分类子系统用例图

        1. 图像预处理子功能

用户可以在图像处理页面上传图片对图片进行裁剪操作,在页面提供一个裁剪框让用户把需要的区域放在框内,然后通过拖动裁剪框边缘或角点来实现裁剪区域大小及位置的更改。系统的界面提供一个滑动条让用户可以拖动去改变图像亮度,用户拖动滑动条即可看到图片的亮度变化情况。系统内已经设定好了一系列的氛围效果选项:暖色调、冷色调、复古风、黑白等效果。用户可以在页面下方根据自身喜好选择渲染氛围,当用户点击对应的按钮后,系统会根据用户的选择渲染画面上的效果。用户也可以根据自身的需要,反复进行对比选择最合适的氛围效果。当图片达到用户目标的图像处理结果后,点击“确认裁剪”后系统对图片进行相应的处理,并展示处理结果。图像预处理子系统的用例图如图2-4所示。

图2-4图像预处理子系统用例图

        1. 历史记录子系统功能

系统会对用户的所有操作行为都进行记录,如:登录时间、退出时间、预处理操作等。所有操作会形成列表展现出来,用户可在列表中看到自己对系统的各种操作记录,进而实现用户的活动轨迹查询的功能。系统保留每次分类任务的全部信息,例如:分类任务的开始时间、结束时间、上传图片数量、分类结果、分类置信度等。查询结果会通过表格呈现出来,用户可以查看到每张图的分类结果,如果想了解详情还可以点击“查看详情”按钮查看所对应的图的缩略图以及更多的分类信息,例如该标签的概率分布情况等等。历史记录子系统的用例图如图2-5所示。

图2-5 历史记录子功能用例图

      1. 其它非功能需求分析
        1. 系统性能需求分析

响应时间:系统要能在规定的时间内对用户的登录、图片上传、预处理以及分类预测等请求作出回应,用户登录请求的回应时间要在合理时间范围之内,单个图像上传请求的回应时间不能超过五秒,单个图像分类预测请求的回应时间,不能超过十秒,依照上传图片的数量,合理规划多张图片分类预测请求的回应时间,每张图片的平均分类预测回应时间不能超过十五秒。

吞吐量:当系统处于正常工作状态时,每秒应该能处理5个以上请求,对于批量处理这样大规模的图像分类任务,系统应该能在合理的时间内完成。

        1. 系统易用性需求分析

界面友好:前端界面上要简洁、明了、美观,遵循用户的操作习惯。对于一些页面排版、交互元素要采用统一的设计规范,方便用户学习掌握系统操作的方法步骤;在涉及到上传图片、图片预处理、分类结果展示等功能类页面时,则要为用户提供必要的提示信息,以便用户正确完成操作。

系统稳定性:系统运行时不应发生频繁的死机、卡死或掉数据的现象,对于可能会发生的系统异常情况,要及时地捕捉和处理错误,弹出友好的错误信息。

    1. 本章小结

本章对基于深度学习的多标签图像分类系统进行了需求分析,明确基于深度学习的多标签图像分类系统的设计目标。对多标签图像分类系统开发的成本费用进行经济可行性分析,检验出系统开发成本在可控范围内。从软件技术、深度学习技术和图像处理技术出发,就系统的可开发性进行充分说明,证明所选技术栈和开发框架是成熟可靠的。对系统的功能需求进行详细的梳理。系统功能需求概述主要涉及用户管理、图像分类、图像预处理以及历史记录,直观清晰地表达了系统的业务范畴与功能边界。而系统功能需求分析从各个功能模块对应的实现步骤,保证系统能够贴合用户所要使用的业务场景及需求。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/9 21:35:08

为什么你的分布式锁失效了?Java+Redis锁机制深度剖析

第一章:分布式锁的核心概念与挑战在分布式系统中,多个节点可能同时访问共享资源,如数据库记录、缓存或文件系统。为了确保数据的一致性和操作的原子性,必须引入一种协调机制——分布式锁。它允许多个进程在跨网络的环境下协商对临…

作者头像 李华
网站建设 2026/2/5 18:46:25

【高级工程师必懂】:利用反射机制安全调用私有方法的5种场景

第一章:Java反射机制获取私有属性方法的核心原理Java反射机制突破访问控制的核心在于运行时动态绕过JVM的访问检查,其底层依赖于java.lang.reflect.AccessibleObject.setAccessible(true)方法。该方法通过修改override标志位并调用本地方法(N…

作者头像 李华
网站建设 2026/2/10 9:15:35

【Logback性能提升秘籍】:3步实现高效日志输出与文件滚动

第一章:Logback日志框架核心概述 Logback 是由 Log4j 的创始人 Ceki Glc 设计的现代 Java 日志框架,作为 SLF4J(Simple Logging Facade for Java)的原生实现,提供了高性能、灵活性和可扩展性的日志处理能力。它被广泛应…

作者头像 李华
网站建设 2026/2/6 17:46:53

你真的会用反射吗?:破解Java私有访问限制的4个关键技术点

第一章:你真的会用反射吗?——Java私有访问限制的破局之道 Java反射机制是运行时获取类信息、调用对象方法、访问字段的强大工具。然而,当目标成员被声明为private时,常规方式无法直接访问。反射提供了突破这一限制的能力&#xf…

作者头像 李华