news 2026/4/10 16:41:16

监督学习非监督学习的区别

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
监督学习非监督学习的区别

监督学习&非监督学习

  • 监督学习(Supervised Learning)
  • 非监督学习(Unsupervised Learning)
  • 区分——是否有“标签(Label)”
    • 什么是「标签」?
    • 监督学习(Supervised Learning)
      • 监督学习主要解决 两类问题:分类&回归
        • 分类(Classification)
        • 回归(Regression)
    • 非监督学习(Unsupervised Learning)
      • 非监督学习主要做三件事:聚类&降维&异常检测
        • 聚类(Clustering)
        • 降维(Dimensionality Reduction)
        • 异常检测(Anomaly Detection)
      • 常见监督&非监督学习算法

监督学习(Supervised Learning)

定义:监督学习是指在训练过程中,利用包含输入特征与对应输出标签的数据集,通过最小化预测输出与真实标签之间的误差,学习输入空间到输出空间映射关系的一类机器学习方法。

训练数据形式:
D = { ( x i , y i ) } i = 1 n D = \{(x_i, y_i)\}_{i=1}^nD={(xi,yi)}i=1n

  • x i x_ixi:输入特征向量
  • y i y_iyi:已知标签(目标值)

学习目标:
f : X → Y f : X \rightarrow Yf:XY
优化目标:经验风险最小化(ERM)

非监督学习(Unsupervised Learning)

定义:非监督学习是指在训练数据不包含任何先验标签信息的情况下,仅利用输入数据的内在结构、统计特性或相似性关系,对数据进行建模和结构发现的一类机器学习方法。

训练数据形式:D = { x i } i = 1 n \mathcal{D} = \{ x_i \}_{i=1}^{n}D={xi}i=1n

  • 无显式目标变量y yy

学习目标:发现数据分布或潜在结构
常见依据:距离度量、相似度函数、概率分布假设

区分——是否有“标签(Label)”

有标签 → 监督学习(Supervised Learning)
没标签 → 非监督学习(Unsupervised Learning)

什么是「标签」?

标签 = 标准答案

数据是否有标签说明
房子面积 → 房价✅ 有房价就是答案
图片 → 是猫/不是猫✅ 有猫 / 非猫
一堆用户购买记录❌ 没有没人告诉你“这属于哪一类”

监督学习(Supervised Learning)

定义:给定输入 X 和对应的正确输出 Y,学习 X → Y 的映射关系
📌 核心关键词:有标签

监督学习主要解决 两类问题:分类&回归

分类(Classification)

输出是类别

例子:
垃圾邮件 / 非垃圾邮件
肿瘤是良性 / 恶性
是否违约(是 / 否)

回归(Regression)

输出是连续数值

例子:
房价预测
温度预测
股票价格预测

非监督学习(Unsupervised Learning)

定义:只有输入数据 X,没有标准答案 Y,让算法自己发现数据结构
📌 核心关键词:没标签

非监督学习主要做三件事:聚类&降维&异常检测

聚类(Clustering)

👉 把“相似的东西”分到一起

例子:
用户分群
客户画像
文档主题聚类

降维(Dimensionality Reduction)

👉 压缩特征、去冗余、便于可视化

例子:
高维数据 → 2D/3D 可视化
特征压缩

异常检测(Anomaly Detection)

👉 找“不正常”的点

常见监督&非监督学习算法

监督非监督
线性回归(Linear Regression)——回归K-means ——聚类
逻辑回归(Logistic Regression) ——分类层次聚类(Hierarchical Clustering)—— 聚类
KNN(K近邻) —— 分类 / 回归DBSCAN —— 聚类 / 异常检测
支持向量机(SVM) ——分类 / 回归PCA(主成分分析) —— 降维
决策树(Decision Tree) ——分类 / 回归ICA —— 降维
随机森林(Random Forest) —— 分类 / 回归AutoEncoder ——降维
神经网络(ANN / CNN / RNN) ——分类 / 回归Apriori —— 关联规则
对比点监督学习非监督学习
是否有标签✅ 有❌ 没有
是否有标准答案没有
目标预测结果发现结构
常见任务分类、回归聚类、降维
学习难度相对简单相对抽象
现实场景标签贵数据多但没标签
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/8 11:09:57

34、UNIX 中 vi 编辑器的多场景应用与多文件编辑技巧

UNIX 中 vi 编辑器的多场景应用与多文件编辑技巧 1. vi 编辑器在不同场景的应用 vi 编辑器的命令结构在多年来已被应用于许多应用程序和软件中。若不熟悉 vi 的移动操作,可能在使用某些应用时会遇到困难。以下介绍几个 vi 在不同场景下的应用实例。 1.1 UNIX 邮件发送 在 …

作者头像 李华
网站建设 2026/4/2 7:26:52

LoFA 图像秒级适配好搭档

文章目录架构设计核心思想关键技术实现优势分析LoFA: Learning to Predict Personalized Priors for Fast Adaptation of Visual Generative Models https://github.com/GAP-LAB-CUHK-SZ/LoFA https://arxiv.org/abs/2512.08785 https://jaeger416.github.io/lofa/ 架构设计核心…

作者头像 李华
网站建设 2026/4/4 11:23:22

ITransformer: Inverted Transformers Are Effective for Time Series Forecasting

解释典型的Transformer架构用于时序预测效果差的原因,它们的观点:由单个时间步长形成的Token,由于过于局部的感受野和同时时间点表示的时间不对齐事件而难以显示有益信息。 时间序列预测模型的标准设定: 输入 (历史窗) XXX&#x…

作者头像 李华
网站建设 2026/4/3 7:50:49

EssentialPIM Pro:一站式个人信息管理工具,让生活更高效

在信息爆炸的时代,高效的个人信息管理工具显得尤为重要。EssentialPIM Pro作为一款功能全面的个人信息管理软件,集成了日历、联系人、任务、笔记等核心功能,堪称Microsoft Outlook的轻量级替代品。本文将从实际使用体验出发,详细介…

作者头像 李华
网站建设 2026/4/9 8:55:46

破除信息壁垒,强化系统联动,IBMS系统打造建筑智能控制核心

在智慧建筑飞速发展的当下,楼宇自控、安防监控、消防报警、能耗监测等子系统如同建筑的“四肢”,支撑着日常运营的每一项功能。但在传统管理模式中,各子系统独立运行、数据互不互通,形成一道道“信息壁垒”,不仅导致设…

作者头像 李华
网站建设 2026/4/2 6:21:32

如何定位个人IP方向?

——别急着拍视频,先想清楚这3件事最近和不少朋友聊天,发现一个有趣的现象: 不管是程序员、设计师、销售,还是开厂的老板、做培训的老师,越来越多人在问:“我是不是也该做个个人IP?” “但我到底…

作者头像 李华