news 2026/4/1 14:25:15

人工智能之核心基础 机器学习 第二章 监督学习

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
人工智能之核心基础 机器学习 第二章 监督学习

人工智能之核心基础 机器学习

第二章 监督学习—公式关注公众号


文章目录

  • 人工智能之核心基础 机器学习
    • 2.1 监督学习的定义与特点
      • 📌 什么是监督学习?
      • 🔍 监督学习的特点
    • 2.2 监督学习的核心任务
      • 1️⃣ 分类任务(Classification)
      • 2️⃣ 回归任务(Regression)
    • 2.3 数据集划分:训练集、验证集、测试集
      • 🛑 重要原则:
    • 2.4 模型评估指标
      • 🔹 分类任务常用指标
        • 1. **准确率**(Accuracy)
        • 2. **精确率**(Precision)
        • 3. **召回率**(Recall / Sensitivity)
        • 4. **F1值**(F1-Score)
        • 5. **ROC曲线 & AUC值**
      • 🔸 回归任务常用指标
        • 1. **MAE**(Mean Absolute Error,平均绝对误差)
        • 2. **MSE**(Mean Squared Error,均方误差)
        • 3. **RMSE**(Root Mean Squared Error,均方根误差)
        • 4. **R²**(决定系数,R-squared)
    • 🎯 本章总结
  • 资料关注

2.1 监督学习的定义与特点

📌 什么是监督学习?

监督学习就像“有老师教学生”的过程。
你给计算机一堆已经知道答案的例子(比如:“这张图是猫”、“那封邮件是垃圾邮件”),让它从这些例子中学会规律,然后用学到的规律去预测新数据的答案

核心关键词有标签的数据(labeled data)
“标签”就是每个样本的正确答案。比如:

  • 图片 + “猫” → 标签是“猫”
  • 房屋信息 + “300万元” → 标签是价格

🔍 监督学习的特点

特点说明
需要标签每条训练数据都必须带有“标准答案”
目标明确学会输入(特征)和输出(标签)之间的映射关系
可评估性能因为有真实标签,可以计算预测对不对
应用广泛分类、回归等大多数实际问题都属于监督学习

💡打个比方
你教小孩认水果——给他看100张带名字的水果照片(“这是苹果”“这是香蕉”)。之后你给他一张新照片,他就能说出是什么水果。这就是监督学习!


2.2 监督学习的核心任务

监督学习主要解决两类问题:

1️⃣ 分类任务(Classification)

目标:预测离散的类别标签(有限个选项)

✅ 例子:

  • 判断邮件是不是垃圾邮件(是 / 否)

  • 识别图片中的动物(猫 / 狗 / 鸟)

  • 医疗诊断(患病 / 健康)

📌关键点:输出是类别,不是数字大小。


2️⃣ 回归任务(Regression)

目标:预测连续的数值(可以是任意实数)

✅ 例子:

  • 预测房价(比如 285.6 万元)
  • 预测明天的气温(23.7℃)
  • 预测销售额(12,345.8 元)

📌关键点:输出是数字,而且关注数值的大小和误差


🧠一句话区分

如果答案是“是什么”(类别)→分类
如果答案是“是多少”(数值)→回归


2.3 数据集划分:训练集、验证集、测试集

为了让模型既学得好,又不会“死记硬背”,我们需要把数据分成三份:

数据集占比(常见)作用类比
训练集(Training Set)60%~70%用来“上课学习”学生做练习题
验证集(Validation Set)10%~20%调整模型参数、选模型小测验,看看哪种方法更有效
测试集(Test Set)20%~30%最终考试,评估真实水平期末考试,不能提前看题!

🛑 重要原则:

  • 测试集绝对不能参与训练或调参!
    否则就像“提前看了考题”,评估结果会虚高。
  • 划分要随机且有代表性,避免偏差(比如所有猫都在训练集,狗全在测试集)。
  • 常用划分方法:train_test_split(Scikit-learn库函数)

🎯小技巧
对于小数据集,可以用交叉验证(Cross-Validation)来更充分地利用数据。


2.4 模型评估指标

光说“模型好不好”不够,得用数字说话!不同任务用不同指标。


🔹 分类任务常用指标

假设我们做一个“是否患癌”的预测模型:

实际 \ 预测预测“患病”预测“健康”
真实患病真阳性(TP)假阴性(FN)
真实健康假阳性(FP)真阴性(TN)
1.准确率(Accuracy)

所有预测中,猜对的比例
Accuracy = T P + T N T P + T N + F P + F N \text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN}Accuracy=TP+TN+FP+FNTP+TN
✅ 适合类别平衡的情况(比如男女各一半)
❌ 不适合不平衡数据(比如99%健康,1%患病——瞎猜“健康”也能99%准确!)

2.精确率(Precision)

预测为“阳性”的人里,真正阳性的比例
Precision = T P T P + F P \text{Precision} = \frac{TP}{TP + FP}Precision=TP+FPTP
👉 关注:别乱报阳性(比如垃圾邮件过滤,别把正常邮件当垃圾)

3.召回率(Recall / Sensitivity)

所有真实阳性中,被找出来的比例
Recall = T P T P + F N \text{Recall} = \frac{TP}{TP + FN}Recall=TP+FNTP
👉 关注:别漏掉真阳性(比如癌症筛查,千万别漏诊!)

4.F1值(F1-Score)

精确率和召回率的调和平均(兼顾两者)
F 1 = 2 ⋅ Precision ⋅ Recall Precision + Recall F1 = 2 \cdot \frac{\text{Precision} \cdot \text{Recall}}{\text{Precision} + \text{Recall}}F1=2Precision+RecallPrecisionRecall
✅ 当你不知道该优先看精确率还是召回率时,就看F1!

5.ROC曲线 & AUC值
  • ROC曲线:画出不同阈值下“真正率(TPR)” vs “假正率(FPR)”的曲线
  • AUC(Area Under Curve):ROC曲线下面积,越大越好(最大为1)
    ✅ AUC能衡量模型在所有分类阈值下的整体表现,不受类别不平衡影响!

🔸 回归任务常用指标

假设真实房价是 300 万,模型预测了 280 万,误差 = 20 万。

1.MAE(Mean Absolute Error,平均绝对误差)

平均每个预测错多少
MAE = 1 n ∑ i = 1 n ∣ y i − y ^ i ∣ \text{MAE} = \frac{1}{n}\sum_{i=1}^n |y_i - \hat{y}_i|MAE=n1i=1nyiy^i
✅ 单位与原数据一致,好解释(比如“平均差5万元”)

2.MSE(Mean Squared Error,均方误差)

先平方再平均(放大较大误差的影响)
MSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 \text{MSE} = \frac{1}{n}\sum_{i=1}^n (y_i - \hat{y}_i)^2MSE=n1i=1n(yiy^i)2
⚠️ 单位是“平方”,不好直接理解

3.RMSE(Root Mean Squared Error,均方根误差)

MSE 开平方,回到原始单位
RMSE = MSE \text{RMSE} = \sqrt{\text{MSE}}RMSE=MSE
✅ 既保留了MSE对大误差敏感的优点,又便于理解

4.(决定系数,R-squared)

模型比“瞎猜均值”好多少?
R 2 = 1 − ∑ ( y i − y ^ i ) 2 ∑ ( y i − y ˉ ) 2 R^2 = 1 - \frac{\sum (y_i - \hat{y}_i)^2}{\sum (y_i - \bar{y})^2}R2=1(yiyˉ)2(yiy^i)2

  • R² = 1:完美预测
  • R² = 0:和猜平均值一样差
  • R² < 0:比猜平均值还差!(模型有问题)

R²最常用,因为它无量纲,便于比较不同模型。


🎯 本章总结

  • 监督学习= 用带答案的数据教模型
  • 分类预测“是什么”,回归预测“是多少”
  • 数据要分训练/验证/测试三份,测试集是“期末考”
  • 分类看准确率、精确率、召回率、F1、AUC
  • 回归看MAE、RMSE、R²

💡建议:先掌握准确率、MAE、R²这三个最直观的指标,再逐步深入其他指标!

资料关注

公众号:咚咚王

《Python编程:从入门到实践》
《利用Python进行数据分析》
《算法导论中文第三版》
《概率论与数理统计(第四版) (盛骤) 》
《程序员的数学》
《线性代数应该这样学第3版》
《微积分和数学分析引论》
《(西瓜书)周志华-机器学习》
《TensorFlow机器学习实战指南》
《Sklearn与TensorFlow机器学习实用指南》
《模式识别(第四版)》
《深度学习 deep learning》伊恩·古德费洛著 花书
《Python深度学习第二版(中文版)【纯文本】 (登封大数据 (Francois Choliet)) (Z-Library)》
《深入浅出神经网络与深度学习+(迈克尔·尼尔森(Michael+Nielsen)》
《自然语言处理综论 第2版》
《Natural-Language-Processing-with-PyTorch》
《计算机视觉-算法与应用(中文版)》
《Learning OpenCV 4》
《AIGC:智能创作时代》杜雨+&+张孜铭
《AIGC原理与实践:零基础学大语言模型、扩散模型和多模态模型》
《从零构建大语言模型(中文版)》
《实战AI大模型》
《AI 3.0》

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/1 10:40:11

小白也能学会:本地部署媲美ChatGPT的私人知识库

本文介绍使用OllamaDeepSeekAnythingLLM组合方案在本地搭建私人知识库的方法&#xff0c;解决企业用户数据安全顾虑。文章详细讲解从配置Ollama、设置嵌入模型到安装AnythingLLM、构建专属知识库的完整步骤&#xff0c;大幅降低初学者使用门槛。通过这套方案&#xff0c;用户可…

作者头像 李华
网站建设 2026/3/22 15:07:01

AI开发必备:Claude Skills详解,让你的智能体效率起飞(建议收藏)

Claude Skills是Anthropic推出的革命性功能&#xff0c;通过"渐进式披露"技术解决重复提示词、token成本高的问题。它采用分层加载机制&#xff0c;启动时仅加载约100 token的配置&#xff0c;任务触发时按需加载完整内容&#xff0c;大幅降低上下文负担。Skills本质…

作者头像 李华
网站建设 2026/3/31 13:44:16

ARM 汇编指令:STM

ARM 汇编指令&#xff1a;STM 本文来自于我关于 ARM 汇编指令系列文章。欢迎阅读、点评与交流~ 1、汇编指令在不同架构中的联系与区别 2、ARM 汇编指令&#xff1a;MOV 3、ARM 汇编指令&#xff1a;LDR 4、ARM 汇编指令&#xff1a;STR 5、ARM 汇编指令&#xff1a;MRS 和 MSR …

作者头像 李华
网站建设 2026/3/31 1:25:42

ARM 汇编指令:LDM

ARM 汇编指令&#xff1a;LDM 本文来自于我关于 ARM 汇编指令系列文章。欢迎阅读、点评与交流~ 1、汇编指令在不同架构中的联系与区别 2、ARM 汇编指令&#xff1a;MOV 3、ARM 汇编指令&#xff1a;LDR 4、ARM 汇编指令&#xff1a;STR 5、ARM 汇编指令&#xff1a;MRS 和 MSR …

作者头像 李华
网站建设 2026/3/28 5:36:42

Anaconda占用空间太大?换用Miniconda-Python3.10节省70%存储

Anaconda占用空间太大&#xff1f;换用Miniconda-Python3.10节省70%存储 在数据科学和AI开发的日常中&#xff0c;你是否也遇到过这样的尴尬&#xff1a;刚在云服务器上部署完环境&#xff0c;磁盘就告急&#xff1b;下载一个完整的Anaconda发行版&#xff0c;等了十分钟&#…

作者头像 李华
网站建设 2026/3/24 18:23:14

如何将Miniconda-Python3.10用于大规模Token售卖业务?

如何将Miniconda-Python3.10用于大规模Token售卖业务&#xff1f; 在AI即服务&#xff08;AI-as-a-Service&#xff09;的浪潮中&#xff0c;基于API调用计费的商业模式已成主流。无论是文本生成、图像识别还是自然语言处理&#xff0c;大多数平台都采用“按Token数量”收费的方…

作者头像 李华