news 2026/6/9 18:32:29

AI大模型-机器学习-分类

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI大模型-机器学习-分类

目的

为避免一学就会、一用就废,这里做下笔记

内容

分类规则

机器学习,通常根据学习过程中系统接收的“监督信号”类型和形式来分类

具体分类

1. 监督学习

  • 核心:使用“已标注”的数据集进行训练。每个训练样本都包含输入特征和对应的正确输出标签
  • 目标:学习从输入到输出的映射函数,以便对新的、未见过的输入做出准确预测。
  • 主要任务
    • 分类:预测离散的类别标签。
      • 二分类:垃圾邮件过滤(是/否)。
      • 多分类:图像识别(猫/狗/鸟)。
    • 回归:预测连续的数值。
      • 示例:预测房价、预测销售额。
  • 典型算法:线性回归、逻辑回归、支持向量机、决策树、随机森林、神经网络。

2. 无监督学习

  • 核心:使用“未标注”的数据集进行训练。只有输入特征,没有给定的输出标签。
  • 目标:发现数据内在的结构、模式或分布
  • 主要任务
    • 聚类:将数据分成有意义的组,使得组内相似度高,组间相似度低。
      • 示例:客户细分、新闻主题分组。
    • 降维:在尽可能保留关键信息的前提下,减少数据特征的数量,以用于可视化、去噪或作为监督学习的预处理步骤。
      • 示例:主成分分析(PCA)、t-SNE。
    • 关联规则学习:发现数据中特征之间的有趣联系
      • 示例:购物篮分析(“买啤酒的人常买尿布”)。
  • 典型算法:K-Means、层次聚类、DBSCAN、PCA、自编码器。

3. 强化学习

  • 场景:竞技游戏、机器人控制、自动驾驶等
  • 核心:智能体通过与环境互动来学习。智能体根据当前状态采取行动,环境给予奖励或惩罚的反馈信号。
  • 目标:学习一个策略,使得智能体通过一系列行动能获得最大的累积奖励
  • 关键要素:状态、动作、奖励、策略、价值函数。
  • 特点:没有“标准答案”,只有延迟的、稀疏的反馈。强调序列决策探索与利用的权衡
  • 典型算法:Q-Learning、策略梯度算法、深度强化学习(如DQN、AlphaGo)。

4. 半监督学习

  • 核心:训练数据中,少量昂贵的标注数据提供“标准答案”,而大量易得的无标签数据帮助模型更好地理解数据的整体分布和内在结构,从而填补知识空白,学习更强大、更通用的特征表示。
  • 动机:在实际应用中,获取标签成本高昂,而无标签数据则相对容易获得。
  • 场景/案例
    医学影像分析、网页分类、工业视觉检测(质检)等

5. 自监督学习

  • 核心:一种“无中生有”的学习方式。从数据自身构造监督信号,生成“伪标签”进行学习。
  • 示例
    • 在NLP中:掩码语言模型(如BERT),通过预测被遮蔽的词语来学习。
    • 在CV中:对比学习(如SimCLR),通过判断两个图像增强版本是否来自同一原图来学习。
  • 意义:是当前大模型预训练的核心技术,能充分利用海量无标签数据。

6. 迁移学习

  • 核心将一个领域(源领域)上训练好的模型或知识,应用于另一个相关但不同的领域(目标领域)
  • 方法:通常复用预训练模型的部分层(特征提取器),只对最后几层进行微调。
  • 价值:极大减少目标领域所需的数据量和训练时间。ImageNet上预训练的CNN是经典例子。

总结对比

类型数据形式监督信号目标经典应用
监督学习带标签明确、直接预测、映射分类、回归、预测
无监督学习无标签发现结构聚类、降维、推荐
强化学习交互序列延迟奖励/惩罚最优决策游戏、机器人、自动驾驶
半监督学习少量标签+大量无标签混合利用无标签数据提升性能网页分类、医学影像
自监督学习无标签(自身构造)自动生成学习通用特征表示大语言模型、视觉预训练
迁移学习源领域+目标领域源领域有,目标领域可能无知识迁移与适应图像识别、自然语言处理

这个分类体系是理解和应用机器学习的基础。在实际项目中,常常需要根据问题特点和数据情况,灵活组合或选择这些范式。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/6 19:49:20

3分钟学会:如何在Windows上完美读写Btrfs分区

3分钟学会:如何在Windows上完美读写Btrfs分区 【免费下载链接】btrfs WinBtrfs - an open-source btrfs driver for Windows 项目地址: https://gitcode.com/gh_mirrors/bt/btrfs 还在为双系统切换时的文件访问障碍而烦恼吗?WinBtrfs这款开源驱动…

作者头像 李华
网站建设 2026/6/5 15:11:55

Sunshine游戏串流技术深度解析:构建高性能云游戏平台的完整方案

Sunshine游戏串流技术深度解析:构建高性能云游戏平台的完整方案 【免费下载链接】Sunshine Sunshine: Sunshine是一个自托管的游戏流媒体服务器,支持通过Moonlight在各种设备上进行低延迟的游戏串流。 项目地址: https://gitcode.com/GitHub_Trending/…

作者头像 李华
网站建设 2026/6/5 8:31:36

AMD Ryzen处理器深度调优实战:解锁隐藏性能的完整指南

AMD Ryzen处理器深度调优实战:解锁隐藏性能的完整指南 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://gi…

作者头像 李华
网站建设 2026/6/5 15:06:52

StructBERT零样本分类器案例:法律文书分类

StructBERT零样本分类器案例:法律文书分类 1. 引言:AI 万能分类器的崛起 在自然语言处理(NLP)领域,文本分类是构建智能系统的核心能力之一。传统方法依赖大量标注数据进行监督训练,成本高、周期长&#x…

作者头像 李华
网站建设 2026/6/5 14:20:29

从欧姆定律看三极管驱动LED的限流设计原理

从欧姆定律看三极管驱动LED的限流设计原理你有没有遇到过这种情况:明明代码写对了,MCU也输出高电平了,可LED就是不亮?或者更糟——刚点亮没几秒,灯珠就烧了?问题很可能出在看似简单却暗藏玄机的三极管驱动电…

作者头像 李华
网站建设 2026/6/8 2:51:36

5分钟搞定网易云NCM文件转换:终极免费工具使用指南

5分钟搞定网易云NCM文件转换:终极免费工具使用指南 【免费下载链接】ncmToMp3 网易云vip的ncm文件转mp3/flac - ncm file to mp3 or flac 项目地址: https://gitcode.com/gh_mirrors/nc/ncmToMp3 还在为网易云VIP下载的NCM文件无法在其他播放器播放而烦恼吗&…

作者头像 李华