news 2026/4/25 9:07:18

8.2 逻辑回归与广义线性模型:连接函数与最大似然估计

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
8.2 逻辑回归与广义线性模型:连接函数与最大似然估计

8.2 逻辑回归与广义线性模型:连接函数与最大似然估计

逻辑回归是机器学习领域最基础且应用最广泛的分类算法之一。尽管其名称中包含“回归”,但它本质上是一种用于处理二分类问题的线性模型。理解逻辑回归不能仅停留于其函数形式,而应将其置于广义线性模型的统一理论框架之下。本节将系统阐述逻辑回归的数学模型、参数估计方法,并以此为例深入剖析广义线性模型的核心组件——连接函数与最大似然估计的原理。

8.2.1 逻辑回归:从线性预测到概率输出

逻辑回归的目标是建模二分类结果y∈{ 0,1}y \in \{0, 1\}y{0,1}与特征向量x∈Rd\mathbf{x} \in \mathbb{R}^dxRd之间的关系。与直接预测0或1不同,逻辑回归预测的是样本属于正类(y=1y=1y=1)的条件概率P(y=1∣x)P(y=1|\mathbf{x})P(y=1∣x)

8.2.1.1 基本模型与Sigmoid函数

直接使用线性组合wTx+b\mathbf{w}^T\mathbf{x} + bwTx+b来拟合概率p=P(y=1∣x)p = P(y=1|\mathbf{x})p=P(y=1∣x)是不合适的,因为线性函数的输出值域为(−∞,+∞)(-\infty, +\infty)(,+),而概率值域要求为[0,1][0, 1][0,1]。逻辑回归通过sigmoid函数(亦称逻辑函数)将线性预测值映射到(0,1)(0, 1)(0,1)区间内。
σ(z)=11+e−z \sigma(z) = \frac{1}{1 + e^{-z}}σ(z)=1+ez1
其中z=wTx+bz = \mathbf{w}^T\mathbf{x} + bz=wTx+b。因此,逻辑回归模型定义为:
P(y=1∣x;w,b)=σ(wTx+b)=11+e−(wTx+b) P(y=1|\mathbf{x}; \mathbf{w}, b) = \sigma(\mathbf{w}^T\mathbf{x} + b) = \frac{1}{1 + e^{-(\mathbf{w}^T\mathbf{x} + b)}}P(y=1∣x;w,b)=σ(wTx+b)=1+e(wTx+b)1
sigmoid函数具有S形曲线、连续可导、且其导数σ′(z)=σ(z)(1−σ(z))\sigma'(z) = \sigma(z)(1-\sigma(z))σ(z)=σ(z)(1σ(z))易于计算,这些性质对后续的参数优化至关重要。

8.2.1.2 对数几率解释

逻辑回归具有一个清晰的概率解释。定义几率为事件发生概率与不发生概率之比,即odds=p1−podds = \frac{p}{1-p}odds=1pp。对几率取自然对数,得到对数几率(logit)。
逻辑回归的线性部分实际上是在拟合对数几率:
log⁡(P(y=1∣x)1−P(y=1∣x))=wTx+b \log \left( \frac{P(y=1|\mathbf{x})}{1 - P(y=1|\mathbf{x})} \right) = \mathbf{w}^T\mathbf{x} + blog(1P(y=1∣x)P(y=1∣x))=wTx+b
这意味着,逻辑回归假定对数几率与特征呈线性关系。权重wjw_jwj的解释为:保持其他特征不变,特征xjx_jxj每增加一个单位,对数几率增加wjw_jwj,即几率乘以ewje^{w_j}ewj[1]。

8.2.2 参数估计:最大似然估计与梯度下降

逻辑回归模型的参数θ=(w,b)\boldsymbol{\theta} = (\mathbf{w}, b)θ=(w,b)通过最大似然估计(MLE)来学习。

8.2.2.1 似然函数

对于单个样本(xi,yi)(\mathbf{x}_i, y_i)(xi,y

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 18:36:29

7.3 模型评估方法论:训练集、验证集、测试集划分策略

7.3 模型评估方法论:训练集、验证集、测试集划分策略 模型评估是机器学习工作流程中的关键环节,其目的是客观、准确地估计一个模型在未知数据上的泛化性能。一个严谨的评估方法论的核心在于数据集的划分策略,其根本目标是模拟模型部署后面对全新数据时的表现,并防止因信息…

作者头像 李华
网站建设 2026/4/20 8:12:08

【毕业设计】SpringBoot+Vue+MySQL 手机销售网站平台源码+数据库+论文+部署文档

摘要 随着移动互联网的普及和电子商务的快速发展,手机销售行业正经历着前所未有的变革。传统的线下销售模式已无法满足消费者对便捷、高效购物体验的需求,线上手机销售平台逐渐成为主流。手机作为现代人生活中不可或缺的智能设备,其市场需求持…

作者头像 李华
网站建设 2026/4/20 10:29:45

LLM - Prompt Engineering 构建工业级 LLM Agent 的六维结构化框架

文章目录Pre引言:从 Chat 到 Engineering一、 Role(角色):不仅是身份,更是领域锚定1.1 明确专业领域 (Domain Specificity)1.2 单一职责原则 (SRP)1.3 避免角色冲突二、 Context(上下文)&#x…

作者头像 李华
网站建设 2026/4/24 18:18:58

【2025最新】基于SpringBoot+Vue的美食信息推荐系统管理系统源码+MyBatis+MySQL

摘要 随着互联网技术的快速发展和人们生活水平的不断提高,美食文化逐渐成为人们日常生活中不可或缺的一部分。美食推荐系统应运而生,旨在为用户提供个性化的美食信息推荐,帮助用户更高效地发现符合自身口味和需求的餐饮选择。传统的美食信息…

作者头像 李华