在上一章,我们讨论了简单的线性回归、多元线性回归和多项式线性回归,这些模型都是泛线性模型,它是一种比普通线性回归需要更少假设的灵活框架的特殊形式。在本章中,我们将讨论其中一些假设,这些假设和另一种称为逻辑回归的泛线性模型的特殊形式相关联。
与前面我们讨论的回归模型不同,逻辑回归常用于分类任务。下面让我们来看一下👀

一、逻辑回归

普通的线性回归假设响应变量符合正态分布。正态分布或者高斯分布,是描述任何一个观测值对应一个位于两个实数之间值的概率的函数。正态分布数据是对称的,一半值大于均值,另一半数据小于均值。正态分布数据的均值、中位数和众数也相等。说到这里,可能理解起来不是那么直观,我们举几个身边正态分布的例子,比如,人的身高是正态分布,大多数人有平均身高,少数人长得高,少数人长得矮。
在逻辑回归中,响应变量描述了结果是正向情况的概率。如果响应变量等于或者超出了一个区分阈值,则被预测为正向类,否则将被预测为负向类。响应变量使用逻辑函数建模为一个特征的线性组合函数。公式如下,逻辑函数的值总是位于0~1之间。
一、逻辑回归进行二分类 - 图1
让我们画图来看一下,逻辑函数在[-6, 6]区间的图如下(红色曲线)
Figure_1.png
对于逻辑函数,t等于解释变量的线性组合,让我们把式子分解一下,如下
一、逻辑回归进行二分类 - 图3