逻辑回归学习笔记

逻辑回归理论

逻辑回归是监督学习最主要的类型之一。它的标签是离散的

分类还分为二分类和多分类。输入的特征变量可以是连续或离散的，输出变量（标签）是离散的，多分类问题可以转换为二分类问题，二分类只需要一次，把一个类别分出来，剩下!的就是另外一类

多分类问题可以转化为多次二分类问题，第一次分A和非A,第二次在非A里面分B和非B

关于二分类，我们的模型理想状态下定义为输入x，输出f(x)>0，则认为类别1,否则类别2,它的损失函数可以通过统计预测值和真实值不等的次数来评估，下面的δ(fxn)≠y^n\delta(fx^n)\neq \hat{y}^nδ(fxn)=y^n在满足条件时为1,不满足为0

但这里这个L(f)我们没法用连续的微分方式去求解最优值，也有其他方式如感知机，svm向量机的方式去求解找到最优的function

下面按李宏毅老师的方法，逐步去定义L(f)

假设知道了从B1中取出蓝色求的概率和从B2中取出绿色球的概率，那么取出蓝色球，它是来自于B1的概率即从B1取的概率P(B1) 乘以B1中取出蓝色球的概率P(Blue|B1)再除以总的取出蓝色球的概率P(Blue|B1)P(B1) + P(Blue|B2)P(B2)，P(B1)+P(B2)应等于1，而在分类中，我们正是关注当有一个变量x时，它属于哪一个类别的概率比较大，那么它就最可能划分为哪一类。