0%

逻辑回归介绍

线性回归模型公式:g(x)=ω0+ω1x1g(x)=\omega_{0}+\omega_{1} x_{1}

逻辑回归模型公式:f(x)=11+eg(x)f(x)=\frac{1}{1+e^{-g(x)}}(包含了线性回归)

xx条件下y=1y=1发生的概率为:P(y=1x)=π(x)=11+eg(x)P(y=1 | x)=\pi(x)=\frac{1}{1+e^{-g(x)}}

xx条件下y=1y = 1不发生的概率为:P(y=0x)=1P(y=1x)=111+eg(x)=eg(x)1+eg(x)=11+eg(x)P(y=0 | x)=1-P(y=1 | x)=1-\frac{1}{1+e^{-g(x)}}=\frac{e^{-g(x)}}{1+e^{-g(x)}}=\frac{1}{1+e^{g(x)}}

事件发生与不发生的概率比(事件发生比odds)为:P(y=1x)P(y=0x)=p1p=eg(x)\frac{P(y=1 | x)}{P(y=0 | x)}=\frac{p}{1-p}=e^{g(x)}

接下来将会对这个odds进行操作。

设非线性函数g(x)=w0+w1x1++wnxng(x)=w_{0}+w_{1} x_{1}+\ldots+w_{n} x_{n}

对odds取对数得到:ln(p1p)=g(x)=w0+w1x1++wnxn\ln \left(\frac{p}{1-p}\right)=g(x)=w_{0}+w_{1} x_{1}+\ldots+w_{n} x_{n}

假设有m个相互独立的观测样本,观测值分别为y1,y2,,ymy_{1}, y_{2}, \dots, y_{m},设pi=P(yi=1xi)p_{i}=P\left(y_{i}=1 | x_{i}\right)为给定条件下得到yi=1y_{i}=1的概率,则yi=0y_{i}=0的概率为P(yi=0xi)=1piP\left(y_{i}=0 | x_{i}\right)=1-p_{i},所以得到一个观测值的概率为:P(yi)=piyi(1pi)yi1=piyi(1pi)1yiP\left(y_{i}\right)=\frac{p_{i}^{y_{i}}}{\left(1-p_{i}\right)^{y_{i}-1}}=p_{i}^{y_{i}}\left(1-p_{i}\right)^{1-y_{i}}。因为各个观测样本相互独子,那么它们的联合分布为各边缘分布的乘积。

得到似然函数为:L(w)=i=1m(π(xi))yi(1π(xi))1yiL(w)=\prod_{i=1}^{m}\left(\pi\left(x_{i}\right)\right)^{y_{i}}\left(1-\pi\left(x_{i}\right)\right)^{1-y_{i}}

这里似然函数的作用就是,求在所有事件发生的odds概率乘积为最大值下的参数值w(w0,w1,,wn)w\left(w_{0}, w_{1}, \dots, w_{n}\right),n+1个参数。

对函数L(w)L(w)取对数得到:lnL(w)=i=1m(yiln[π(xi)]+(1yi)ln[1π(xi)])\ln L(w)=\sum_{i=1}^{m}\left(y_{i} \ln \left[\pi\left(x_{i}\right)\right]+\left(1-y_{i}\right) \ln \left[1-\pi\left(x_{i}\right)\right]\right)

接下来分别对这些ww参数求导,得到n+1个方程。接下来以对参数wkw_k求导为例:(yiln[π(xi)]+(1yi)ln[1π(xi)])\left(y_{i} \ln \left[\pi\left(x_{i}\right)\right]+\left(1-y_{i}\right) \ln \left[1-\pi\left(x_{i}\right)\right]\right)^{\prime}
=yiπ(xi)[π(xi)]+(1yi)[π(xi)]1π(xi))=\frac{y_{i}}{\pi\left(x_{i}\right)} \cdot\left[\pi\left(x_{i}\right)\right]^{\prime}+\left(1-y_{i}\right) \cdot \frac{-\left[\pi\left(x_{i}\right)\right]^{\prime}}{1-\pi\left(x_{i}\right)} )^{\prime}
=[yiπ(xi)1yi1π(xi)][π(xi)]=\left[\frac{y_{i}}{\pi\left(x_{i}\right)}-\frac{1-y_{i}}{1-\pi\left(x_{i}\right)}\right] \cdot\left[\pi\left(x_{i}\right)\right]^{\prime}
=(yiπ(xi))g(x)=\left(y_{i}-\pi\left(x_{i}\right)\right) g^{\prime}(x)
=xik[yiπ(xi)]=x_{i k}\left[y_{i}-\pi\left(x_{i}\right)\right]

得出:lnL(wk)wk=i=1mxik[yiπ(xi)]=0\frac{\partial \ln L\left(w_{k}\right)}{\partial w_{k}}=\sum_{i=1}^{m} x_{i k}\left[y_{i}-\pi\left(x_{i}\right)\right]=0,当梯度为0时可使得函数值最大,至此求得最优wkw_k

-------------本文结束感谢您的阅读-------------

欢迎关注我的其它发布渠道