线性回归模型公式:g(x)=ω0+ω1x1
逻辑回归模型公式:f(x)=1+e−g(x)1(包含了线性回归)
在x条件下y=1发生的概率为:P(y=1∣x)=π(x)=1+e−g(x)1
在x条件下y=1不发生的概率为:P(y=0∣x)=1−P(y=1∣x)=1−1+e−g(x)1=1+e−g(x)e−g(x)=1+eg(x)1
事件发生与不发生的概率比(事件发生比odds)为:P(y=0∣x)P(y=1∣x)=1−pp=eg(x)
接下来将会对这个odds进行操作。
设非线性函数g(x)=w0+w1x1+…+wnxn
对odds取对数得到:ln(1−pp)=g(x)=w0+w1x1+…+wnxn
假设有m个相互独立的观测样本,观测值分别为y1,y2,…,ym,设pi=P(yi=1∣xi)为给定条件下得到yi=1的概率,则yi=0的概率为P(yi=0∣xi)=1−pi,所以得到一个观测值的概率为:P(yi)=(1−pi)yi−1piyi=piyi(1−pi)1−yi。因为各个观测样本相互独子,那么它们的联合分布为各边缘分布的乘积。
得到似然函数为:L(w)=∏i=1m(π(xi))yi(1−π(xi))1−yi
这里似然函数的作用就是,求在所有事件发生的odds概率乘积为最大值下的参数值w(w0,w1,…,wn),n+1个参数。
对函数L(w)取对数得到:lnL(w)=∑i=1m(yiln[π(xi)]+(1−yi)ln[1−π(xi)])
接下来分别对这些w参数求导,得到n+1个方程。接下来以对参数wk求导为例:(yiln[π(xi)]+(1−yi)ln[1−π(xi)])′
=π(xi)yi⋅[π(xi)]′+(1−yi)⋅1−π(xi)−[π(xi)]′)′
=[π(xi)yi−1−π(xi)1−yi]⋅[π(xi)]′
=(yi−π(xi))g′(x)
=xik[yi−π(xi)]
得出:∂wk∂lnL(wk)=∑i=1mxik[yi−π(xi)]=0,当梯度为0时可使得函数值最大,至此求得最优wk 。