目标函数: obj=∑i=1nl(yi,y^i(t))+∑i=1tΩ(fi)
其中yi是真实值,y^i(t)是总t棵树的预测值,l是loss function,Ω是正则项,防止过拟合。f是一棵CART树,ft(xi)是输入数据xi后第t棵树的输出值。
y^i(t)与ft(xi)的关系为:
y^i(t)=∑k=1tfk(xi)=y^i(t−1)+ft(xi)
因此,目标函数即可转为:
obj(t)=i=1∑nl(yi,y^i(t))+i=1∑tΩ(fi)=i=1∑nl(yi,y^i(t−1)+ft(xi))+Ω(ft)+constant
泰勒展开公式: f(x+Δx)≃f(x)+f′(x)Δx+21f′′(x)Δx2
将损失函数泰勒展开至二阶:
obj(t)=∑i=1n[l(yi,y^i(t−1))+gift(xi)+21hift2(xi)]+Ω(ft)+constant
其中gi=∂y^(t−1)l(yi,y^(t−1)),hi=∂y^(t−1)2l(yi,y^(t−1))
分别表示对y^i(t−1)求一次与二次偏导。
与泰勒展开式对应来看,其中x为y^i(t−1),Δx为ft(xi)