广义线性模型
1. 指数组分布
http://www.csuldw.com/2016/01/12/2016-01-12-Newton-Method/
* 指数族分布的定义
- 可以表示为指数形式的概率分布
是自然参数,当a,b,T 固定,则为的参数函数族
1.1 二项分布的推导
- 伯努利分布是对0/1建模,对于
有:
=>推导指数分布族的形式
=>
=>
的形式和logstic函数一样,logistic函数的概率就是伯努利分布
=>结论
伯努利指数分布族中,和满足logistic函数
* 连接函数:
1.2 正态分布
=>
高斯分布指数族函数中,和参数相等
* 连接函数:
* 其他分布
2. 广义线性模型(GLM)
指数分布族函数,以不同的映射函数和其概率分布函数中的参数发生联系,从而得到不同的模型,广义线性模型将指数分布族中的所有成员作为线性模型的扩展,通过各种连接函数,将线性函数映射到不同的空间,扩展了线性模型的规模
2.1 连接函数(单调可导)
- 原始的线性方程(描述平均意义下y和x的统计规律)
广义线性模型:
满足连接函数
正态分布:恒等:
logit模型:
对数字:泊松模型:
3. GLM的碎碎念
- 广义线性模型是线性模型的推广
- 随机误差不一定是服从正态分布
- 引入连接函数
- 逻辑回归就是,使用连接函数, 服从二项分布;
- 采用正态分布得到,最小二乘的线性模型;
- 使用伯努利分布得到,逻辑回归模型
* 连接函数
- 因变量和自变量通过连接函数产生影响
- 连接函数; 单调,可导