模型优化
* 前期流程
- 数据处理
- 特征工程
- 模型选择
- 交叉验证
- 寻找最佳超参数
* 模型优化
- 模型状态
- 权重分析
- bad-case分析
- 模型融合
1.数据处理
* 数据清洗
- 不可信的样本丢掉
- 缺省值极多的字段考虑不用
* 数据采样
- 上/下采样
- 保证样本均衡
* 特征处理
- 数值型
- 类别型
- 时间类
- 文本类
- 统计型
- 组合特征
* 特征的选择
- 过滤型(SelectKBest)
- 包裹型(RFE)
- 嵌入型(L1正则)
2. 模型的选择

3. 交叉验证

4. 过拟合和欠拟合

* 不同模型状态的处理

* 权重

* bad-case分析

5. 模型融合

