模型优化

* 前期流程

  • 数据处理
  • 特征工程
  • 模型选择
  • 交叉验证
  • 寻找最佳超参数

* 模型优化

  • 模型状态
  • 权重分析
  • bad-case分析
  • 模型融合

1.数据处理

* 数据清洗

  • 不可信的样本丢掉
  • 缺省值极多的字段考虑不用

* 数据采样

  • 上/下采样
  • 保证样本均衡

* 特征处理

  • 数值型
  • 类别型
  • 时间类
  • 文本类
  • 统计型
  • 组合特征

* 特征的选择

  • 过滤型(SelectKBest)
  • 包裹型(RFE)
  • 嵌入型(L1正则)

2. 模型的选择


3. 交叉验证


4. 过拟合和欠拟合

* 不同模型状态的处理

* 权重

* bad-case分析


5. 模型融合

results matching ""

    No results matching ""