一:类别不平衡问题,通俗来讲就是正负样本分布不平衡,假如,正样本较少,负样本较多。 对于一般的线性回归问题,预测值y>0.5时判为正例。 解决类别不平衡的问题的三种解决办法: ①对负样本进行欠采样,即去除一些负样本,使正负样本分布均衡。主要的代表算法是EasyEnsemble.将负样本划分为不同的集合供不同的学习器使用,这样保证了欠采样不缺失重要的信息。 ②对正样本进行过采样。主要的算法是S...