论文部分内容阅读
在数据挖掘中,我们经常寻求建模的现象是离散而不是连续的。也就是模型的被解释变量是定性的而不是定量的。比如,二元变量:买房,不买房;定类变量:对某个候选人的态度,赞成,反对和弃权;定序变量:信用等级1,2,3,4,5。此时要求模型预测的是将某个个案分到某个类的概率,概率越大的事情越可能发生,进而预测可能的类别。对此类问题在数据挖掘中使用logistic回归显示出强大的处理能力。