从这篇开始,我将介绍分类问题,主要介绍决策树算法.朴素贝叶斯.支持向量机.BP神经网络. 懒惰学习算法.随机森林与自适应增强算法.分类模型选择和结果评价.总共7篇,欢迎关注和交流. 这篇先介绍分类问题的一些基本知识,然后主要讲述决策树算法的原理.实现,最后利用决策树算 法做一个泰坦尼克号船员生存预测应用. 一.分类基本介绍 物以类聚,人以群分,分类问题只古以来就出现我们的生活中.分类是数据挖掘中一个重要的分支 ,在各方面都有着广泛的应用,如医学疾病判别.垃圾邮件过滤.垃圾短信拦截.客户分析等等.