《机器学习实战》笔记(二):决策树

你看到的是非授权版本!爬虫凶猛,请尊重知识产权!

转载请注明出处:http://conanwhf.github.io/2018/02/22/decisionTree/

访问原文「《机器学习实战》笔记(二):决策树」获取最佳阅读体验并参与讨论

CH03:决策树

算法

优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。
缺点:可能会产生过度匹配问题。
适用数据类型:数值型和标称型。

非大师范德萨

实践

这一章的实践内容主要是手写数字识别。程序上的事情没什么好说的,我的主要改动就是把作者的numpy改成了pandas,并且将分类结果存在了dataframe同一个表中而不是单独分开,代码在此

杂谈