决策树

决策树的构建(最大决策深度=1)

只分2类,分类效果不好,不到 70%。

max_depth=3

max_depth=5

决策树的可视化演示

pip3 install graphviz -i https://pypi.douban.com/simple/

max_depth与打分曲线

随机森林

随机森林是把不同的几棵决策树打包到一起,每棵树的参数都不相同,然后我们取每棵树预测结果的平均值。

继续使用 wine 数据集

n_estimator与打分曲线

真实数据 - 预测收入

读取数据

数据预处理: 分类变量 to 哑变量

建模