chapter 11 模型评估与优化

使用交叉验证进行模型评估

除了之前的 train_test_split 函数外,还有更自动化的拆分测试工具。就是交叉验证法(Cross Validation)。

K折叠交叉验证法(k-fold cross validation):

随机拆分交叉验证法 shuffle-split cross validation

随机拆分法(shuffle-split corss-validation)

挨个儿试试法( leave-one-out )

使用网络搜索优化模型参数

除了逐个尝试看打分外,还可以使用网络搜索法一次性找到更优的参数设置。

简单网络搜索

与交叉验证结合的网络搜索

分类模型的可信度评估

分类模型中的预测准确率

分类模型中的决定系数

决定系数只返回一个值,正数代表属于分类1,负数代表属于分类2.

由于高斯朴素贝叶斯没有 decision_function,我们换成 支持向量机SVC 算法来进行建模。

本例汇总使用的是二元分类任务,但是 predict_proba 和 decision_function 同样适用于多元分类任务。

其它模型评价指标

之前一直使用的 .score(),

R^2 = 1 - 求和(y-y_hat)^2/求和(y-y_bar)^2

其它指标

这些指标经常和 网格搜索算法 配合使用,选择合适的模型和参数。