在我们详细讨论不同评分标准之前,先绘制一个所谓的混淆矩阵(confusion matrix):即展示学习算法性能的一种矩阵。混淆矩阵是一个简单的方阵,用于展示一个分类器预测结果——真正(true positive)、真负(false negative)、假正(false positive)及假负(false negative)——的数量,如下图所示:
虽然这指标的数据可以通过人工比较真实类标与预测类标来获得,不过scikit-learn提供了一个方便使用的confusion_matrix函数,其使用方法如下:
在执行上述代码后,返回的数组提供了分类器在测试数据集上生成的不同错误信息,我们可以使用matplotlib中的matshow函数将它们表示为上图所示的混淆矩阵形式:
下图所示的混淆矩阵使得预测结果更易于解释:
在本例中,假定类别1(恶性)为正类,模型正确地预测了71个属于类别0的样本(真负),以及40个属于类别1的样本(真正)。不过,我们的模型也错误地将两个属于类别0的样本划分到了类别1(假负),另外还将一个恶性肿瘤误判为良性的(假正)。在下一节中,我们将使用这些信息计算不同的误差度量。