分类准确度的问题
对于极度偏科(Skewed Data)的数据,只使用分类准确度是远远不够的
混淆矩阵 Confusion Matrix
例子说明:
现在有10000个人的测试数据,0代表不患病,1代表患病。
9978表示
在10000个人当中有9978个人,本身没有患病,机器学习算法预测也没有患病。
12表示
在10000个人当中有12个人,本身没有患病,机器学习算法却预测为患病
2表示
在10000个人当中有2个人,本身就患病,机器学习算法却预测为没有患病
8表示
在10000个人当中有8个人,本人就患病,机器学习算法也预测为患病