本文摘自php中文网,作者零到壹度,侵删。
这篇文章介绍的内容是详解分类评价指标和回归评价指标以及Python代码实现,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下。
1、概念
性能度量(评价)指标,主分为两大类:
1)分类评价指标(classification),主要分析,离散的,整数的。其具体指标包括accuracy(准确率),precision(精确率),recall(召回率),F值,P-R曲线,ROC曲线和AUC。
2)回归评价指标(regression),主要分析整数和实数之间的关系。其具体指标包括可释方差得分(explianed_variance_score),平均绝对误差MAE(mean_absolute_error),均方误差MSE(mean-squared_error),均方根差RMSE,交叉熵lloss(Log loss,cross-entropy loss),R方值(确定系数,r2_score)。
1.1、前提
假设只有两类-正类(positive)和负类(negative),通常以关注的类为正类,其他类为负类(故多类问题亦可归纳为两类)
混淆矩阵(Confusion matrix)如下
实际类别 | 预测类别 | |||
正 | 负 | 总结 | ||
正 | TP | FN | P(实际为正) | |
负 | FP | TN | N(实际为负) |
表中AB模式:第一个表示预测结果的对错,第二个表示预测的类别。如TP表示,True Positive,即正确的预测为正类;FN表示,False Negative,即错误的预测为了负类。
2、评价指标(性能度量)
2.1、分类评价指标
2.1.1 值指标-Accuracy、Precision、Recall、F值
度量 | Accuracy(准确率) | Precision(精确率) | Recall(召回率) | F值 |
定义 | 正确分类的样本数与总样本数之比(预测为垃圾短信中真正的垃圾短信的比例) | 判定为正例中真正正例数与判定为正例数之比(所有真的垃圾短信被分类求正确找出来的比例) | 被正确判定为正例数与总正例数之比 | 准确率与召回率的调和平均F-score |
表示 | accuracy= | precision= | recall= | F - score = |
相关阅读 >>
Python结合imagemagick实现多张图片合并为一个pdf文件的方法
更多相关阅读请进入《Python》频道 >>

Python编程 从入门到实践 第2版
python入门书籍,非常畅销,超高好评,python官方公认好书。