阅读(221) 赞(16)

AI人工智能分类器的性能

2020-09-23 15:03:01 更新

在实现机器学习算法之后，我们需要找出模型的有效性。衡量有效性的标准可以基于数据集和度量标准。为了评估不同的机器学习算法，我们可以使用不同的性能指标。例如，假设使用分类器来区分不同对象的图像，可以使用分类性能指标，如平均准确率，AUC 等。从某种意义上说，我们选择评估机器学习模型的指标是非常重要的，因为指标的选择会影响机器学习算法的性能如何被测量和比较。以下是一些指标 -

混乱矩阵

基本上它用于输出可以是两种或更多种类的分类问题。这是衡量分类器性能的最简单方法。混淆矩阵基本上是一个包含两个维度即“实际”和“预测”的表格。这两个维度都有“真正的正面(TP)”，“真正的负面(TN)”，“错误的正面(FP)”，“错误的否定(FN)”。

在上面的混淆矩阵中，1表示正类，0表示负类。以下是与混淆矩阵相关的术语 -

真正 - 当实际的数据点类别为 1 并且预测也为 1 时，TP 就是这种情况。
真负 - 当数据点的实际类别为 0 并且预测也为 0 时，TN 就是这种情况。
假正 - 当实际的数据点类别为 0 并且预测也为 1 时，FP 就是这种情况。
假负 - FN 是数据点的实际类别为 1 且预测也为 0的情况。

准确性

混淆矩阵本身并不是一个性能指标，但几乎所有的性能矩阵均基于混淆矩阵。其中之一是准确性。在分类问题中，它可能被定义为由模型对各种预测所做的正确预测的数量。计算准确度的公式如下 -

精确它主要用于文件检索。它可能被定义为返回的文件有多少是正确的。以下是计算精度的公式 -

召回或灵敏度 它可能被定义为模型返回的正数有多少。以下是计算模型召回/灵敏度的公式 -

特异性 它可以定义为模型返回的负数有多少。这与召回完全相反。以下是计算模型特异性的公式 -

← AI人工智能随机森林分类器

AI人工智能分类失衡问题 →