关于精准率和召回率的平衡点似乎都是在0左右-慕课网

1回答

liuyubobobo 2023-07-21 01:17:14

这个图的交界点明显是在 -3 到 -4 之间，而不是 0 呀。

==========

逻辑回归分两步：

1）计算每个数据点是不同类别的概率；

2）根据这个概率值，判断具体是哪个类别。（默认使用 p=0.5 作为便捷，对应 theta * x = 0 作为边界。）

1）步和决策边界没有关系。我们是先计算出 1），然后规定了决策边界的位置，然后才能得到 2）

使用 precision recall 曲线，则是在计算完 1）以后，实验室用不同的决策边界，看哪个决策边界更好。这个过程决策边界 = 0 没有参与运算（而是我们反过来看决策边界取谁更好。）

继续加油！：）

0 回复有任何疑惑可以回复我~

收起回答

提问者小白一只726 #1

```
thresholds = np.arange(np.min(decision_scores), np.max(decision_scores), 0.1)
for threshold in thresholds:
    y_test_predict = np.array(decision_scores>=threshold, dtype=int)
    precision_scores.append(precision_score(y_test, y_test_predict))
    recall_scores.append(recall_score(y_test, y_test_predict))

plt.plot(thresholds, precision_scores)
plt.plot(thresholds, recall_scores)
plt.show()
```

其中的decision_scores是通过log_reg.decision_function(X_test)得来的，而log_reg是已经事先用训练数据集训练过得到了相应的theta值，在其训练过程中使用的决策边界为0。我们之后只是用已经训练好的模型再去预测测试数据集得到预测数据集测概率值数组，根据这个概率值使用不同的决策边界来看哪个决策便捷更好。

我的疑惑点就在于我们对后续数据做预测得到概率值之前，已经用决策边界为0训练了模型，之后所有的预测是否都已经受到了训练阶段默认决策边界为0的影响。

回复有任何疑惑可以回复我~ 2023-08-07 18:18:36

关于精准率和召回率的平衡点似乎都是在0左右

正在回答回答被采纳积分+3

1回答

相似问题

请选择置顶位置

本课精华内容

PCA降维的把握和依据分别是什么？比如把一个近似直线分布的二维点数据降维成直线？

关于线性回归中归一化处理和不对归一化处理的问题

数据归一化为什么有用？对归一化无法直观理解

如何判断欠拟合是因为模型选择错误还是超参数选择错误？

学好具体算法和机器学习的实际应用之间有哪些距离？

关于 XGBoost

关于机器学习不同的指标

其他算法的决策边界

在三维数据上的 PCA

关于回归和分类

热搜

最近搜索清空