老师你好,在利用混淆矩阵选择各场景的衡量指标时我比较不能理解各指标的真正含义,那么我们是否可以更加灵活地选择指标?
例如:希望普通邮件(负样本)不要被判断为垃圾邮件(正样本),其中普通邮件就是所有实际为负的样本,因此我们指标分母选择混淆矩阵中的TN+FP,而被判断为垃圾邮件的普通邮件则是FP,所以我们应该关注的指标应该是FP/(TN+FP)。
希望所有的垃圾邮件尽可能地被判断出来,其中所有的垃圾邮件则是所有实际为正的样本,则分母选择FN+TP,而被判断出来的垃圾邮件则是TP,因此分子选择TP,即选择指标TP/(FN+TP).
希望判断为正常的交易(负样本)中尽可能不存在异常交易,其中判断为正常的交易是所有预测为负的样本,则分母选择TN+FN,而预测为正常交易实际是异常交易的则是FN,所以选择指标FN/(TN+FN)。