CICC科普栏目|二元分类模型是什么样子的?从这个视角,更好理解AUC曲线!( 二 )


TPR:在所有正例中 , 有多少被预测为正例的 。
CICC科普栏目|二元分类模型是什么样子的?从这个视角,更好理解AUC曲线!
文章图片
对于我们说的赛马来说 , TPR是假设钱被押注的情况下的赢钱的概率 。 而FPR是在赌钱的情况下赔钱的比率 。 所以 , 我们希望TPR大于FPR 。
FPR:在所有真正的负例中 , 有多少被预测为正例的
假设你的阈值太低 , 比如0.05 。 模型给出的任何概率值都可能高于阈值 , 因此每个实例都被预测为正例 。 在这种情况下 , TPR和FPR都是1 。 类似的当阈值过高(如0.99)时 , 你的模型给出的任何概率分数都可能低于阈值 , 因此每个实例都被预测为负例 。 在这种情况下 , TPR和FPR都等于0 。
CICC科普栏目|二元分类模型是什么样子的?从这个视角,更好理解AUC曲线!
文章图片
所以如果绘制这两个点 , 其中FPR=TPR=1和FPR=TPR=0 , 你会发现这两个点在对角线上 。 注意对角线的方程是FPR=TPR 。 他的含义是 , 如果模型对不同的截止点表现出这样的行为 , 我们可以保证不会因为损失而抵消你所赚的钱 。
CICC科普栏目|二元分类模型是什么样子的?从这个视角,更好理解AUC曲线!
文章图片
为了得到一个比随机模型更好、更接近上帝模型的模型 , 我们希望TPR在大多数截断点上大于FPR 。
为什么呢?因为TPR是可能获胜的总数中的胜率 , 而FPR给出了下注的输钱率 。 对角线上方的区域是TPR大于FPR的区域 。 曲线越向上移动越好 。
最后就是要量化这个概念 , 曲线下的面积是有意义的 。 曲线下的面积越大 , 曲线向上移动的幅度就越大 。 所以当看到TPR和FPR之间的曲线时 ,
CICC科普栏目|二元分类模型是什么样子的?从这个视角,更好理解AUC曲线!
文章图片
你会注意到曲线位于TPR>FPR的区域 。 通过AUC , 你就知道它有多好 。
CICC科普栏目|二元分类模型是什么样子的?从这个视角,更好理解AUC曲线!
文章图片
为什么要在TPR和FPR之间画一条曲线呢?
我们继续用赛马的例子中给出TPR和FPR的含义来解释这一点
CICC科普栏目|二元分类模型是什么样子的?从这个视角,更好理解AUC曲线!
文章图片
橙色的ROC曲线说明了什么?这条曲线通过绘制TPR与FPR在不同截点处的曲线而存在 。 这条曲线表明无论截点是多少 , TPR总是等于1 。
从这一点出发 , 截点用于检查模型的判别质量有多健壮 。 也就是说即使有不同的截点 , 模型给出的TPR值总会高于FPR值 。 具体高出多少呢?
AUC就给出的是给出“多高”的概念 。 因为我们感兴趣的是知道模型有多好?它能更好地区分两个类别(赢/输) , 我们赌赢钱越多 , 赌输钱越少的可能性就越大 。
作者:NumberTheory
本文来源:数学中国
关注公众号了解更多
会员申请请在公众号内回复“个人会员”或“单位会员
欢迎关注中国指挥与控制学会媒体矩阵
CICC官方网站
CICC官方微信公众号
《指挥与控制学报》官网
国际无人系统大会官网
中国指挥控制大会官网
全国兵棋推演大赛
全国空中智能博弈大赛
搜狐号
一点号返回搜狐 , 查看更多
责任编辑: