保序回归:拯救你的校准曲线(APP)

保序回归:拯救你的校准曲线(APP)

校准曲线之所以是评价模型效能的重要指标是因为,校准曲线衡量模型预测概率与实际发生概率之间的一致性,它可以帮助我们了解模型的预测结果是否可信。一个理想的模型应该能够准确地预测实际发生概率。在这种情况下,校准曲线将是一条直线,其斜率为 1。但是,在现实世界中,模型的预测往往会存在偏差。当模型的预测概率高于实际发生概率时,我们称之为过度校准;当模型的预测概率低于实际发生概率时,我们称之为欠校准。

线性的逻辑回归模型往往具有较好的校准曲线,但是模型区分能力(ROC曲线下面积)较弱,多数情况下,我们为了获得更好的模型区分能力,而舍弃线性的逻辑回归模型而采用随机森林等树形模型,但是这时候会发现校准曲线变得不佳。是不是好的模型区分能力和校准度不能同时兼得呢?采用概率校准技术可以弥补这一点。

这里说的概率校准是在模型得出预测概率之后对概率进行修正的方法,属于后处理技术,保序回归(isotonic regression)是其中常用的一种。当使用预测模型获得预测概率之后,可以使用保序回归对预测概率进行校正,得到的预测概率作为最终的预测概率,然后进行DCA分析或者预测概率相关的分析,包括校准曲线的绘制,很大程度导上会改善模型的校准度。保序回归适用于二分类、多分类和有序多分类的任务。机器学习和深度学习的概率校正都可以使用。

因为许多人对保序回归等后处理技术不熟悉,所以设计了这个APP让大家能够直观感受保序回归的作用。在APP内输入真是的label和预测的概率值,并勾选isotonic regression 即可对比概率校正前后的校准曲线。

APP地址:https://liuyp2080.shinyapps.io/save_your_probability/

相关推荐
与芯同行12 分钟前
单声道音频Codec在语音交互产品中的工程设计要点与常见问题分析
人工智能·语音识别·ai语音对话芯片·tp9311·天源中芯tpower
citi14 分钟前
OpenViking 源代码编译指南
人工智能·context
MediaTea25 分钟前
Scikit-learn:数据集
人工智能·python·机器学习·scikit-learn
sali-tec31 分钟前
C# 基于OpenCv的视觉工作流-章52-交点查找
图像处理·人工智能·opencv·算法·计算机视觉
冬奇Lab35 分钟前
一天一个开源项目(第81篇):YC 总裁亲自写代码,把自己的大脑开源了
人工智能·开源·资讯
冬奇Lab38 分钟前
SubAgent 原理深度解析:AI 系统如何通过委托实现专业化分工
人工智能·agent·claude
ZhengEnCi1 小时前
01c-循环神经网络RNN详解
人工智能·深度学习
仙女修炼史1 小时前
CNN的捷径学习Shortcut Learning in Deep Neural Networks
人工智能·学习·cnn
企业架构师老王1 小时前
数据安全优先:企业级智能体私有化部署完整方案与最佳实践
人工智能·ai
北漂Zachary1 小时前
AI训练硬件选型:GPU算力梯队全解析
人工智能·gpu算力