保序回归:拯救你的校准曲线(APP)

保序回归:拯救你的校准曲线(APP)

校准曲线之所以是评价模型效能的重要指标是因为,校准曲线衡量模型预测概率与实际发生概率之间的一致性,它可以帮助我们了解模型的预测结果是否可信。一个理想的模型应该能够准确地预测实际发生概率。在这种情况下,校准曲线将是一条直线,其斜率为 1。但是,在现实世界中,模型的预测往往会存在偏差。当模型的预测概率高于实际发生概率时,我们称之为过度校准;当模型的预测概率低于实际发生概率时,我们称之为欠校准。

线性的逻辑回归模型往往具有较好的校准曲线,但是模型区分能力(ROC曲线下面积)较弱,多数情况下,我们为了获得更好的模型区分能力,而舍弃线性的逻辑回归模型而采用随机森林等树形模型,但是这时候会发现校准曲线变得不佳。是不是好的模型区分能力和校准度不能同时兼得呢?采用概率校准技术可以弥补这一点。

这里说的概率校准是在模型得出预测概率之后对概率进行修正的方法,属于后处理技术,保序回归(isotonic regression)是其中常用的一种。当使用预测模型获得预测概率之后,可以使用保序回归对预测概率进行校正,得到的预测概率作为最终的预测概率,然后进行DCA分析或者预测概率相关的分析,包括校准曲线的绘制,很大程度导上会改善模型的校准度。保序回归适用于二分类、多分类和有序多分类的任务。机器学习和深度学习的概率校正都可以使用。

因为许多人对保序回归等后处理技术不熟悉,所以设计了这个APP让大家能够直观感受保序回归的作用。在APP内输入真是的label和预测的概率值,并勾选isotonic regression 即可对比概率校正前后的校准曲线。

APP地址:https://liuyp2080.shinyapps.io/save_your_probability/

相关推荐
热爱生活的五柒几秒前
pytorch中数据和模型都要部署在cuda上面
人工智能·pytorch·深度学习
HyperAI超神经2 小时前
【TVM 教程】使用 Tensorize 来利用硬件内联函数
人工智能·深度学习·自然语言处理·tvm·计算机技术·编程开发·编译框架
扫地的小何尚3 小时前
NVIDIA RTX 系统上使用 llama.cpp 加速 LLM
人工智能·aigc·llama·gpu·nvidia·cuda·英伟达
埃菲尔铁塔_CV算法6 小时前
深度学习神经网络创新点方向
人工智能·深度学习·神经网络
艾思科蓝-何老师【H8053】6 小时前
【ACM出版】第四届信号处理与通信技术国际学术会议(SPCT 2024)
人工智能·信号处理·论文发表·香港中文大学
weixin_452600697 小时前
《青牛科技 GC6125:驱动芯片中的璀璨之星,点亮 IPcamera 和云台控制(替代 BU24025/ROHM)》
人工智能·科技·单片机·嵌入式硬件·新能源充电桩·智能充电枪
学术搬运工7 小时前
【珠海科技学院主办,暨南大学协办 | IEEE出版 | EI检索稳定 】2024年健康大数据与智能医疗国际会议(ICHIH 2024)
大数据·图像处理·人工智能·科技·机器学习·自然语言处理
右恩7 小时前
AI大模型重塑软件开发:流程革新与未来展望
人工智能
图片转成excel表格7 小时前
WPS Office Excel 转 PDF 后图片丢失的解决方法
人工智能·科技·深度学习
ApiHug8 小时前
ApiSmart x Qwen2.5-Coder 开源旗舰编程模型媲美 GPT-4o, ApiSmart 实测!
人工智能·spring boot·spring·ai编程·apihug