保序回归:拯救你的校准曲线(APP)

保序回归:拯救你的校准曲线(APP)

校准曲线之所以是评价模型效能的重要指标是因为,校准曲线衡量模型预测概率与实际发生概率之间的一致性,它可以帮助我们了解模型的预测结果是否可信。一个理想的模型应该能够准确地预测实际发生概率。在这种情况下,校准曲线将是一条直线,其斜率为 1。但是,在现实世界中,模型的预测往往会存在偏差。当模型的预测概率高于实际发生概率时,我们称之为过度校准;当模型的预测概率低于实际发生概率时,我们称之为欠校准。

线性的逻辑回归模型往往具有较好的校准曲线,但是模型区分能力(ROC曲线下面积)较弱,多数情况下,我们为了获得更好的模型区分能力,而舍弃线性的逻辑回归模型而采用随机森林等树形模型,但是这时候会发现校准曲线变得不佳。是不是好的模型区分能力和校准度不能同时兼得呢?采用概率校准技术可以弥补这一点。

这里说的概率校准是在模型得出预测概率之后对概率进行修正的方法,属于后处理技术,保序回归(isotonic regression)是其中常用的一种。当使用预测模型获得预测概率之后,可以使用保序回归对预测概率进行校正,得到的预测概率作为最终的预测概率,然后进行DCA分析或者预测概率相关的分析,包括校准曲线的绘制,很大程度导上会改善模型的校准度。保序回归适用于二分类、多分类和有序多分类的任务。机器学习和深度学习的概率校正都可以使用。

因为许多人对保序回归等后处理技术不熟悉,所以设计了这个APP让大家能够直观感受保序回归的作用。在APP内输入真是的label和预测的概率值,并勾选isotonic regression 即可对比概率校正前后的校准曲线。

APP地址:https://liuyp2080.shinyapps.io/save_your_probability/

相关推荐
升鲜宝供应链及收银系统源代码服务34 分钟前
升鲜宝AI助手功能使用流程与数据库关联操作文档(三)---升鲜宝生鲜配送供应链管理系统源代码
人工智能·生鲜配送系统·生鲜物流线路规划·生鲜电商订单系统·生鲜供应链系统·生鲜系统架构设计·生鲜配送系统源代码服务出售
189228048611 小时前
NV086固态MT29F16T08EWLCHD8-TES:C
大数据·服务器·人工智能·科技·缓存
古月开发1 小时前
本地化 AI 论文查重与润色工具部署指南
人工智能·自动化
多年小白1 小时前
【周末消息复盘】2026年6月5日-7日——纳指暴跌1100点,明日A股如何开盘
人工智能·科技股
Sirius Wu1 小时前
Agent Skill能力建设
人工智能·深度学习·机器学习·ai·语言模型·aigc
腾讯云开发者1 小时前
从Agent浪潮到组织变革,共探OpenClaw 时代的安全边界与企业进化
人工智能
弱冠少年1 小时前
anthropics skill-creator入门
人工智能
攻城狮7号1 小时前
ChatGPT 全新 Dreaming 记忆系统详解
人工智能·chatgpt·dreaming 记忆系统·dreaming v3
m0_571186602 小时前
第四十九周周报
人工智能