保序回归:拯救你的校准曲线(APP)

保序回归:拯救你的校准曲线(APP)

校准曲线之所以是评价模型效能的重要指标是因为,校准曲线衡量模型预测概率与实际发生概率之间的一致性,它可以帮助我们了解模型的预测结果是否可信。一个理想的模型应该能够准确地预测实际发生概率。在这种情况下,校准曲线将是一条直线,其斜率为 1。但是,在现实世界中,模型的预测往往会存在偏差。当模型的预测概率高于实际发生概率时,我们称之为过度校准;当模型的预测概率低于实际发生概率时,我们称之为欠校准。

线性的逻辑回归模型往往具有较好的校准曲线,但是模型区分能力(ROC曲线下面积)较弱,多数情况下,我们为了获得更好的模型区分能力,而舍弃线性的逻辑回归模型而采用随机森林等树形模型,但是这时候会发现校准曲线变得不佳。是不是好的模型区分能力和校准度不能同时兼得呢?采用概率校准技术可以弥补这一点。

这里说的概率校准是在模型得出预测概率之后对概率进行修正的方法,属于后处理技术,保序回归(isotonic regression)是其中常用的一种。当使用预测模型获得预测概率之后,可以使用保序回归对预测概率进行校正,得到的预测概率作为最终的预测概率,然后进行DCA分析或者预测概率相关的分析,包括校准曲线的绘制,很大程度导上会改善模型的校准度。保序回归适用于二分类、多分类和有序多分类的任务。机器学习和深度学习的概率校正都可以使用。

因为许多人对保序回归等后处理技术不熟悉,所以设计了这个APP让大家能够直观感受保序回归的作用。在APP内输入真是的label和预测的概率值,并勾选isotonic regression 即可对比概率校正前后的校准曲线。

APP地址:https://liuyp2080.shinyapps.io/save_your_probability/

相关推荐
云烟成雨TD4 分钟前
Spring AI Alibaba 1.x 系列【13】 检查点 (Checkpoint) 机制及各类持久化实现
java·人工智能·spring
AINative软件工程7 分钟前
我给自己的MCP Server做了一次渗透测试,结果吓出一身冷汗
人工智能
水如烟10 分钟前
孤能子视角:创新–幻觉“三线模型“,豆包的“飞“
人工智能
火山引擎开发者社区14 分钟前
ArkClaw 养虾省钱攻略,这 10% 的返利你还不知道?
人工智能
跨境卫士苏苏20 分钟前
跨境电商成本持续上升卖家利润空间如何守住
大数据·人工智能·跨境电商·亚马逊·跨境
IT大师兄吖21 分钟前
SAM3 提示词 视频分割 ComfyUI 懒人整合包
人工智能
AI、少年郎33 分钟前
MiniMind第 3 篇:底层原理|Decoder-Only 小模型核心:RMSNorm/SwiGLU/RoPE 极简吃透
人工智能·ai编程·大模型训练·大模型微调·大模型原理
雾喔34 分钟前
【学习笔记3】AI 工程实战
人工智能·笔记·学习
火山引擎开发者社区38 分钟前
玩转 ArkClaw:用自动修复打造稳定可靠的 AI 助理
人工智能
guslegend44 分钟前
第10节:设计高效混合检索架构,提升召回精度
人工智能·架构·大模型·rag