
01
NHANES指标------NPAR
****定义:****中性粒细胞百分比与白蛋白比值(****NPAR)****是衡量中性粒细胞百分比与血清白蛋白水平之比的血液生化指标,用于评估患者炎症状态、感染和营养状况的指标。
计算方法:
NPAR = 中性粒细胞百分比(占白细胞总数)(%)× 100/白蛋白(g/dL)。
结果含义:
NPAR得分越高,通常表明炎症越严重。这是因为较高的NPAR反映了中性粒细胞百分比的增加和/或血清白蛋白水平的降低,这两者都是体内炎症反应加剧的指标。
02
论文解读
2025年6月5日,厦门大学学者用NHANES数据库,在期刊《International Journal of Surgery》 (医学二区,IF=12.5) 发表了一篇题为:"Associations of NPAR index with breast cancer incidence and mortality based on the National Health and Nutrition Examination Survey (NHANES) 2001-2018: a cross-sectional study"的研究论文。
研究采用横断面设计结合生存分析及机器学习技术,旨在探讨NPAR与乳腺癌发病率和死亡率的关系,并评估其作为生物标志物的潜力。

本公号回复**" 原文"** 即可获得文献PDF等资料
研究背景
代谢功能障碍相关脂肪性肝病 (MASLD) 与胰岛素抵抗 (IR) 密切相关。但不同IR替代指标在预测MASLD患者预后中的价值尚不明确.
研究方法
研究团队使用了美国国家健康与营养调查(NHANES)2001-2018年的数据,经过纳排,最终纳入了13,540名女性参与者 ,其中3 31名 有乳腺癌病史。

图1 参与者的筛选流程
基于上述数据,研究分析女性人群中NPAR水平与乳腺癌患病史(代表发病率)以及全因和特定原因死亡率的关联。通过多变量调整模型控制混杂因素,并利用RCS曲线分析剂量反应关系。
此外,还进一步运用多种机器学习(ML)算法构建乳腺癌诊断预测模型,以探索NPAR在临床风险分层中的应用价值。
主要研究结果
研究发现,NPAR水平与乳腺癌风险呈线性正相关。具体而言:NPAR每增加1单位,乳腺癌风险上升6%,最高四分位数组(Q4)风险增加70%。

表1 NPAR与乳腺癌风险关联的多变量Logistic回归模型
模型1:未调整;
模型2:调整了年龄、人种和BMI;
模型3:模型2+调整了教育程度、婚姻状况、吸烟状况、总胆固醇、高血压、心力衰竭、冠心病、心绞痛、心脏病发作、中风、DM和激素使用
NPAR水平升高也显著增加参与者的全因及心血管疾病死亡率(aHR=1.17)。并且,在总人群和乳腺癌患者中,NPAR水平与全因死亡率呈非线性正相关。

表2 NPAR与全因死亡率关联的多变量Cox比例风险回归模型
基于Boruta算法和LightGBM算法筛选出的8个核心变量(NPAR、年龄、BMI、淋巴细胞计数等),研究团队构建了9种ML模型用于预测乳腺癌风险,其中LightGBM模型诊断性能最佳(AUC=0.995)。
外部验证的结果也一致(数据来源于NHANES的其他周期)。

图2 9种ML模型的构建与评估
(A)Boruta算法;(B)LightGBM算法;(C)ML模型的ROC曲线;(D)ML模型测试集的精确率-召回率(PR)曲线;(E)ML模型验证集的ROC曲线
SHAP分析进一步确认年龄 是最重要的预测因子,NPAR 和BMI也是关键的正向贡献因子。

图3 LGBM模型的SHAP图
(A)LGBM模型中变量的SHAP值排名;(B)LGBM模型的SHAP蜂窝图。(C)LGBM模型的SHAP决策图;(D)SHAP力图;(E)SHAP瀑布图
研究结论
研究表明,NPAR是乳腺癌风险和预后的独立预测标志物,其升高与乳腺癌风险及死亡率显著相关。基于LightGBM的预测模型表现出色,可为临床提供非侵入性、低成本的筛查工具。
NHANES在线数据分析平台
想挖NHANES数据的朋友,别错过郑老师团队基于官网开发的NHANES Online平台,现已包含上百种综合指标(包括本文的指标NPAR和疾病MASLD),最大程度解决您的数据难题!
扫描下方二维码可免费试用,欢迎联系~
记得点个小小的关注👇
我们将为您分享更多公共数据库的高分发文思路!