数据分析 医学分析中线性回归、Cox回归、Logistic回归的定义和区别,原理和公式,适用场景

线性回归、Cox回归、Logistic回归 是三种常用的回归分析方法,核心区别在于因变量类型、适用场景、模型假设和输出结果,具体对比和细节如下:

一、核心区别对比表

特征 线性回归 Logistic回归 Cox比例风险回归
因变量类型 连续型数值变量(如血压、体重、收入) 二分类/多分类离散变量(如患病/未患病、阳性/阴性) 生存时间+结局状态(如随访时间+死亡/截尾)
核心用途 预测连续因变量的取值 预测分类因变量的概率/类别 分析影响生存时间的因素,计算风险比
模型假设 1. 因变量服从正态分布 2. 自变量与因变量线性相关 3. 残差独立且方差齐性 1. 自变量与logit§线性相关 2. 观测值独立 3. 无多重共线性 1. 比例风险假设 (各因素的风险比随时间不变) 2. 观测值独立 3. 截尾数据无信息偏倚
输出结果 回归系数β:自变量每变化1单位,因变量平均变化β单位 优势比OR:自变量每变化1单位,事件发生的优势比变化e^β倍 风险比HR:自变量每变化1单位,事件发生的风险比变化e^β倍
数据要求 无截尾数据 无截尾数据 可处理截尾数据(生存分析核心优势)

二、详细解读

1. 线性回归

  • 本质线性模型 ,用于建立连续型自变量连续型因变量的线性关系。
  • 公式 :Y=β0+β1X1+β2X2+...+βnXn+εY=\beta_0+\beta_1X_1+\beta_2X_2+...+\beta_nX_n+\varepsilonY=β0+β1X1+β2X2+...+βnXn+ε
    其中 ε\varepsilonε 是随机误差项,服从正态分布。
  • 典型场景:预测房价(因变量:房价)、分析身高对体重的影响(因变量:体重)。
  • 局限性:无法处理分类因变量或截尾数据。

2. Logistic回归

  • 本质广义线性模型 ,专门处理分类因变量 ,最常用的是二分类Logistic回归
  • 公式 :logit(P)=ln(P1−P)=β0+β1X1+...+βnXnlogit(P)=ln(\frac{P}{1-P})=\beta_0+\beta_1X_1+...+\beta_nX_nlogit(P)=ln(1−PP)=β0+β1X1+...+βnXn
    其中 PPP 是事件发生的概率(如患病概率),取值范围 [0,1]。
  • 核心优势 :输出的优势比OR可直观解释因素的影响程度(OR>1为危险因素,OR<1为保护因素)。
  • 典型场景:预测患者是否患癌症(因变量:患癌/未患癌)、分析吸烟与肺癌的关联。
  • 局限性:无法处理生存时间数据,不考虑事件发生的时间顺序。

3. Cox比例风险回归(Cox回归)

  • 本质半参数生存分析模型 ,用于分析影响生存时间的因素,是生存分析中最常用的方法。
  • 核心特点
    1. 不要求生存时间服从特定分布(半参数特性),适用性广;
    2. 可处理截尾数据(如患者失访、研究结束时未发生事件);
    3. 基于比例风险假设:各研究组的风险比随时间保持恒定。
  • 公式 :h(t,X)=h0(t)eβ1X1+β2X2+...+βnXnh(t,X)=h_0(t)e^{\beta_1X_1+\beta_2X_2+...+\beta_nX_n}h(t,X)=h0(t)eβ1X1+β2X2+...+βnXn
    其中 h(t,X)h(t,X)h(t,X) 是协变量为 XXX 时的风险函数,h0(t)h_0(t)h0(t) 是基准风险函数。
  • 典型场景:分析化疗方案对癌症患者生存时间的影响(因变量:生存时间+死亡状态)、研究高血压对心血管疾病发生时间的作用。
  • 局限性:比例风险假设不满足时,模型结果会失真,需通过检验验证假设。

三、选择策略总结

  1. 若因变量是连续型 → 选线性回归
  2. 若因变量是二分类/多分类 ,不关注时间 → 选Logistic回归
  3. 若关注事件发生的时间 ,且存在截尾数据 → 选Cox回归

你想深入理解Logistic回归核心公式中 PPP 的含义,这是掌握Logistic回归的关键,我会用最通俗的语言结合例子帮你彻底搞懂。

核心需求拆解

你想明确Logistic回归公式 logit(P)=ln(P1−P)=β0+β1X1+...+βnXnlogit(P)=ln(\frac{P}{1-P})=\beta_0+\beta_1X_1+...+\beta_nX_nlogit(P)=ln(1−PP)=β0+β1X1+...+βnXn 中 PPP 的定义、意义、取值范围和实际应用场景,并理解它和公式中其他部分的关联。


一、PPP 的核心定义

PPP 表示:在给定自变量 X1,X2,...,XnX_1,X_2,...,X_nX1,X2,...,Xn(如年龄、性别、吸烟史等)的条件下,某个"目标事件"发生的概率

关键特征:

  1. 取值范围 :P∈[0,1]P \in [0, 1]P∈[0,1](概率的本质,不可能小于0或大于1);
  2. "事件"是你自定义的:比如"患糖尿病""贷款违约""肿瘤复发"等二分类结局中,你选定的"阳性结局";
  3. 条件概率 :PPP 不是固定值,会随自变量 XXX 的变化而变化(比如年龄越大,患高血压的 PPP 越高)。

二、结合例子理解 PPP

用"预测是否患糖尿病"的场景举例,帮你具象化:

场景设定

  • 自变量 XXX:年龄(X1X_1X1)、空腹血糖(X2X_2X2)、BMI(X3X_3X3);
  • 目标事件:"患糖尿病"(阳性结局),"未患糖尿病"(阴性结局)。

公式中 PPP 的具体含义

PPP = 某个人在"年龄=50岁、空腹血糖=7.5mmol/L、BMI=28"的条件下,患糖尿病的概率

不同自变量组合下的 PPP 示例:
自变量组合(X) PPP(患糖尿病概率)
年龄30岁、血糖5.0、BMI22 0.05(5%)
年龄60岁、血糖8.5、BMI30 0.80(80%)
年龄45岁、血糖6.2、BMI25 0.20(20%)

三、PPP 与公式中其他部分的关联

Logistic回归的核心是"把概率 PPP 转换成线性关系",因为直接用线性回归拟合 PPP 会有问题(PPP 有0-1限制,线性回归输出可能超出这个范围),所以需要通过 logit(P)logit(P)logit(P) 转换:

1. 1−P1-P1−P 的含义

1−P1-P1−P 是目标事件不发生的概率(比如"未患糖尿病的概率")。

2. P1−P\frac{P}{1-P}1−PP:优势(Odds)

  • 定义:事件发生的概率 / 事件不发生的概率,也叫"比值""优势比的基础";
  • 示例:若 P=0.8P=0.8P=0.8(患糖尿病概率80%),则 1−P=0.21-P=0.21−P=0.2,P1−P=4\frac{P}{1-P}=41−PP=4 → 表示"患糖尿病的优势是不患的4倍";
  • 取值范围:(0,+∞)(0, +\infty)(0,+∞)(突破了 PPP 的0-1限制)。

3. ln(P1−P)ln(\frac{P}{1-P})ln(1−PP):Logit变换

  • 对"优势"取自然对数,把 (0,+∞)(0, +\infty)(0,+∞) 的优势转换成 (−∞,+∞)(-\infty, +\infty)(−∞,+∞) 的连续值;
  • 示例:P=0.8P=0.8P=0.8 时,ln(4)≈1.386ln(4)≈1.386ln(4)≈1.386;P=0.5P=0.5P=0.5 时,ln(1)=0ln(1)=0ln(1)=0;P=0.2P=0.2P=0.2 时,ln(0.25)≈−1.386ln(0.25)≈-1.386ln(0.25)≈−1.386;
  • 这个变换后的结果(logit值)可以和自变量 XXX 建立线性关系 (也就是公式右边的 β0+β1X1+...+βnXn\beta_0+\beta_1X_1+...+\beta_nX_nβ0+β1X1+...+βnXn)。

四、从公式反推 PPP(更易理解实际意义)

我们可以把Logit回归公式变形,直接得到 PPP 的表达式:
P=11+e−(β0+β1X1+...+βnXn) P = \frac{1}{1 + e^{-(\beta_0+\beta_1X_1+...+\beta_nX_n)}} P=1+e−(β0+β1X1+...+βnXn)1

这个公式也叫Sigmoid函数 ,它的作用是把线性回归的输出(可能是任意实数)"压缩"到0-1之间,最终输出的就是我们要的概率 PPP。

示例计算

假设拟合后的模型是:
logit(P)=−5+0.08×年龄+0.5×空腹血糖logit(P) = -5 + 0.08×年龄 + 0.5×空腹血糖logit(P)=−5+0.08×年龄+0.5×空腹血糖

对于"年龄50岁、空腹血糖7.5"的人:

  1. 先算线性部分:−5+0.08×50+0.5×7.5=−5+4+3.75=2.75-5 + 0.08×50 + 0.5×7.5 = -5 + 4 + 3.75 = 2.75−5+0.08×50+0.5×7.5=−5+4+3.75=2.75;
  2. 再算 PPP:P=11+e−2.75≈11+0.0639≈0.94P = \frac{1}{1 + e^{-2.75}} ≈ \frac{1}{1 + 0.0639} ≈ 0.94P=1+e−2.751≈1+0.06391≈0.94;
    → 这个人患糖尿病的概率约94%。

总结

  1. PPP 是条件概率:给定自变量取值时,目标事件发生的概率,取值0~1;
  2. PPP 是Logistic回归的核心输出目标 :模型最终就是为了计算不同自变量组合下的 PPP;
  3. Logit变换的本质:把0~1的 PPP 转换成可线性拟合的连续值,最终再还原为概率 PPP。

你想要一个完整的Python代码示例,用真实数据集拟合Logistic回归,并直观展示公式中 PPP(事件发生概率)的计算过程,我这就为你提供可直接运行的代码,并详细解释每一步的输出含义。

前置条件

  • 确保安装了所需库:
bash 复制代码
pip install numpy pandas scikit-learn matplotlib

完整代码示例(糖尿病患病概率预测)

python 复制代码
# 导入所需库
import numpy as np
import pandas as pd
from sklearn.datasets import load_diabetes
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

# ---------------------- 1. 数据准备与预处理 ----------------------
# 加载糖尿病数据集(sklearn内置)
# 注意:原数据集的target是连续值(血糖值),我们将其转为二分类:≥150为患病(1),<150为未患病(0)
diabetes = load_diabetes()
X = pd.DataFrame(diabetes.data, columns=diabetes.feature_names)  # 自变量(年龄、BMI、血压等)
y = (diabetes.target >= 150).astype(int)  # 因变量:1=患病,0=未患病(这是我们定义的"目标事件")

# 数据划分:训练集(80%) + 测试集(20%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 标准化自变量(Logistic回归对量纲敏感,建议标准化)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# ---------------------- 2. 拟合Logistic回归模型 ----------------------
# 初始化模型(设置max_iter确保收敛)
lr_model = LogisticRegression(max_iter=1000, random_state=42)
# 训练模型
lr_model.fit(X_train_scaled, y_train)

# ---------------------- 3. 提取模型参数(对应公式中的β) ----------------------
beta_0 = lr_model.intercept_[0]  # 截距β₀
beta = lr_model.coef_[0]         # 回归系数β₁~βₙ

# 打印参数
print("="*50)
print("模型参数(对应 logit(P) = β₀ + β₁X₁ + ... + βₙXₙ):")
print(f"截距 β₀ = {beta_0:.4f}")
for i, feature in enumerate(diabetes.feature_names):
    print(f"自变量 {feature} 的系数 β_{i+1} = {beta[i]:.4f}")
print("="*50)

# ---------------------- 4. 计算P(事件发生概率) ----------------------
# 取测试集中前5个样本,展示P的计算过程
print("\n前5个测试样本的患病概率(P)计算:")
for i in range(5):
    # 单个样本的自变量值(标准化后)
    x_sample = X_test_scaled[i]
    # 步骤1:计算线性部分 z = β₀ + β₁X₁ + ... + βₙXₙ
    z = beta_0 + np.dot(beta, x_sample)
    # 步骤2:通过Sigmoid函数计算P = 1/(1+e^(-z))
    P = 1 / (1 + np.exp(-z))
    # 模型直接预测的概率(和手动计算结果一致)
    P_model = lr_model.predict_proba([x_sample])[0][1]  # [0]是未患病概率,[1]是患病概率
    
    # 输出结果
    print(f"\n样本{i+1}:")
    print(f"  线性部分 z = {z:.4f}")
    print(f"  手动计算患病概率 P = {P:.4f}")
    print(f"  模型输出患病概率 P = {P_model:.4f}")
    print(f"  实际是否患病:{'是' if y_test.iloc[i]==1 else '否'}")
    print(f"  模型预测是否患病:{'是' if P>=0.5 else '否'}")

# ---------------------- 5. 模型评估 ----------------------
y_pred = lr_model.predict(X_test_scaled)
accuracy = accuracy_score(y_test, y_pred)
print("\n" + "="*50)
print(f"模型在测试集上的准确率:{accuracy:.2%}")

代码关键部分解释

1. 核心输出:PPP 的计算逻辑

  • 步骤1 :计算线性部分 z=β0+β1X1+...+βnXnz = \beta_0 + \beta_1X_1 + ... + \beta_nX_nz=β0+β1X1+...+βnXn
    (对应公式中的 logit(P)logit(P)logit(P),也就是对数优势)
  • 步骤2 :通过Sigmoid函数转换为概率 PPP:
    P=11+e−zP = \frac{1}{1 + e^{-z}}P=1+e−z1
    (这一步是把无限范围的 zzz 压缩到 0~1 之间,得到最终的事件发生概率)

2. 典型输出示例(你运行代码后会看到类似结果)

复制代码
==================================================
模型参数(对应 logit(P) = β₀ + β₁X₁ + ... + βₙXₙ):
截距 β₀ = -0.5289
自变量 age 的系数 β₁ = 0.1023
自变量 sex 的系数 β₂ = -0.0456
自变量 bmi 的系数 β₃ = 0.5879  # BMI对患病概率影响最大(系数绝对值最大)
...
==================================================

前5个测试样本的患病概率(P)计算:

样本1:
  线性部分 z = -1.2345
  手动计算患病概率 P = 0.2201  # 患病概率22.01%
  模型输出患病概率 P = 0.2201
  实际是否患病:否
  模型预测是否患病:否

样本2:
  线性部分 z = 1.5678
  手动计算患病概率 P = 0.8270  # 患病概率82.70%
  模型输出患病概率 P = 0.8270
  实际是否患病:是
  模型预测是否患病:是
...

3. PPP 的实际决策意义

  • 代码中以 P≥0.5P \geq 0.5P≥0.5 作为"患病"的判断阈值(行业通用默认值);
  • 你可以根据业务需求调整阈值:比如医疗场景中希望减少漏诊,可将阈值调低(如0.3),此时更多样本会被预测为"患病"。

总结

  1. PPP 是Logistic回归的核心输出,代表给定自变量组合时目标事件发生的概率(取值0~1);
  2. 代码中通过"线性计算+Sigmoid转换"两步得到 PPP,手动计算和模型内置方法结果完全一致;
  3. PPP 的大小可直接解释风险程度:PPP 越大,事件发生的可能性越高(如 P=0.8P=0.8P=0.8 比 P=0.2P=0.2P=0.2 患病风险高4倍)。

Cox回归的原理,深入理解Cox回归的核心公式 h(t,X)=h0(t)eβ1X1+β2X2+...+βnXnh(t,X)=h_0(t)e^{\beta_1X_1+\beta_2X_2+...+\beta_nX_n}h(t,X)=h0(t)eβ1X1+β2X2+...+βnXn 的含义和背后的原理

,我会用通俗的语言拆解公式中每个部分的意义,并解释Cox回归的核心逻辑,让你彻底搞懂这个生存分析中最常用的模型。

先明确Cox回归的核心目标

Cox回归(Cox比例风险回归)的核心是:分析不同自变量(如治疗方案、年龄、性别)如何影响"事件发生的风险",同时兼顾事件发生的时间和截尾数据(比如患者失访、研究结束时还未发生死亡/复发)。


一、公式逐部分拆解

先把公式拆成3个核心部分,逐个解释:
h(t,X)=h0(t)×eβ1X1+β2X2+...+βnXnh(t,X) = h_0(t) \times e^{\beta_1X_1+\beta_2X_2+...+\beta_nX_n}h(t,X)=h0(t)×eβ1X1+β2X2+...+βnXn

1. h(t,X)h(t,X)h(t,X):风险函数(Hazard Function)

  • 核心定义 :在时间t 时,给定自变量组合XXX(如年龄=60岁、接受A治疗、有高血压)的个体,在t时刻仍然存活/未发生事件的前提下,接下来极短时间内发生目标事件(如死亡、复发)的瞬时概率
  • 通俗理解:可以把它想象成"t时刻的瞬时风险率"------比如一个癌症患者在治疗后第100天还活着,h(100,X)h(100,X)h(100,X) 就是他在第100天这一瞬间发生死亡的风险。
  • 取值范围:h(t,X)>0h(t,X) > 0h(t,X)>0(风险率不可能为负)。

2. h0(t)h_0(t)h0(t):基准风险函数(Baseline Hazard Function)

  • 核心定义 :所有自变量都取0时(X1=X2=...=Xn=0X_1=X_2=...=X_n=0X1=X2=...=Xn=0)的基准风险率,代表"参考人群"在时间t的瞬时风险。
  • 关键特点:
    • h0(t)h_0(t)h0(t) 只和时间ttt有关,和自变量XXX无关;
    • Cox回归是半参数模型 :不需要预先设定h0(t)h_0(t)h0(t)的具体分布(比如正态、指数分布),这也是它适用性广的核心原因;
    • 我们通常不需要单独估计h0(t)h_0(t)h0(t),只需要关注自变量的影响(即β\betaβ系数)。

3. eβ1X1+β2X2+...+βnXne^{\beta_1X_1+\beta_2X_2+...+\beta_nX_n}eβ1X1+β2X2+...+βnXn:风险比的核心部分

这是公式中最有实际意义的部分,先拆成两步理解:

第一步:线性组合 β1X1+β2X2+...+βnXn\beta_1X_1+\beta_2X_2+...+\beta_nX_nβ1X1+β2X2+...+βnXn
  • βi\beta_iβi:第iii个自变量的回归系数(模型拟合后得到);
  • XiX_iXi:第iii个自变量的取值(如年龄、治疗方案:1=A方案,0=B方案);
  • 这部分和线性回归、Logistic回归的线性部分逻辑一致,代表自变量对风险的综合线性影响。
第二步:指数转换 e线性组合e^{线性组合}e线性组合
  • 对线性组合取指数,得到的是相对风险比(Relative Hazard)
    • 若βi>0\beta_i>0βi>0:eβi>1e^{\beta_i}>1eβi>1,说明该自变量是危险因素 (自变量每增加1单位,风险率变为原来的eβie^{\beta_i}eβi倍);
    • 若βi<0\beta_i<0βi<0:eβi<1e^{\beta_i}<1eβi<1,说明该自变量是保护因素(自变量每增加1单位,风险率降低);
    • 若βi=0\beta_i=0βi=0:eβi=1e^{\beta_i}=1eβi=1,说明该自变量对风险无影响。

二、Cox回归的核心原理:比例风险假设

Cox回归能成立的核心前提是比例风险假设(Proportional Hazards Assumption),这也是理解它的关键:

1. 比例风险假设的含义

对于任意两个不同的自变量组合X1X_1X1和X2X_2X2,它们的风险比在所有时间点t 上都是恒定的:
h(t,X1)h(t,X2)=h0(t)eβ⋅X1h0(t)eβ⋅X2=eβ⋅(X1−X2)\frac{h(t,X_1)}{h(t,X_2)} = \frac{h_0(t)e^{\beta \cdot X_1}}{h_0(t)e^{\beta \cdot X_2}} = e^{\beta \cdot (X_1-X_2)}h(t,X2)h(t,X1)=h0(t)eβ⋅X2h0(t)eβ⋅X1=eβ⋅(X1−X2)

  • 关键结论:h0(t)h_0(t)h0(t)被约掉了,风险比只和自变量有关,和时间t无关
  • 通俗理解:比如"接受A治疗"和"接受B治疗"的患者,A组的死亡风险始终是B组的2倍(eβ=2e^\beta=2eβ=2),不管是治疗后1个月、6个月还是1年,这个比例都不变。

2. 为什么这个假设重要?

如果比例风险假设不成立(比如A组在前3个月风险是B组的2倍,3个月后变成0.5倍),那么Cox回归的结果就会失真,此时需要调整模型(如加入时间交互项)。

三、用例子具象化理解

以"癌症患者生存分析"为例,假设拟合后的Cox模型为:
h(t,X)=h0(t)e0.05×年龄+0.8×治疗方案(1=化疗,0=放疗)−0.6×靶向药(1=使用,0=未使用)h(t,X) = h_0(t)e^{0.05×年龄 + 0.8×治疗方案(1=化疗,0=放疗) - 0.6×靶向药(1=使用,0=未使用)}h(t,X)=h0(t)e0.05×年龄+0.8×治疗方案(1=化疗,0=放疗)−0.6×靶向药(1=使用,0=未使用)

1. 单个自变量的影响

  • 年龄的β=0.05\beta=0.05β=0.05:e0.05≈1.051e^{0.05}≈1.051e0.05≈1.051 → 年龄每增加1岁,死亡风险增加约5.1%;
  • 治疗方案的β=0.8\beta=0.8β=0.8:e0.8≈2.226e^{0.8}≈2.226e0.8≈2.226 → 化疗患者的死亡风险是放疗患者的2.226倍(化疗是危险因素);
  • 靶向药的β=−0.6\beta=-0.6β=−0.6:e−0.6≈0.549e^{-0.6}≈0.549e−0.6≈0.549 → 使用靶向药的患者死亡风险是未使用的54.9%(靶向药是保护因素)。

2. 不同个体的风险对比

  • 个体A:年龄60岁,化疗,未用靶向药 → 线性部分=0.05×60+0.8×1−0.6×0=3.80.05×60 + 0.8×1 - 0.6×0 = 3.80.05×60+0.8×1−0.6×0=3.8 → e3.8≈44.7e^{3.8}≈44.7e3.8≈44.7;
  • 个体B:年龄50岁,放疗,使用靶向药 → 线性部分=0.05×50+0.8×0−0.6×1=1.90.05×50 + 0.8×0 - 0.6×1 = 1.90.05×50+0.8×0−0.6×1=1.9 → e1.9≈6.68e^{1.9}≈6.68e1.9≈6.68;
  • 风险比:h(t,A)h(t,B)=h0(t)×44.7h0(t)×6.68≈6.69\frac{h(t,A)}{h(t,B)} = \frac{h_0(t)×44.7}{h_0(t)×6.68}≈6.69h(t,B)h(t,A)=h0(t)×6.68h0(t)×44.7≈6.69 → 个体A的死亡风险是个体B的6.69倍,且这个比例在所有时间点都成立(比例风险假设)。

四、Cox回归的核心优势

  1. 处理截尾数据:这是生存分析的核心需求(比如100个患者中,20个失访,Cox回归能有效利用这些数据);
  2. 半参数特性:无需假设生存时间服从特定分布(如指数分布、威布尔分布),适用性远高于参数化生存模型;
  3. 结果易解释:输出的风险比(HR)是临床/科研中最常用的指标,直观反映自变量的影响程度。

总结

  1. Cox回归公式的核心是风险函数分解:个体风险=基准风险×自变量的风险影响(指数形式);
  2. 公式中e∑βiXie^{\sum\beta_iX_i}e∑βiXi是关键,对应风险比(HR),用于解释自变量对事件风险的影响程度;
  3. 比例风险假设是Cox回归的核心前提:不同个体的风险比不随时间变化,这是模型成立的关键。

如果需要,我可以提供Cox回归的Python实现代码(用lifelines库),包括数据预处理、模型拟合、比例风险假设检验和HR值计算,帮你直观看到公式的实际应用。

相关推荐
生信大杂烩17 小时前
空间转录组分析新工具 | MEcell:自适应微环境感知建模,精准解析细胞身份!
算法·数据分析
AC赳赳老秦18 小时前
Shell 脚本批量生成:DeepSeek 辅助编写服务器运维自动化指令
运维·服务器·前端·vue.js·数据分析·自动化·deepseek
zhangfeng113320 小时前
spss 性别类似的二分类变量 多分类变量 做线性回归分析
分类·数据挖掘·线性回归
电商API_180079052471 天前
B站视频列表与详情数据API调用完全指南
大数据·人工智能·爬虫·数据分析
jiaozi_zzq1 天前
中专大数据专业学生如何规划证书考取与职业发展路径
大数据·职场和发展·数据分析·证书
醉卧考场君莫笑1 天前
PowerBI(上)
信息可视化·数据分析·powerbi
sonadorje1 天前
谈谈贝叶斯回归
人工智能·数据挖掘·回归
沐墨染1 天前
大型数据分析组件前端实践:多维度检索与实时交互设计
前端·elementui·数据挖掘·数据分析·vue·交互
木头程序员1 天前
机器学习概述:核心范式、关键技术与应用展望
大数据·人工智能·机器学习·回归·聚类