基于深度学习的中医辨证系统 如何区分各种感冒?

基于深度学习的中医辨证系统,通过症状结构化、多模态特征融合、深度语义建模、证素推理四大核心流程,实现风寒/风热/风邪(病毒)感冒的精准区分。

一、先明确:三型感冒的中医辨证要点(模型判断依据)

1. 风寒感冒(寒邪束表)
  • 核心:恶寒重、发热轻、无汗
  • 痰涕:清涕、白稀痰
  • 咽喉:不红不痛、咽痒
  • 舌脉:舌淡红、苔薄白、脉浮紧
  • 诱因:受凉、秋冬高发
2. 风热感冒(热邪犯肺)
  • 核心:发热重、微恶风、有汗
  • 痰涕:黄浊涕、黄稠痰
  • 咽喉:红肿疼痛明显
  • 舌脉:舌尖红、苔薄黄、脉浮数
  • 诱因:外感风热、春夏高发
3. 风邪感冒(病毒感冒,中医多归为"风邪夹证")
  • 核心:恶风明显、发热起伏、传染性强
  • 痰涕:初期可清、后期易转黄浊
  • 咽喉:多痛、可伴咽干
  • 舌脉:舌偏红、苔薄白或薄黄、脉浮
  • 特点:起病急、传变快、易夹寒/热/湿,与病毒感染特征吻合

二、深度学习系统的实现流程(技术路径)

1. 数据标准化与结构化(第一步)
  • 症状归一化:将"怕冷""畏寒""怕风"等同义症状统一为标准术语
  • 多源数据融合:
    • 文本:问诊记录、电子病历
    • 图像:舌象(舌色、舌苔)、面色
    • 生理:体温、脉象(脉诊仪数据)
    • 西医指标:血常规、病毒检测(辅助区分风邪/病毒)
  • 标注:由中医师标注为**风寒/风热/风邪(病毒)**三类标签
2. 特征提取(模型核心能力)
  • 文本语义特征(BERT/TCM-BERT)
    • 微调中医预训练模型,学习"恶寒重""流清涕"等症状组合的语义关联
    • 输出症状嵌入向量,捕捉寒/热/风的语义差异
  • 图像特征(CNN)
    • 舌象CNN:提取舌色(淡红/红)、舌苔(白/黄)、湿润度
    • 面色CNN:判断面色青白(寒)/红赤(热)
  • 结构化特征(MLP/Embedding)
    • 体温、汗出、痰色、脉率等数值/分类特征编码
3. 模型架构(主流方案)
  • 方案A:TCM-BERT-CNN(文本+舌象双输入)
    • BERT处理症状文本 → 语义特征
    • CNN处理舌象图片 → 视觉特征
    • 特征融合 → 全连接层 → 三分类输出
    • 效果:F1≈0.92,优于单模态模型
  • 方案B:双通道语义-结构融合模型(DC-TSCM)
    • 文本通道:BERT-TextCNN-BiLSTM
    • 图结构通道:构建症状-证素异构图(GAT)
    • 融合中医辨证规则,提升可解释性
  • 方案C:大语言模型(LLM)+ 证素推理
    • LLM理解自然语言症状 → 提取证素(风/寒/热/表/里)
    • 证素组合推理:风+寒=风寒;风+热=风热;风为主+传染=风邪(病毒)
4. 分类与推理逻辑(如何区分)
  • 风寒判定规则(模型高权重特征)
    • 恶寒重 > 发热、无汗、清涕、白痰、苔白、脉浮紧 → 高概率风寒
  • 风热判定规则
    • 发热重 > 恶风、有汗、黄涕、黄痰、咽痛、苔黄、脉浮数 → 高概率风热
  • 风邪(病毒)判定规则
    • 恶风为主、发热起伏、传染性、起病急、舌偏红、脉浮
    • 结合病毒检测阳性/血常规提示病毒感染 → 判定风邪(病毒)
    • 模型输出:风邪夹寒/风邪夹热(更贴合临床)
5. 模型训练与评估
  • 数据集:中医感冒医案、临床电子病历、病毒感染病例
  • 损失函数:交叉熵(多分类)
  • 评估指标:准确率、精确率、召回率、F1、AUC
  • 可解释性:特征可视化(如"清涕"与风寒的高相关性)

三、关键技术难点与解决

  • 症状模糊性:用中医知识图谱约束模型,避免误判
  • 多模态融合:采用注意力机制动态加权文本/图像/生理特征
  • 风邪(病毒)区分:融合西医病毒检测指标,提升特异性
  • 可解释性:输出症状-证素-证候的推理链,符合中医思维

四、系统输出示例

输入:发热38.5℃、微恶风、有汗、黄涕、咽痛、舌尖红、苔薄黄、脉浮数、病毒核酸阳性

模型输出:

  • 辨证:风邪感冒(风热型,病毒感染)
  • 置信度:94%
  • 依据:发热重、黄涕、咽痛、舌红(风热)+ 恶风、病毒阳性(风邪/病毒)

请整理一份可直接用于模型训练的风寒/风热/风邪感冒症状特征清单(含权重与标注规则),方便你快速构建数据集。

风寒/风热/风邪感冒 症状特征清单(含权重+标注规则|可直接用于AI模型训练)

说明

  1. 适配中医感冒三分类:风寒感冒、风热感冒、单纯风邪感冒(无明显寒热偏向)
  2. 每项症状配置权重分值(0.2~1.0),分值越高,类别鉴别力越强
  3. 统一标注规则、否定词规则、组合判定逻辑,可直接结构化标注、制作CSV/JSON训练数据集
  4. 剔除模糊表述,全部采用标准化医学文本,适合文本分类、实体抽取、症状辨证模型训练

一、基础权重分级标准

权重区间 等级 说明
0.8~1.0 核心特征 专属鉴别指标,单一高权重项可强偏向辨证
0.5~0.7 次要特征 辅助辨证,多项叠加强化类别倾向
0.2~0.4 轻微伴随 通用轻症,仅作补充参考

二、风寒感冒 症状特征库(标签:label=0)

1. 核心特征(权重0.8~1.0)

  1. 恶寒重、发热轻(1.0)
  2. 无汗、周身怕冷明显(0.95)
  3. 鼻塞严重、流清稀白涕(0.95)
  4. 咳嗽、咳白稀痰、痰量清稀易咯(0.9)
  5. 舌苔薄白、舌质淡红(0.9)
  6. 脉象浮紧(0.85)

2. 次要特征(权重0.5~0.7)

  1. 头痛身痛、肢体酸痛困重(0.7)
  2. 后背发凉、怕风畏冷(0.65)
  3. 口不渴、喜热饮(0.65)
  4. 咽喉微痒、无红肿疼痛(0.6)
  5. 面色发白、精神倦怠(0.55)

3. 轻微伴随(权重0.2~0.4)

  1. 轻微胸闷、胃胀纳差(0.35)
  2. 小便清长(0.3)
  3. 大便偏稀或正常(0.25)

风寒辨证极简规则

  • 满足2项及以上核心特征 → 判定为风寒感冒
  • 恶寒重、清涕、白稀痰 为三大强锚定指标

三、风热感冒 症状特征库(标签:label=1)

1. 核心特征(权重0.8~1.0)

  1. 发热重、恶寒轻、微恶风(1.0)
  2. 咽喉红肿、咽痛、咽干灼热(0.98)
  3. 鼻塞、流黄稠浓涕(0.95)
  4. 咳嗽、咳黄稠痰、痰黏难咯(0.95)
  5. 舌尖边红、舌苔薄黄(0.9)
  6. 脉象浮数(0.85)

2. 次要特征(权重0.5~0.7)

  1. 口干口渴、喜冷饮(0.7)
  2. 头部胀痛、面红目赤(0.65)
  3. 有少量汗出、周身燥热(0.65)
  4. 心烦燥热、睡眠不佳(0.6)
  5. 口鼻干燥、唇干起皮(0.55)

3. 轻微伴随(权重0.2~0.4)

  1. 轻微口苦、食欲下降(0.35)
  2. 小便短黄(0.3)
  3. 大便偏干(0.25)

风热辨证极简规则

  • 满足2项及以上核心特征 → 判定为风热感冒
  • 咽痛红肿、黄涕黄痰、高热 为三大强锚定指标

四、单纯风邪感冒(无寒热偏向)特征库(标签:label=2)

定义:外感风邪,无明显寒象、热象,为普通受风感冒

1. 核心特征(权重0.8~1.0)

  1. 明显怕风、恶风为主,无明显怕冷/燥热(1.0)
  2. 阵发性鼻塞、时轻时重(0.9)
  3. 阵发性咽痒、干咳无痰或少痰(0.9)
  4. 发热轻微或无发热(0.85)

2. 次要特征(权重0.5~0.7)

  1. 游走性头痛、头部怕风(0.7)
  2. 出汗正常、无大汗/无无汗(0.6)
  3. 舌苔薄白、无黄燥无水滑(0.55)

3. 轻微伴随(权重0.2~0.4)

  1. 轻微乏力、吹风后症状加重(0.35)
  2. 饮食、二便基本正常(0.25)

风邪感冒辨证极简规则

  • 恶风、咽痒、轻鼻塞、无寒热两极症状为核心
  • 无风寒典型寒象、无风热典型热象,直接判定为风邪感冒

五、统一标注规则(模型训练强制规范)

1. 正向标注规则

  • 文本中明确提及对应症状 → 标记为「存在=1」,计入对应权重分数
  • 症状描述程度:轻微/偶尔 不削减权重,重度/持续 权重全额生效

2. 否定排除规则(关键降噪)

出现以下否定词,直接剔除该症状,不计分:

无、不、未、没有、未见、不明显、缓解、消失、否认

例:「无咽痛」→ 风热咽痛特征不计分;「不怕冷」→ 风寒恶寒特征无效

3. 冲突症状判定(分类边界处理)

  1. 若同时出现风寒核心+风热核心 混杂症状:
    • 计算两类总权重分数,取总分更高类别作为最终标签
    • 寒热错杂样本单独标记为「混杂样本」,可做异常集划分
  2. 无任何核心特征、仅少量次要特征 → 归入 风邪感冒(label=2)

4. 文本归一化标注词典(统一同义词,避免特征割裂)

标准特征词 同义合并词
清稀白涕 清水鼻涕、白鼻涕、鼻涕稀
黄稠浓涕 黄鼻涕、浓鼻涕、黄绿涕
咽痛红肿 嗓子疼、喉咙肿痛、咽喉发炎
恶寒怕冷 发冷、畏寒、浑身冰凉、怕凉
发热燥热 发烧、身热、燥热、发烫

六、量化打分公式(可直接代码化)

  1. 单类别总分计算公式:

    Score_{类别} = \\sum(有效症状权重)

  2. 分类判定逻辑:

    \\begin{cases} Score_{风寒} 最高 \\rightarrow label=0\\ Score_{风热} 最高 \\rightarrow label=1\\ Score_{风邪} 最高 \\rightarrow label=2 \\end{cases}

  3. 阈值限制:单类别总分<1.0 且无核心特征 → 判定为非感冒样本(负样本)

七、数据集输出字段(直接复制建表)

json 复制代码
[
  "text",        // 原始症状文本
  "fenghan_score",// 风寒总分
  "fengre_score", // 风热总分
  "fengxie_score",// 风邪总分
  "label",       // 0/1/2 分类标签
  "symptom_list",// 命中症状列表
  "is_mixed"     // 是否寒热混杂:0否 1是
]
相关推荐
cuiyz crazy2 小时前
Vibe Coding的困境
人工智能
古怪今人2 小时前
大语言模型(LLM)的开发流程 训练、微调和RAG时什么改变了
人工智能·语言模型·自然语言处理
小鱼~~2 小时前
深度学习中Linear方法
深度学习
Tiger Z2 小时前
文献阅读 | Preprint | scMarkerAgent:基于大语言模型证据智能体的细胞标志物图谱
ai·生物信息·文献阅读·单细胞
Dev7z2 小时前
基于卷积神经网络(CNN)的脑电信号分类及可解释性分析
人工智能·分类·cnn
ToTensor2 小时前
Mem0 深度解析:智能记忆层的架构原理
人工智能·agent·memory
Agent手记2 小时前
生产工单下发不及时,频繁导致交付延期怎么办? 2026企业级智能体自动化实操指南
运维·ai·自动化
Kingairy2 小时前
自然语言处理基础-自然语言处理概览
人工智能·语音识别
龙侠九重天2 小时前
什么是多 Agent 系统?——从单体 AI 到群体智能
人工智能·ai·大模型·llm·agent·多智能体·multi-agent