真实世界研究-非结构化数据处理

真实世界研究(Real-Word Studies, RWS)是指以参与者在日常临床实践中遇到的真实情况为基础的研究。要得到精准的研究结果,往往需要高质量的结构化数据。面对海量的文本数据,我们如何得到高质量的结构化数据呢,今天就给大家分享一个简单高效的数据处理方法。


01


RWS的数据源分析

现有数据来源主要包含:

1、电子病历(electronic medical record, EMR)

2、电子健康档案(electronic health record, EHR)

3、医保数据(claims data)

4、出生死亡登记

5、公共健康监测数据以及区域化

6、医疗数据等

研究者需要从参与者的病历中提取关键信息,以便更好地了解病人的情况及治疗效果。

1、基本信息:如年龄、性别、病史、家族病史等。

2、诊断信息:疾病诊断、病情描述、患者主诉等。

3、治疗信息:治疗计划、药品治疗、手术治疗等。

4、观察数据:如血压、血糖、体温等数据。

5、病情进展:疾病的演变过程、症状的变化等。

6、不良反应:药物不良反应、手术后并发症等。

7、质量指标:如病人就医满意度、治疗有效性等指标。

以上信息仅仅是提取病例信息的一部分,具体的提取方式和信息内容还需要根据研究的目的和问题进行确定。


02


数据的结构化处理

需要的信息往往都隐藏在这些文本中,无法直接用于统计研究。如何做从这些文本中提取出我们需要的信息呢?传统方法是人工或者使用自然语言处理的工程学方法,这两种方法的成本往往是比较高的。

现在有没有比较简单的和可行的方案呢?

今天我们就以上面的文本为例,使用"知否AI"进行数据的结构化处理。

下面是一段摘自"丁香园"的一段病例信息:

患者,女性,75岁。

主诉"咳嗽、咳痰、发热1周,胸闷、呼吸困难5天"。 患者1周前受凉后出现流涕、鼻塞、咽痒,咳嗽、咳黄痰,发热,最高体温38.0℃,伴畏寒、寒战。5天前患者出现胸闷,位于胸骨中段后,呈压迫样,持续性发作,并逐渐出现呼吸困难。服用了复方氨酚烷胺颗粒、头孢克肟。 无胸背痛,无咯血,无腹痛、腹胀、腹泻,无呕吐、头痛,无肢体偏瘫等。 患者既往有"高血压病"等病史。 入院时查体:体温38.0℃,脉搏84次/分,呼吸22次/分,血压122/70mmHg。指尖脉氧98%。清醒,对答切题。颈静脉怒张。双肺呼吸音粗,双肺可闻及较多湿性罗音,未闻及干罗音。心界无扩大,律齐,心音低钝,未闻杂音。双下肢无水肿。腹部、神经系统查体(-)。 化验室检查: 超敏肌钙蛋白T:>50000 pg/ml(0-34.2)。 CK-MB:184.7 U/L(0-25);CK:2671 lU/L(25-173)。 pro-BNP 22063.1 pg/ml。 D-二聚体:4567 ug/L(0-1000)。 血气分析:pH:7.3,PCO2: 34mmHg,PO2: 71mmHg,HCO3: 27.2mmol/L,乳酸:1.1mmol/L。 血常规:白细胞6.66x10^9/L,中性粒细胞百分数82.1%(50-70),淋巴细胞百分数9.9%(20-40),血红蛋白111g/L,血小板110x10^9/L。 超敏C反应蛋白:100 mg/L(0-10)。降钙素原正常。 生化:血钾:3.84mmo/L。肌酐119 umol/L。 肝功能: AST:326 lU/L;ALT:117 lU/L;血清血蛋白:32.1 g/L。 血糖、血脂、甲功能均未见明显异常。

今天我们就以上面的文本为例,使用知否AI进行数据的结构化处理。

我们采用的处理思路是,从整体到部分,从粗到细的处理策略。

1、大类别抽取

我们输入,抽取年龄、性别、需要鉴别的疾病、病史、家族病史、疾病诊断、病情描述、患者主诉、治疗计划、药品治疗、手术治疗、不良反应、手术后并发症、病人就医满意度、治疗有效性、实验室检验

以表格的形式展示,表头为内容和结果。

2、针对每一个类别进行精细化抽取

(1)、提取实验室检验

(2)、抽取病情和和主诉

(3)、抽取现病史和既往史

(4)、抽取用用药信息

您可以打开"知否AI"自己体验一下,可以输入"请帮我抽取用药信息,以表格形式展示+您要抽取的文字"。就可以得到想要的内容了。


03


真实世界研究的展望

当今医学研究的一个趋势是真实世界研究(Real-world evidence,RWE)。与以往的临床试验相比,RWE更好地反映了真实世界中疾病和治疗方案的真实情况,具有更广泛的应用价值。未来,随着RWE技术和方法的不断升级和完善,它将在评估治疗效果、制定健康政策和指南、支持药品审批和监管等方面发挥更为重要的作用。

在真实世界研究中,重症患者的治疗效果仍然是一个亟待解决的问题。在新兴的细分领域,如精准医学、个性化医疗和数字医疗等,RWE也将发挥至关重要的作用,为患者提供更为精准和个性化的治疗方案,让患者最大程度地获益。

总的来说,真实世界研究的应用前景十分广阔,将在医疗治疗、药品审批和监管、健康政策和指南制定等方面发挥着越来越重要的作用,促进医疗研究的不断推进和进步,为广大患者提供更为精准、有效的医疗服务。


以上的截图均来源于我们的AI助手: 知否AI问答,如果大家有兴趣可以点击链接查看,微信扫码直接登录,无需其他复杂验证,新用户可免费试用。

相关推荐
丝斯20113 分钟前
AI学习笔记整理(37)——自然语言处理的基本任务
人工智能·笔记·学习
王中阳Go9 分钟前
字节开源 Eino 框架上手体验:Go 语言终于有能打的 Agent 编排工具了(含 RAG 实战代码)
人工智能·后端·go
天竺鼠不该去劝架13 分钟前
免费RPA工具有哪些?主流产品详解与选型指南
人工智能
骚戴21 分钟前
LLM API 全方位实战指南:从 AI 大模型API选型到高效应用开发(2025年12月)
人工智能·大模型·llm·api·ai gateway
FL162386312924 分钟前
轴承表面缺陷检测数据集VOC+YOLO格式2064张8类别
人工智能·yolo·机器学习
岁月宁静28 分钟前
AI 多模态全栈项目实战:Vue3 + Node 打造 TTS+ASR 全家桶!
vue.js·人工智能·node.js
Funny_AI_LAB35 分钟前
Zcode:智谱AI推出的轻量级 AI IDE 编程利器
人工智能·python·算法·编辑器
亚里随笔1 小时前
偏离主路径:RLVR在参数空间中的非主方向学习机制
人工智能·深度学习·学习
共绩算力1 小时前
Dolphin-v2:拍照论文也能实现精准解析
人工智能·共绩算力
沃达德软件1 小时前
视频侦查技术揭秘
人工智能·opencv·计算机视觉·视觉检测·音视频·实时音视频·视频编解码