真实世界研究-非结构化数据处理

真实世界研究(Real-Word Studies, RWS)是指以参与者在日常临床实践中遇到的真实情况为基础的研究。要得到精准的研究结果,往往需要高质量的结构化数据。面对海量的文本数据,我们如何得到高质量的结构化数据呢,今天就给大家分享一个简单高效的数据处理方法。


01


RWS的数据源分析

现有数据来源主要包含:

1、电子病历(electronic medical record, EMR)

2、电子健康档案(electronic health record, EHR)

3、医保数据(claims data)

4、出生死亡登记

5、公共健康监测数据以及区域化

6、医疗数据等

研究者需要从参与者的病历中提取关键信息,以便更好地了解病人的情况及治疗效果。

1、基本信息:如年龄、性别、病史、家族病史等。

2、诊断信息:疾病诊断、病情描述、患者主诉等。

3、治疗信息:治疗计划、药品治疗、手术治疗等。

4、观察数据:如血压、血糖、体温等数据。

5、病情进展:疾病的演变过程、症状的变化等。

6、不良反应:药物不良反应、手术后并发症等。

7、质量指标:如病人就医满意度、治疗有效性等指标。

以上信息仅仅是提取病例信息的一部分,具体的提取方式和信息内容还需要根据研究的目的和问题进行确定。


02


数据的结构化处理

需要的信息往往都隐藏在这些文本中,无法直接用于统计研究。如何做从这些文本中提取出我们需要的信息呢?传统方法是人工或者使用自然语言处理的工程学方法,这两种方法的成本往往是比较高的。

现在有没有比较简单的和可行的方案呢?

今天我们就以上面的文本为例,使用"知否AI"进行数据的结构化处理。

下面是一段摘自"丁香园"的一段病例信息:

患者,女性,75岁。

主诉"咳嗽、咳痰、发热1周,胸闷、呼吸困难5天"。 患者1周前受凉后出现流涕、鼻塞、咽痒,咳嗽、咳黄痰,发热,最高体温38.0℃,伴畏寒、寒战。5天前患者出现胸闷,位于胸骨中段后,呈压迫样,持续性发作,并逐渐出现呼吸困难。服用了复方氨酚烷胺颗粒、头孢克肟。 无胸背痛,无咯血,无腹痛、腹胀、腹泻,无呕吐、头痛,无肢体偏瘫等。 患者既往有"高血压病"等病史。 入院时查体:体温38.0℃,脉搏84次/分,呼吸22次/分,血压122/70mmHg。指尖脉氧98%。清醒,对答切题。颈静脉怒张。双肺呼吸音粗,双肺可闻及较多湿性罗音,未闻及干罗音。心界无扩大,律齐,心音低钝,未闻杂音。双下肢无水肿。腹部、神经系统查体(-)。 化验室检查: 超敏肌钙蛋白T:>50000 pg/ml(0-34.2)。 CK-MB:184.7 U/L(0-25);CK:2671 lU/L(25-173)。 pro-BNP 22063.1 pg/ml。 D-二聚体:4567 ug/L(0-1000)。 血气分析:pH:7.3,PCO2: 34mmHg,PO2: 71mmHg,HCO3: 27.2mmol/L,乳酸:1.1mmol/L。 血常规:白细胞6.66x10^9/L,中性粒细胞百分数82.1%(50-70),淋巴细胞百分数9.9%(20-40),血红蛋白111g/L,血小板110x10^9/L。 超敏C反应蛋白:100 mg/L(0-10)。降钙素原正常。 生化:血钾:3.84mmo/L。肌酐119 umol/L。 肝功能: AST:326 lU/L;ALT:117 lU/L;血清血蛋白:32.1 g/L。 血糖、血脂、甲功能均未见明显异常。

今天我们就以上面的文本为例,使用知否AI进行数据的结构化处理。

我们采用的处理思路是,从整体到部分,从粗到细的处理策略。

1、大类别抽取

我们输入,抽取年龄、性别、需要鉴别的疾病、病史、家族病史、疾病诊断、病情描述、患者主诉、治疗计划、药品治疗、手术治疗、不良反应、手术后并发症、病人就医满意度、治疗有效性、实验室检验

以表格的形式展示,表头为内容和结果。

2、针对每一个类别进行精细化抽取

(1)、提取实验室检验

(2)、抽取病情和和主诉

(3)、抽取现病史和既往史

(4)、抽取用用药信息

您可以打开"知否AI"自己体验一下,可以输入"请帮我抽取用药信息,以表格形式展示+您要抽取的文字"。就可以得到想要的内容了。


03


真实世界研究的展望

当今医学研究的一个趋势是真实世界研究(Real-world evidence,RWE)。与以往的临床试验相比,RWE更好地反映了真实世界中疾病和治疗方案的真实情况,具有更广泛的应用价值。未来,随着RWE技术和方法的不断升级和完善,它将在评估治疗效果、制定健康政策和指南、支持药品审批和监管等方面发挥更为重要的作用。

在真实世界研究中,重症患者的治疗效果仍然是一个亟待解决的问题。在新兴的细分领域,如精准医学、个性化医疗和数字医疗等,RWE也将发挥至关重要的作用,为患者提供更为精准和个性化的治疗方案,让患者最大程度地获益。

总的来说,真实世界研究的应用前景十分广阔,将在医疗治疗、药品审批和监管、健康政策和指南制定等方面发挥着越来越重要的作用,促进医疗研究的不断推进和进步,为广大患者提供更为精准、有效的医疗服务。


以上的截图均来源于我们的AI助手: 知否AI问答,如果大家有兴趣可以点击链接查看,微信扫码直接登录,无需其他复杂验证,新用户可免费试用。

相关推荐
测试员周周5 小时前
【Appium 系列】第16节-WebView-H5上下文切换 — 混合应用的自动化难点
运维·开发语言·人工智能·功能测试·appium·自动化·测试用例
K姐研究社7 小时前
怎么用AI制作电商口播视频,开拍APP一键生成
人工智能·音视频
LaughingZhu8 小时前
Product Hunt 每日热榜 | 2026-05-21
前端·人工智能·经验分享·chatgpt·html
杜子不疼.8 小时前
【C++ AI 大模型接入 SDK】 - DeepSeek 模型接入(上)
开发语言·c++·chatgpt
传说故事8 小时前
【论文阅读】MotuBrain: An Advanced World Action Model for Robot Control
论文阅读·人工智能·具身智能·wam
北京耐用通信9 小时前
全域适配工业场景耐达讯自动化Modbus TCP 转 PROFIBUS 网关轻松实现以太网与现场总线互通
网络·人工智能·网络协议·自动化·信息与通信
火山引擎开发者社区9 小时前
TRAE × 火山引擎 Supabase:为你的 AI 应用装上“数据引擎”
人工智能
小a彤9 小时前
GE 在 CANN 五层架构中的位置
人工智能·深度学习·transformer
前端若水9 小时前
会话管理:创建、切换、删除对话历史
前端·人工智能·python·react.js
Upsy-Daisy9 小时前
AI Agent 项目学习笔记(八):Tool Calling 工具调用机制总览
人工智能·笔记·学习