真实世界研究-非结构化数据处理

真实世界研究(Real-Word Studies, RWS)是指以参与者在日常临床实践中遇到的真实情况为基础的研究。要得到精准的研究结果,往往需要高质量的结构化数据。面对海量的文本数据,我们如何得到高质量的结构化数据呢,今天就给大家分享一个简单高效的数据处理方法。


01


RWS的数据源分析

现有数据来源主要包含:

1、电子病历(electronic medical record, EMR)

2、电子健康档案(electronic health record, EHR)

3、医保数据(claims data)

4、出生死亡登记

5、公共健康监测数据以及区域化

6、医疗数据等

研究者需要从参与者的病历中提取关键信息,以便更好地了解病人的情况及治疗效果。

1、基本信息:如年龄、性别、病史、家族病史等。

2、诊断信息:疾病诊断、病情描述、患者主诉等。

3、治疗信息:治疗计划、药品治疗、手术治疗等。

4、观察数据:如血压、血糖、体温等数据。

5、病情进展:疾病的演变过程、症状的变化等。

6、不良反应:药物不良反应、手术后并发症等。

7、质量指标:如病人就医满意度、治疗有效性等指标。

以上信息仅仅是提取病例信息的一部分,具体的提取方式和信息内容还需要根据研究的目的和问题进行确定。


02


数据的结构化处理

需要的信息往往都隐藏在这些文本中,无法直接用于统计研究。如何做从这些文本中提取出我们需要的信息呢?传统方法是人工或者使用自然语言处理的工程学方法,这两种方法的成本往往是比较高的。

现在有没有比较简单的和可行的方案呢?

今天我们就以上面的文本为例,使用"知否AI"进行数据的结构化处理。

下面是一段摘自"丁香园"的一段病例信息:

患者,女性,75岁。

主诉"咳嗽、咳痰、发热1周,胸闷、呼吸困难5天"。 患者1周前受凉后出现流涕、鼻塞、咽痒,咳嗽、咳黄痰,发热,最高体温38.0℃,伴畏寒、寒战。5天前患者出现胸闷,位于胸骨中段后,呈压迫样,持续性发作,并逐渐出现呼吸困难。服用了复方氨酚烷胺颗粒、头孢克肟。 无胸背痛,无咯血,无腹痛、腹胀、腹泻,无呕吐、头痛,无肢体偏瘫等。 患者既往有"高血压病"等病史。 入院时查体:体温38.0℃,脉搏84次/分,呼吸22次/分,血压122/70mmHg。指尖脉氧98%。清醒,对答切题。颈静脉怒张。双肺呼吸音粗,双肺可闻及较多湿性罗音,未闻及干罗音。心界无扩大,律齐,心音低钝,未闻杂音。双下肢无水肿。腹部、神经系统查体(-)。 化验室检查: 超敏肌钙蛋白T:>50000 pg/ml(0-34.2)。 CK-MB:184.7 U/L(0-25);CK:2671 lU/L(25-173)。 pro-BNP 22063.1 pg/ml。 D-二聚体:4567 ug/L(0-1000)。 血气分析:pH:7.3,PCO2: 34mmHg,PO2: 71mmHg,HCO3: 27.2mmol/L,乳酸:1.1mmol/L。 血常规:白细胞6.66x10^9/L,中性粒细胞百分数82.1%(50-70),淋巴细胞百分数9.9%(20-40),血红蛋白111g/L,血小板110x10^9/L。 超敏C反应蛋白:100 mg/L(0-10)。降钙素原正常。 生化:血钾:3.84mmo/L。肌酐119 umol/L。 肝功能: AST:326 lU/L;ALT:117 lU/L;血清血蛋白:32.1 g/L。 血糖、血脂、甲功能均未见明显异常。

今天我们就以上面的文本为例,使用知否AI进行数据的结构化处理。

我们采用的处理思路是,从整体到部分,从粗到细的处理策略。

1、大类别抽取

我们输入,抽取年龄、性别、需要鉴别的疾病、病史、家族病史、疾病诊断、病情描述、患者主诉、治疗计划、药品治疗、手术治疗、不良反应、手术后并发症、病人就医满意度、治疗有效性、实验室检验

以表格的形式展示,表头为内容和结果。

2、针对每一个类别进行精细化抽取

(1)、提取实验室检验

(2)、抽取病情和和主诉

(3)、抽取现病史和既往史

(4)、抽取用用药信息

您可以打开"知否AI"自己体验一下,可以输入"请帮我抽取用药信息,以表格形式展示+您要抽取的文字"。就可以得到想要的内容了。


03


真实世界研究的展望

当今医学研究的一个趋势是真实世界研究(Real-world evidence,RWE)。与以往的临床试验相比,RWE更好地反映了真实世界中疾病和治疗方案的真实情况,具有更广泛的应用价值。未来,随着RWE技术和方法的不断升级和完善,它将在评估治疗效果、制定健康政策和指南、支持药品审批和监管等方面发挥更为重要的作用。

在真实世界研究中,重症患者的治疗效果仍然是一个亟待解决的问题。在新兴的细分领域,如精准医学、个性化医疗和数字医疗等,RWE也将发挥至关重要的作用,为患者提供更为精准和个性化的治疗方案,让患者最大程度地获益。

总的来说,真实世界研究的应用前景十分广阔,将在医疗治疗、药品审批和监管、健康政策和指南制定等方面发挥着越来越重要的作用,促进医疗研究的不断推进和进步,为广大患者提供更为精准、有效的医疗服务。


以上的截图均来源于我们的AI助手: 知否AI问答,如果大家有兴趣可以点击链接查看,微信扫码直接登录,无需其他复杂验证,新用户可免费试用。

相关推荐
2401_841495643 分钟前
【自然语言处理】自然语言理解的 “问题识别之术”
人工智能·自然语言处理·情感分类·决策·自动问答·自然语言理解·多源信息
Coder_Boy_4 分钟前
【人工智能应用技术】-基础实战-小程序应用(基于springAI+百度语音技术)智能语音开关
人工智能·百度·小程序
Coder_Boy_6 分钟前
【人工智能应用技术】-基础实战-小程序应用(基于springAI+百度语音技术)智能语音控制-Java部分核心逻辑
java·开发语言·人工智能·单片机
zhengfei6118 分钟前
全网第一款用于渗透测试和保护大型语言模型系统——DeepTeam
人工智能
爱笑的眼睛1111 分钟前
Flask上下文API:从并发陷阱到架构原理解析
java·人工智能·python·ai
墨绿色的摆渡人14 分钟前
论文笔记(一百一十二)Pos3R: 6D Pose Estimation for Unseen Objects Made Easy
论文阅读
科创致远14 分钟前
esop系统可量化 ROI 投资回报率客户案例故事-案例1:宁波某精密制造企业
大数据·人工智能·制造·精益工程
阿杰学AI15 分钟前
AI核心知识60——大语言模型之NLP(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·nlp·aigc·agi
丹宇码农19 分钟前
使用AI一步生成音视频文件的会议纪要或者课后笔记
人工智能·笔记·音视频