参考blog
MIMIC IV 3.0数据库安装方法_mimic数据下载-CSDN博客
MIMIC IV数据库安装(二)_mimic数据库安装-CSDN博客
MIMIC-IV3.0安装_mimic iv 3.0-CSDN博客
MIMIC-IV-v2.0安装教程_mimic iv 安装教程-CSDN博客
MIMIC IV 3.0数据库安装方法或者思路,其实和MIMIC IV 2.2没有区别。
硬件要求:
下载的zip 文件7G多,解压后10G多(folder中还是压缩文件),导入数据库占用空间快70G。
获取MIMIC 权限
MIMIC IV 3.0数据库安装方法_mimic数据下载-CSDN博客
下载MIMIC-IV数据集
MIMIC IV 3.0数据库安装方法_mimic数据下载-CSDN博客
下载 & 安装 PostgreSQL
MIMIC IV数据库安装(一)_mimic数据库-CSDN博客
MIMIC数据库的安装环境主要是Postgresql数据库软件和7z解压软件。官方建议把MIMIC IV数据库安装到Postgresql数据库,虽然国内目前也有人安装到SQL Server数据库,但是实在是非常非常小众,不建议这样做。否则到时拿到其他人代码来执行提取,都不能保证通用。毕竟全世界国内外大都是用Postgresql来安装的。
原文链接:https://blog.csdn.net/idata01/article/details/141034352
MIMIC IV数据库官方下载下来是27个csv表格文件,由于表格行数太多,无法直接用EXCEL打开,需要先安装PostgreSQL数据库,然后将这些表格文件中的数据导入到PostgreSQL中,最后通过SQL语句进行数据的查询和提取。
安装PostgreSQL数据库,需要记录下输入的passcode。
安装PostgreSQL,注意,进入命令界面一直回车,直到出现提示输入密码。
前面四个提示不用管。
Mac下载 & 安装 7zip
Mac下载7zip很简单。
但是Mac安装7zip较为麻烦。需要借助brew。
download brew
Mac安装brew (一行代码,绝对不报错)_mac安装brew失败-CSDN博客
直接在cmd中输入
/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"
install 7zip
brew install p7zip
似乎不用像windows系统那样 配置环境变量。
直接在cmd中输入
which 7zip
如出现 /opt/homebrew/bin/7z,则表示配置成功。
下载MIMIC-IV安装代码
MIMIC IV数据库安装(二)_mimic数据库安装-CSDN博客
https://github.com/MIT-LCP/mimic-code
MIMIC官方有提供安装的代码,从github下载即可。本地解压。
不同的MIMIC版本,对应code不同。
安装MIMIC-IV-3.0数据库
MIMIC-IV3.0安装_mimic iv 3.0-CSDN博客
MIMIC IV数据库安装(二)_mimic数据库安装-CSDN博客
MIMIC-IV-v2.0安装教程_mimic iv 安装教程-CSDN博客
(1)打开PostgreSQL,进入启动PostgreSQL Shell
(2)创建数据库mimiciv
DROP DATABASE IF EXISTS mimiciv;
CREATE DATABASE mimiciv OWNER postgres;
(3)数据库创建表 (注意文件路径替换为自己数据的所在路径)。
\c mimiciv
\set mimic_data_dir 'F:/mimic/mimic-iv-1.0'
\encoding 'utf8'
\i F:/mimic/mimic-code-main/mimic-iv/buildmimic/postgres/create.sql
(4)加载数据。 (注意文件路径替换为自己数据的所在路径)。
\i F:/mimic/mimic-code-main/mimic-iv/buildmimic/postgres/load_7z.sql
如出现上面结果,则表示正常安装。整个install过程较慢。
数据便导入完成了,最后一步安装完索引即可。
(5) build index
# 安装索引
\i .../build_mimiciv-2.0/index.sql
MIMIC-IV 3.0提取数据
MIMIC IV 3.0数据库安装方法_mimic数据下载-CSDN博客
提取数据是大家安装MIMIC IV 3.0数据库的终极需求,这里我给大家一点建议。我看很多人还是使用pgadmin来提取数据,我知道造成情况的原因是视频教程里用了pgadmin来做演示数据提取,但是实际上这个pgadmin使用体验上比较槽糕,界面也不太友好。我建议大家使用Navicat来提取,Navicat是一款商业数据库可视化工具,目前个人版已经免费了,旗舰版也有很多方法可以使用。Navicat在界面友好,代码运行性能,操作功能等等方面都值得大家去用。当然无论是用pgadmin还是Navicat,SQL代码是通用的,不会因为使用的SQL工具不一样,代码就会不同。
原文链接:https://blog.csdn.net/idata01/article/details/141034352
Navicat 安装
MIMIC IV数据库安装(三)_怎么将mimic数据库导入到navicat-CSDN博客
网上免费资源不多。
建议购买官方软件。
安装之后,连接postgreSQL的MIMIC数据即可。
这是MIMIC-IV 3.0,此版本数据表较为精简。
Navicat 使用
MIMIC-IV 、MIMIC-IV、MIMIC-IV-ED关系
MIMIC-IV 系列数据库由多种不同的子数据集组成,每个子集都专注于特定类型的数据或临床场景。以下是 MIMIC-IV、MIMIC-IV-ED、MIMIC-IV-Note 和 MIMIC-CXR 之间的关系及其特点:
数据库关系和特点
-
MIMIC-IV:
- 这是一个综合性的数据库,包含来自重症监护病房(ICU)患者的临床数据,包括生理监测、实验室结果、药物使用和其他医疗信息。
-
MIMIC-IV-ED:
- 这个数据集专注于急诊科(Emergency Department, ED)的患者数据。它包含有关急诊就诊的详细信息,包括患者的病史、初步评估和急诊治疗。
-
MIMIC-IV-Note:
- 该数据集包含来自 MIMIC-IV 的临床笔记,记录了医疗提供者在患者护理过程中写下的详细文本信息。这些笔记包括病历摘要、护理记录和其他临床文档。
-
MIMIC-CXR:
- 这是一个独立的数据库,专注于胸部 X 光影像(CXR)及其相关的临床数据。它包含胸部影像以及与这些影像相关的诊断和报告。
ID 一致性
- 在这些数据库中,患者的
subject_id
是一致的。这意味着如果一个病人 ID 在 MIMIC-IV、MIMIC-IV-ED、MIMIC-IV-Note 和 MIMIC-CXR 中都出现,那么这些 ID 对应的信息来自于同一个患者。 - 换句话说,虽然不同的数据集关注不同的临床场景和数据类型,但它们共享相同的患者 ID,使得跨数据集整合和比较变得更加方便。
MIMIC-IV-ED V.S. MIMIC-IV-Note
-
MIMIC-IV-ED:
- 该数据库主要关注急诊科患者的临床笔记。笔记内容通常包括患者在急诊就诊时的评估、病史记录、体格检查结果、初步诊断和治疗方案等。
- 由于主要来自急诊科,笔记的特点是即时性和针对急诊情境的描述,通常内容比较简洁和直接。
-
MIMIC-IV-Note:
- 该数据库则包含来自多个临床环境的更全面的临床笔记,包括但不限于住院病人、出院总结、护理记录和其他类型的医疗文档。
- 笔记内容可能更加详细,涉及患者的整体病情发展、治疗过程中的变化、实验室结果分析等。
-
数据来源:
- MIMIC-IV-ED 主要来源于急诊科,而 MIMIC-IV-Note 则来自于更广泛的临床环境。
-
内容深度:
- MIMIC-IV-ED 的笔记通常更加简短,集中在急诊处理的即时情况和决策,而 MIMIC-IV-Note 的笔记可能包括更长时间跨度的病历记录,涉及患者在住院期间的全面评估。
Linking MIMIC-IV to emergency department, note, and chest x-ray data
MIMIC-IV is linkable to other MIMIC projects published on PhysioNet. Where possible, we have prefixed the other projects with "MIMIC-IV" to make this clear such as MIMIC-IV-ED. Note that MIMIC-CXR is also linkable although it is not prefixed with MIMIC-IV. Free-text clinical notes are available in MIMIC-IV-Note [7], observations made in the emergency department are available in MIMIC-IV-ED [8], and chest x-rays in MIMIC-CXR [9].
Linking the other datasets to MIMIC-IV requires two steps.
The first step is to match the data using subject_id
, taking care to note that MIMIC-IV is a superset of other modules, and sampling biases may be introduced by the linking process.
For example, MIMIC-CXR is only available between 2011 - 2016 for patients who were admitted to the emergency department, and this selection bias impacts the patient cohort.
The second step involves aligning the dates. Since all modules are deidentified by the same shift, the time periods for measurements overlap.
For example, if a patient is admitted to the hospital on 2105-01-01, discharged on 2105-01-03, and has an x-ray in MIMIC-CXR on 2105-01-02, then it is correct to assume the x-ray was taken while the patient was admitted to the hospital.
MIMIC-IV数据库-文件说明
MIMIC IV 3.0数据库 - kk Blog ------ 通用基础
MIMIC-IV数据库介绍与使用说明_mimic数据库-CSDN博客
MIMIC-IV,重症医学数据库介绍和使用说明 | 科研收录
MIMIC IV数据库安装(二)_mimic数据库安装-CSDN博客
- subject_id
每个患者有唯一的subject_id- hadm_id
患者的每一次入院会有一个唯一的hadm_id- transfer_id
患者每一次更换病房会有一个唯一的transfer_id- stay_id
在相同类型病房内进行转移,则会更新一个transfer_id,但会有相同的stay_id,例如用ICU中的一个病房转移到另一个病房,则stay_id不变,transfer_id更新。
所有id的分配都是随机的,与时间先后无关。
MIMIC-IV,重症医学数据库介绍和使用说明 | 科研收录