一 、MIMIC简介
MIMIC(Medical Information Mart for Intensive Care),是一个大型的公开数据库。该数据库记录了2001年至2019年期间贝斯以色列女狄肯斯医疗中心重症监护病房患者的相关数据,拥有4万多名患者的医疗健康数据和记录。
MIMIC数据库记录了人口统计学信息,如病人的性别、身高、宗教等情况。记录了实验室检验信息,如血常规,肝功能,肾功能等实验室检测数据。记录了患者的用药信息,如高血压患者服用了治疗高血压类药物等。记录了护理人员以及患者的护理级别等。记录了患者的检测成像报告,如胸X光片。记录了患者每次出入院信息,每次入院接受的单位以及主治医生、护士出具的护理记录和病例分析距离等海量数据。
二、版本介绍
MIMIC从开发至今,共存在三个大版本:MIMIC-II,MIMIC-III,MIMIC-IV。
-
MIMIC-II MIMIC-II包含2001-2008年的数据。数据是主要从CareVue监视器收集的。MIMIC-II现在已不再公开,但如果想要提取数据,可以从MIMIC-III中获取数据,利用筛选数据库来源为CareVue来提取MIMIC-II的数据(对此有疑问的可以关注后续文章,会有说明)。 -
MIMIC-III MIMIC-III包含2001-2012年的数据。患者数据是从Metavision和CareVue两个地方采集的。MIMIC-III 数据库当前最新版本是v1.4。这个版本是在2016年9月2日发布,此次发布提高了数据库中的数据质量,为Metavision数据库中的病人提供了大量的补充数据。MIMIC-III v1.4从2016年至今,未再进一步的修正,这也是MIMIC-III 数据库的最终版本。 -
MIMIC-IV MIMIC-IV包含2008-2019年的数据。全部数据是来自Metavision,注意在IV版本中,已不含CareVue采集的数据了。因为MIMIC-IV目前还在开发完善中,因此在本人进行医学数据研究过程中,基于的是MIMIC-III v1.4版本。所以后期所有介绍,也都是基于MIMIC-III v1.4版本来的。
三、后期工作
MIMIC-III一共包含26张数据表,各个数据表之间相互关联,因此提取自己研究课题相关数据极其繁琐,必须对MIMIC-III数据表有一个较深层次的理解,本人对MIMIC-III数据库研究了将近一个月,才提取到相关研究数据。
如果是专业是偏生物医学的同学,想用MIMIC数据做相关分析,可能更是难上加难。因此我从此篇博客开始,开设专栏**《MIMIC数据库》**介绍一些MIMIC-III数据库的相关知识,以及数据提取思路。供大家学习参考,如果哪位需要帮助,可以留言回复,本人尽可能帮忙。
参考文献
[1] https://mimic.mit.edu/docs/about/ [2] Johnson A.E. W, Pollard T J, Shen L, et al. MIMIC-III, a freely accessible critical care database[J]. Scientific Data, 2016, 3. [3] Goldberger A L, Amaral L A, Glass L, et al. PhysioBank, PhysioToolkit, and PhysioNet: components
同时,本文将在微信公众号同步更新,欢迎大家关注讨论问题。
|