讨论“医疗大数据的发展现状”其实就是谈大数据在医疗行业的嵌入程度,所以这个问题,要先了解清楚大数据的本质。
大数据,一种规模大到在获取、存储、管理、分析都无法用传统数据库、软件工具处理的海量“信息资产”。但是大数据的战略意义并不在于掌握这庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
那么医疗大数据现在及未来的应用主要为以下几个方面:
应用于医生。大数据最直接的效益就是产生疾病的临床指南,医生根据指南可以做出已经证实(或普遍认为)的最优临床决策。
应用于科研团队。真实详致的大数据是科研的基础,大量的数据可以排除多种干预,确定临床上最有效及具有成本效益的治疗方法。
大数据是指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。大数据与医学的结合可以促进医疗事业的快速发展。
主要可以体现在以下几个方面:
第一,应用于临床诊断、治疗。近年来,基因测序十分抢眼。专业公司通过对患者的小部分DNA进行排序,标注出几十个特定的基因缺陷来提醒专业医生对某患者采取个性化治疗。苹果公司乔布斯当年患上胰腺癌,这种癌中之王十分难治。乔帮主通过检测自身所有DNA和肿瘤DNA,医生得到了乔帮主本人所有基因密码的数据,采取有针对性的、个性化的用药。如果一种药效减弱,医生会再更换另外一种药物。虽然没有最终挽留住乔帮主的性命,但是实际上已经将其寿命延长了好几年。
第二,应用于公共卫生部门。公共卫生部门可以通过覆盖全国的患者电子病历数据库,快速检测流行病、传染病,进行全面的疫情监测,并通过集成疾病监测和响应程序,快速进行响应。这将带来很多好处,包括医疗索赔支出减少、传染病感染率降低,卫生部门可以更快地检测出新的传染病和疫情。比如,2009年,谷歌公司员工通过“哪些是治疗咳嗽、发热的药物”等类似词条,将它们用于一个特定的数学模型后,成功的预测了甲型H1N1的爆发和流感的发源地。美国公共卫生部门获得了极有价值的数据,面对这次流感做好了充分的准备。
第三,应用于保险公司。保险公司作为医疗活动的支付方一直处于被动状态。面对过度医疗、骗保等各种问题一直束手无策。虽然想出各种办法应对,但是需要付出大量人力、物力、财力,才能取得很小的成效。但是,通过对大数据分析来促进整个医疗系统的价格透明度。促使保险公司、医院、医生之间建立新的合作关系,并搭建可能对提高价格透明度有所帮助的新的绩效薪酬模式。保险公司将会越来越多地参与患者的诊疗过程。
大数据与典型的关系数据库不同。这对于CIO或IT主管来说是显而易见的,但是对两个系统如何不同的简要解释将说明为什么大数据目前正在进行中 ,但仍然拥有如此巨大的潜力。
大数据和关系数据库最大的区别在于大数据没有关系数据库所具有的传统的表格和列结构。在经典的关系型数据库中,需要一个数据模式(例如,人口统计数据位于一个表中,通过像患者标识符这样的共享标识符连接到其他表)。每一块数据都存在于其明确的位置。相比之下,大数据几乎没有任何结构。数据是以原始形式从源系统中提取的,存储在一个庞大的,有点混乱的分布式文件系统中。 Hadoop分布式文件系统(HDFS)以简单的分层形式存储多个数据节点的文件目录。通常,数据以高度压缩的形式存储在数据节点中的64MB块(文件)中。
由于其非结构化的性质和开源的根源,大数据的拥有和操作比传统的关系数据库要便宜得多。 Hadoop集群由廉价的商品硬件构建而成,它通常以直连(DAS)配置的传统磁盘驱动器而不是昂贵的存储区域网络(SAN)运行。大多数关系数据库引擎都是专有软件,需要昂贵的许可和维护协议。关系数据库还需要重要的专业资源来设计,管理和维护。相比之下,大数据不需要太多的设计工作,而且维护起来相当简单。大量的存储冗余允许更多可容忍的硬件故障。 Hadoop集群旨在简化失败节点的重建。
现状,路还很长
去年10月,国家健康医疗大数据中心及产业园试点在南京江北新区开展建设。今年10.28,国家健康医疗大数据展示中心正式开馆,标志着一期工程圆满完成。
健康医疗大数据涵盖每个居民全生命周期的健康状况,居民健康档案和电子病历是其主要的数据来源。除了医疗数据,还包括健康、保健、预防等数据。简单来说就是,一个孩子从出生开始,降生信息、疫苗接种信息等就已经实时更新在一份专属健康档案里。2016年10月起,千百万人的电子健康档案陆续生成,汇聚起一个庞大的大数据库。
另外还有一些基层的医疗卫生机构,会主要针对65岁以上的老人开展健康管理服务,提供了庞大的数据量。
但大数据的“大”,除了数据收集量的庞大,还需要实现数据互联互通。比如计划免疫系统和疫苗接种系统间有很多重复信息,如果各为“信息孤岛”就会徒增工作量。如果相互关联的数据真正流动起来,一个身份证号就可以将一切贯通。
大数据分析在选择病毒疫苗中起着关键作用。现在,这听起来像是科幻小说的摘录。但是实际上,现代大数据分析技术的实际应用可以改善当今的生活。
在大数据分析在病毒疫苗研究中的应用中,我们将为您讲述一个有趣的故事。我们将讨论病毒(非计算机类型),流行性感冒以及第一种疫苗的发明方法。最重要的是,我们将讨论一些用于分析生物学数据的大数据分析技术和工具。此外,我们还将讨论基因组数据的一种基本可视化技术:系统发育树。我们将在预测流行性感冒的变化并为病毒的未来行为建模时看到如何实施树木。到本文结尾,您甚至将学习有关平台的知识,在这里您可以存储和分析基因数据。
但是,让我们一次迈出一步。首先,我们将研究一般的病毒及其功能。
病毒疫苗:病毒机制,又称病毒生命周期
什么是病毒?