第一篇:金豆数据携手国家健康医疗大数据北方中心,共同推进健康医疗大数据发展
金豆数据签约国家健康医疗大数据北方中心,共同推进健康医疗大数据发展
作者:市场部-陈笑、叶荔
7月2日,由中国卫生信息与健康医疗大数据学会、中国企业联合会、中国老年保健医学研究会共同主办,济南市政府承办的国家健康医疗大数据北方中心产业合作对接洽谈会在济南召开,吸引了130余家企业、43家机构约500人参会。
中国企业联合会、中国企业家协会会长王忠禹,中国卫生信息与健康医疗大数据学会会长金小桃,省委常委、市委书记王忠林,十一届省政协副主席雷建国,市委副书记、市长孙述涛,中国老年保健医学研究会会长高松柏,市委常委、秘书长蒋晓光,市委常委、副市长卢江分别出席会议。中国卫生信息学会健康医疗大数据老年保健专业委员会副会长、金豆数据CEO火立龙参与会议,并在会议上做重要汇报。
金豆数据CEO火立龙在会上做企业介绍
今年4月,山东省和济南市签约成为我国首个启动国家健康医疗大数据中心建设的试点省市,国家健康医疗大数据北方中心正式落户济南。此次洽谈会旨在加强企业和机构之间的合作联系、项目对接,进一步推动和促进国家健康医疗大数据北方中心建设。
中国卫生信息与健康医疗大数据学会会长金小桃在致辞中表示,健康医疗大数据是促进健康事业、健康产业乃至整个国民经济发展的新动能、新模式、新生态。抓住机遇乘势而上,必将对山东省及济南市的新旧动能转换、经济发展带来广泛而深远的影响。希望参会企业能积极参与到国家健康医疗大数据北方中心建设发展中来,实现互利共赢,促进共同发展。
济南市委副书记、市长孙述涛在致辞中指出,大数据像土地、石油一样是新产业、新业态的支撑基础,是取之不尽用之不竭的富集金矿。济南要把国家健康医疗大数据北方中心作为建设医疗康养名城的支撑平台,把健康医疗大数据产业作为新一轮经济发展的支撑产业,不断促进济南市健康医疗事业和产业加快发展、高质量发展。
会议签约仪式现场
签约仪式上,火立龙代表金豆数据与济南市政府以及济南国际医学科学中心进行战略合作意向签约,其中重要一项便是“DRG收付费及绩效评价综合管理项目”。此合作将按照国家试点工程规划落地要求,落实国家试点工程应用,形成健康医疗服务新模式、新业态,提高人民群众健康医疗服务的获得感。
会后,火立龙表示,金豆数据作为国内最早开始专注医疗大数据技术研究的团队之一和C-DRG收付费试点地区的技术支撑方,将以实施国家试点工程为重点,协同打造国家健康医疗大数据北方中心综合试验区,努力突破核心技术,确保医疗大数据安全应用,推动国家基础性健康医疗大数据建设,实现健康中国梦。
第二篇:大数据+精准医疗
大数据+精准医疗
2012年全国居民慢性病死亡率为533/10万,占总死亡人数的86.6%。心脑血管病、癌症和慢性呼吸系统疾病为主要死因,占总死亡的79.4%,其中心脑血管病死亡率为271.8/10万,癌症死亡率为144.3/10万(前五位分别是肺癌、肝癌、胃癌、食道癌、结直肠癌),慢性呼吸系统疾病死亡率为68/10过标化处理后,除冠心病、肺癌等少数疾病死亡率有所上升外,多数慢性病死亡率呈下降趋势。慢性病的患病、死亡与经济、社会、人口、行为、环境等因素密切相关。一方面,随着人们生活质量和保健水平不断提高,人均预期寿命不断增长,老年人口数量不断增加,我国慢性病患者的基数也在不断扩大;另一方面,随着深化医药卫生体制改革的不断推进,城乡居民对医疗卫生服务需求不断增长,公共卫生和医疗服务水平不断提升,慢性病患者的生存期也在不断延长。慢性病患病率的上升和死亡率的下降,反映了国家社会经济条件和医疗卫生水平的发展,是国民生活水平提高和寿命延长的必然结果。当然,我们也应该清醒地认识到个人不健康的生活方式对慢性病发病所带来的影响,综合考虑人口老龄化等社会因素和吸烟等危险因素现状及变化趋势,我国慢性病的总体防控形势依然严峻,防控工作仍面临着巨大挑战。
大数据的分析和应用都将在医疗行业发挥巨大的作用,提高医疗效率和医疗效果。
一、临床操作
在临床操作方面,有5个主要场景的大数据应用: 1.比较效果研究
通过全面分析病人特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定病人的最佳治疗途径。
基于疗效的研究包括比较效果研究(Comparative Effectiveness Research,CER)。研究表明,对同一病人来说,医疗服务提供方不同,医疗护理方法和效果不同,成本上也存在着很大的差异。精准分析包括病人体征数据、费用数据和疗效数据在内的大型数据集,可以帮助医生确定临床上最有效和最具有成本效益的治疗方法。医疗护理系统实现CER,将有可能减少过度治疗(比如避免那些副作用比疗效明显的治疗方式),以及治疗不足。从长远来看,不管是过度治疗还是治疗不足都将给病人身体带来负面影响,以及产生更高的医疗费用。
2.临床决策支持系统
临床决策支持系统可以提高工作效率和诊疗质量。目前的临床决策支持系统分析医生输入的条目,比较其与医学指引不同的地方,从而提醒医生防止潜在的错误,如药物不良反应。通过部署这些系统,医疗服务提供方可以降低医疗事故率和索赔数,尤其是那些临床错误引起的医疗事故。在美国Metropolitan儿科重症病房的研究中,两个月内,临床决策支持系统就削减了40%的药品不良反应事件数量。
3.医疗数据透明度
提高医疗过程数据的透明度,可以使医疗从业者、医疗机构的绩效更透明,间接促进医疗服务质量的提高。
根据医疗服务提供方设置的操作和绩效数据集,可以进行数据分析并创建可视化的流程图和仪表盘,促进信息透明。流程图的目标是识别和分析临床变异和医疗废物的来源,然后优化流程。仅仅发布成本、质量和绩效数据,即使没有与之相应的物质上的奖励,也往往可以促进绩效的提高,使医疗服务机构提供更好的服务,从而更有竞争力。
4.远程病人监控
从对慢性病人的远程监控系统收集数据,并将分析结果反馈给监控设备(查看病人是否正在遵从医嘱),从而确定今后的用药和治疗方案。
2010年,美国有1.5亿慢性病患者,如糖尿病、充血性心脏衰竭、高血压患者,他们的医疗费用占到了医疗卫生系统医疗成本的80%。远程病人监护系统对治疗慢性病患者是非常有用的。远程病人监护系统包括家用心脏监测设备、血糖仪,甚至还包括芯片药片,芯片药片被患者摄入后,实时传送数据到电子病历数据库。举个例子,远程监控可以提醒医生对充血性心脏衰竭病人采取及时治疗措施,防止紧急状况发生,因为充血性心脏衰竭的标志之一是由于保水产生的体重增加现象,这可以通过远程监控实现预防。更多的好处是,通过对远程监控系统产生的数据的分析,可以减少病人住院时间,减少急诊量,实现提高家庭护理比例和门诊医生预约量的目标。
5.对病人档案的先进分析
在病人档案方面应用高级分析可以确定哪些人是某类疾病的易感人群。举例说,应用高级分析可以帮助识别哪些病人有患糖尿病的高风险,使他们尽早接受预防性保健方案。这些方法也可以帮患者从已经存在的疾病管理方案中找到最好的治疗方案。
二、付款/定价 对医疗支付方来说,通过大数据分析可以更好地对医疗服务进行定价。以美国为例,这将有潜力创造每年500亿美元的价值,其中一半来源于国家医疗开支的降低。
1.自动化系统
自动化系统(例如机器学习技术)检测欺诈行为。业内人士评估,每年有2%~4%的医疗索赔是欺诈性的或不合理的,因此检测索赔欺诈具有巨大的经济意义。通过一个全面的一致的索赔数据库和相应的算法,可以检测索赔准确性,查出欺诈行为。这种欺诈检测可以是追溯性的,也可以是实时的。在实时检测中,自动化系统可以在支付发生前就识别出欺诈,避免重大的损失。
2.基于卫生经济学和疗效研究的定价计划
在药品定价方面,制药公司可以参与分担治疗风险,比如基于治疗效果制定定价策略。这对医疗支付方的好处显而易见,有利于控制医疗保健成本支出。对患者来说,好处更加直接。他们能够以合理的价格获得创新的药物,并且这些药物经过基于疗效的研究。而对医药产品公司来说,更好的定价策略也是好处多多。他们可以获得更高的市场准入可能性,也可以通过创新的定价方案,更有针对性疗效药品的推出,获得更高的收入。
在欧洲,现在有一些基于卫生经济学和疗效的药品定价试点项目。
三、研发
医疗产品公司可以利用大数据提高研发效率。拿美国为例,这将创造每年超过1000亿美元的价值。
1.预测建模
医药公司在新药物的研发阶段,可以通过数据建模和分析,确定最有效率的投入产出比,从而配备最佳资源组合。模型基于药物临床试验阶段之前的数据集及早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。
2.提高临床试验设计的统计工具和算法 使用统计工具和算法,可以提高临床试验设计水平,并在临床试验阶段更容易地招募到患者。通过挖掘病人数据,评估招募患者是否符合试验条件,从而加快临床试验进程,提出更有效的临床试验设计建议,并能找出最合适的临床试验基地。比如那些拥有大量潜在符合条件的临床试验患者的试验基地可能是更理想的,或者在试验患者群体的规模和特征二者之间找到平衡。
3.临床实验数据的分析
分析临床试验数据和病人记录可以确定药品更多的适应症和发现副作用。在对临床试验数据和病人记录进行分析后,可以对药物进行重新定位,或者实现针对其他适应症的营销。实时或者近乎实时地收集不良反应报告可以促进药物警戒(药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防)。或者在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。
这些分析项目是非常重要的。可以看到最近几年药品撤市数量屡创新高,药品撤市可能给医药公司带来毁灭性的打击。2004年从市场上撤下的止痛药Vioxx,给默克公司造成70亿美元的损失,短短几天内就造成股东价值33%的损失。
四、更具体一些,大数据已经得到实际应用的已经有如下场景
1.组学大数据精准医疗
人类通过开展组学研究及不同组学间的关联研究,从环境、生活方式和行为等暴露组学,至个体细胞分子水平上的基因组学、表观组学、转录组学、蛋白组学、代谢组学、宏基因组学,再到个体健康和疾病状态的表型组学等。利用大数据将各种组学进行综合及整合,既能为疾病发生、预防和治疗提供全面、全新的认识,也有利于开展个体化医学,即通过系统整合生物医学与临床数据,可以更准确地预测个体患病风险和预后,有针对性地实施预防和治疗。
2.大数据虚拟药物研发
快速识别生物标志物和研发药物。利用某种疾病患者人群的临床数据和组学数据,可以快速识别有关疾病发生、预后或治疗效果的生物标志物。在药物研发方面,医学大数据使得人们对病因和疾病发生机制的理解更加深入,从而有助于识别生物靶点和研发药物。同时,充分利用海量临床数据和组学数据、已有药物的研究数据和高通量药物筛选,能加速药物筛选过程。
3.生物大数据流行病防治
快速筛检未知病原和发现可疑致病微生物。通过采集未知病原样本数据,对病原进行测序,并将未知病原与已知病原的基因序列进行比对,从而判断其为已知病原或与其最接近的病原类型,据此推测其来源和传播路线、开展药物筛选和相应的流行疾病防治。
4.互联网大数据公卫监测
利用互联网大数据以及有关专业数据实时开展公共卫生监测。公共卫生监测包括传染病监测、慢性非传染性疾病及相关危险因素监测、健康相关监测,如出生缺陷监测、食品安全风险监测等。此外,还可以通过覆盖全国的患者电子病历数据库进行疫情监测,通过监测社交媒体或频繁检索的词条来预测某些传染病的流行。
5.大数据健康管理
实时开展大数据健康管理,通过可穿戴设备对个体体征数据,如心率、脉率、呼吸频率、体温、热消耗量、血压、血糖、血氧、体脂含量等数据的实时、连续监测和流数据挖掘、分析,提供实时健康指导与建议,更科学地实施个性化健康管理。
6.大数据疾病谱研究
了解人群疾病谱的改变,这有助于制定新的疾病防治策略。全球疾病负担研究是一个应用大数据的实例,该研究应用的数据范围广、数据量巨大,近4700台并行台式计算机完成了数据准备、数据仓库建立和数据挖掘分析的自动化和规范化计算,应用大数据研究人群疾病谱。
7.大数据人群队列研究
以大数据为导向的人群队列研究逐渐成为医学研究的热点。超大规模队列研究具有大样本-如数十万人群,前瞻性-如数十年长期随访,多学科-如基础、临床、预防、信息等多学科合作,多病种-如对多种疾病进行研究,多因素-如探讨多种危险因素,整合性-如监测系统、信息系统、医保系统的整合,共享性-如生物标本和数据资源的共享,等特点,经过长期随访能够产出大量人群数据,基于大数据的人群队列研究更具有科学性、可靠性和权威性。
第三篇:医疗大数据及精准医疗
医疗大数据及精准医疗
谢邦昌
台北医学大学管理学院及大数据研究中心院长/主任
大数据的趋势以及价值是现在最热门的话题,也改变了许多企业经营的方式,对于各行各业来说是势必是一个大挑战,能否将大数据的力量从危机到转机就要看现代经营者有没有转变传统型态的思维?
首先什么是大数据?传统数据一年的数据量大概为3TB左右,以现今数据来说一天的资料量为50TB,由这简单的数据量差就可以得知传统数据跟现今数据的差异多么庞大,也就是现在俗称的大数据时代。数据庞大之下,不管是银行业、传统零售业、社会建设公共方面甚至是医疗保健产业对数据处理、分析方式以及经营企业的模式将会有所改变。
在过往的医疗诊断历史,到医院看病时必须耗费许多时间等待看诊,而医生看诊又要再花费时间。当医生要求病患拍摄X光片或检验时,又要再花额外许多时间诊断。而在现今医疗信息高度发展的台湾,看诊程序从网络挂号、候诊顺序、诊间病历调阅、医师医令、处方开立、放射影像存取、检查检验数据储存等,无数的数据信息便在医院中传递、交换、储存。同时大多数的生理检验信息在你回诊时得以从电子病历中检索,这些我们认为理所当然的信息处理,在台湾我们只要花费少许的时间如一个早上便完成了,而这一切正是仰赖医学信息分析与医疗大数据的交换处理。
医学大数据的产生,主要归功于医疗设备数字化及电子化病历发展两大领域的突破,透过仪器数字化,医院得以获得更多病人疾病与健康信息纪录。而在病人医疗诊断方面,为了完善纪录病患个人资料、诊断数据与过往医疗纪录等,即促成了电子病历系统发展。医学大数据发展由过去纸张记录、纸本信息数字化、医学纪录储存到现今多信息整合,其数据量有着爆炸性的成长,不仅由过去个人社经信息、诊断信息等文字媒介,更拓展到多媒体影像信息,如X光影像,动态视讯影像信息,如核磁共振MRI以及电讯号信息,如心电图等等,这些庞大医学数据的汇集与高度整合技术能力,正是台湾医学信息领域发展领先的原因,同时更显得医学数据发展的多元应用及其重要性。
而由医疗健保产业来说,个人医疗信息终端的产生给医疗产业带来革命性的变化,连结了传统医院、政府(社会保障)、保险公司、药物生产公司等相关产业,形成新的行业生态圈。将互联网+医疗保健去建构一个智能的健康系统,在整个健康系统下会有智能的合作伙伴,包含医院、医生、诊所、学术中心、保险公司、药厂、医疗设备制造商、政府等相关人员等,接着产生出个人化的护理体系,其中包含个人健康、成本节约、提高效率、病人教育、增强通信、绩效度量、预防等相关内容,使得人们有着更健康的社会。
经常听到的医疗云、照护云以及健康云都是运用云端技术结合大数据去提供健康咨询的服务。在网络普及下,人手一台智能型手机让这些云更能够去发挥,客户只需要使用健康感知的终端,其中包含穿戴型装置、爱睡宝、电视机以及相关的智能型测量装置,就能够让亲人、医生以及相关的护理人员得知目前的身体状态,不仅如此,还可以远程监护以及远程门诊,一切都透过远程医疗平台让人们有着安全、方便、快速及健康舒适的生活环境。
大数据在生技医疗卫生发展状况及应用,大数据已深耕于经济领域且创造了巨大的经济价值
美国的大数据产业已经创造了巨大的价值,具体表现在:大数据使美国医疗服务质量得到提高。
对于医疗服务的提供方和支付方来说,在减少医疗成本的同时不断提高医疗质量和效率仍然是一个难以实现的目标,而这也是改善民生的重大机遇。2010年,全美医疗支出占国内生产总值的17.9%,比2000年增长13.8%。而且,某些慢性疾病如糖尿病的患病率正在增加,正在消耗更多的医疗资源。
对这些疾病和其他相关健康服务的管理将深刻地影响国家的福祉。在这方面大数据可以发挥作用。为在广大人群中取得最有效的医疗效果,更多地使用电子健康记录(电子健康档案),并与新的分析工具相结合,将提供挖掘信息的机会。研究人员可以利用信息寻找有效的统计趋势,并依据真实的医疗服务质量开展医疗评估。
大数据在医疗及生技业之应用
医疗及生技业大数据应用的当前需求来自疫情和健康趋势分析、电子病例、医学研发、临床试验等领域。
疫情和健康分析趋势
利用大数据进行疫情分析,说明这个地方可能处于某种疾病蔓延,实时掌握病情。
Google和疾管局一样能够掌握流感疫情
2009年又冒出了一种新的流感病毒,称为H1N1。这种新菌株结合了禽流感和猪流感病毒,迅速蔓延。短短几星期内,全球的公共卫生机构都忧心忡忡,担心即将爆发流感大流行。有些人发出警讯,认为这次爆发可能与1918年的西班牙流感不相上下,当时感染人数达到五亿人,最后夺走数千万人的性命。雪上加霜的是,面对流感可能爆发,却还没有能派上用场的疫苗,公共卫生当局唯一能努力的,就是减缓其蔓延的速度。为了达到这项目的,必须先知道当前流行感染的范围及程度。在美国,疾病管制局(CDC)要求医生一碰到新流感病例,就必须立刻通报。即使如此,通报的速度仍然总是慢了病毒一步,大约是慢上一到两星期。毕竟,民众觉得身体不舒服之后,通常还是会过个几天才就医,而层层通报回到疾管局也需要时间,更别提疾管局要每星期才整理一次通报来的数据。但是面对迅速蔓延的疫情,拖个两星期简直就像是拖了一个世纪,会在最关键的时刻,让公共卫生当局完全无法掌握真实情况。
说巧不巧,就在H1N1跃上新闻头条的几星期前,网络巨擘Google旗下的几位工程师,在著名的《自然》科学期刊发表了一篇重要的论文,当时并未引起一般人的注意,只在卫生当局和计算机科学圈里引起讨论。该篇论文解释了Google能如何「预测」美国在冬天即将爆发流感,甚至还能精准定位到是哪些州。谷歌的秘诀,就是看看民众在网络上搜寻些什么。由于Google每天会接收到超过三十亿笔的搜寻,而且会把它们全部储存起来,那就会有大量的数据得以运用。
Google先挑出美国人最常使用的前五千万个搜寻字眼,再与美国疾病管制局在2003年到2008年之间的流感传播数据,加以比对。Google的想法,是想靠着民众在网络上搜寻什么关键词,找出那些感染了流感的人。虽然也曾有人就网络搜寻字眼做过类似的努力,但是从来没人能像Google一样掌握巨量数据(big data,直译为大数据),并具备强大的处理能力和在统计上的专业技能。
虽然Google已经猜到,民众的搜寻字眼可能与流感有关,像是「止咳退烧」,但相不相关其实不是真正的重点,他们设计的系统也不是从这个角度出发。Google这套系统真正做的,是要针对搜寻字眼的搜寻频率,找出和流感传播的时间、地区,有没有统计上的相关性。他们总共用上了高达4亿5千万种不同的数学模型,测试各种搜寻字眼,再与疾管局在2007年与2008年的实际流感病例加以比较。这套软件找出了一组共四十五个搜寻字眼,放进数学模型之后,预测结果会与官方公布的全美真实数据十分符合,有强烈的相关性。
于是,他们就像疾管局一样能够掌握流感疫情,但可不是
一、两星期之后的事,而是几近实时同步的掌握!因此,在2009年发生H1N1危机的时候,比起政府手中的数据(以及无可避免的通报延迟),Google系统能提供更有用、更及时的信息。公卫当局有了这种宝贵的信息,控制疫情如虎添翼。
最惊人的是,Google的这套方法并不需要去采集检体、也不用登门造访各家医院诊所,而只是好好利用了巨量数据,也就是用全新的方式来使用信息,以取得实用且价值非凡的见解、商机或服务。有了Google这套系统,下次爆发流感的时候,全球就有了更佳的工具能够加以预测、并防止疫情蔓延。
电子病例
将分散在医院中的各个部门、各式各样的病例集中在云端,医生们可透过语意搜查找出任何病例中的相关讯息,进而为医学诊断提供更加丰富的数据。可提供以病患为中心的个人化疗程建议,或帮助对医疗问题及其患病率进行自动诊断。台湾的医疗黑金:健保数据库 Google台湾董事总经理简立峰曾表示:「我认为最有价值的宝藏,就是台湾的全民健保数据库。」,台湾医疗产业贯穿上下游的数据,全在健保数据库里面,而且几乎所有人都要加入,全世界只有台湾拥有如此完整的数据库。美国麻省理工学院电机与计算机科学院教授约John Guttag也说,相较于美国,台湾的健保是由政府买单,这让医疗数据取得变得容易,「这是台湾的机会,未来也很有机会从中获利。」
累积15年来、2千3百万人民的健保数据库,正等待着识货的伯乐来挖宝。台中荣总医生、阳明大学教授吴俊颖以亲身经验说明,过去医学界只知道,幽门螺旋杆菌跟胃癌有关,但是却没有规模够大、时间够长的临床实验可以证实,他与研究团队藉由探勘台湾的健保数据库,发现服药根除幽门螺旋杆菌,可以降低胃癌的发生率。
这篇论文不只发表在肠胃科排名第一的杂志《肠胃病学》上,更震撼了日本医学界。日本是全球胃癌罹患率最高的国家,当地医生特别把这篇论文翻译成日文,并且说服日本厚生省,对幽门螺旋杆菌感染患者全面给付杀菌疗程,不仅影响医师的临床运作、政府决策,甚至有可能改变国际性医疗行为准则。
吴俊颖认为,台湾的健保数据库内容巨细靡遗,所有医疗项目都记录得一清二楚,「它像是永不干涸的黑金,当数据越来越多串联和使用,就会越来越有价值。」然而,吴俊颖也提到,健保数据库有个缺点,就是缺乏诊断和检测结果。麻省理工学院教授Peter Szolovits也曾举例说明过,如果有一位病患发现关节肿起来,医生跟他说这「疑似」是风湿性关节炎,因此记录风湿性关节炎的费用,可能后来病人发现根本不是这个病,如果把这笔数据用在风湿性关节炎的医疗研究上,那就会变成糟糕的数据,影响研究结果。
「如果能够把健保数据库与医院病历的数据库做结合,那它就会变成最完美的医疗数据库!」吴俊颖提到,病历数据包含检测和治疗的结果,不只对于台湾医疗产业来说非常有价值,国内外的生技和医药大厂,也都会抢着要跟台湾合作。想象一个情境,有天当你到南部度假,突然感到身体不适,就近到当地的诊所就医。第一次跟你见面的医生,登入全台湾共享的医疗数据库,调出你在其他医院的病历数据,花几分钟就能对你的身体了如指掌,还能透过临床决策辅助系统,显示出跟你有相同症状的病友群体、使用各种药物的治疗状况,透过大数据分析可以协助医生在最短时间内,找出最适合的治疗方式。
「很多人以为这样的愿景,离现实生活非常遥远,其实台湾已经走在半路上了。」台大医院竹东分院院长王明巨如此说道。的确,台湾医疗机构的病历电子化程度很高,很有可能成为全球第一个全国医院流通电子病历的国家。医学研发
运用实时监测及分析大量的仪器数据,建构预测模型,并利用统计工具改善临床试验设计,分析临床试验数据。发展个人化医学及疾病发作模式等医疗研发。利用大数据解决多发性硬化症的算法运算复杂度
位于水牛城的纽约州立大学(SUNY)是一个领先全球的多发性硬化症(MS)研 究中心。MS是一种具破坏性的、面性的神经系统疾病,影养全球近百人。这种疾病会使人的大脑和骨随发炎并产生神经病,导致患者可能出现行动不便、视力受损、疼痛等症状。
MS的病因是很复杂的,没有一个单一基因是可能的致病源。因此自2007年以来,SUNY就一直希望透过扫描MS患者的基因组的变化来开发新的治疗方式,透过从原本成千上万的基因序列的变异SNP,SNP指的是单核桃多型性,来获得单一样品,研究基因产物和其他基因产物及环境因素进行的交互作用。
研究人员的想法是以多个SNP变异点结合不同的环境变因,并使用一种被称之为「AMBIENCE」的算法,来检测县性和非线性两种数据数据中的相关性,以识别这些交互作用之间的关系。但是这个想法就如同大海捞针,因为环境变因包括像是实验对象曝晒太阳的时间长短、维生素D产生的量、吸烟的情况等皆有可能影响研究结果。况且人类的基因由23对染色体所组成,其中包含约30亿个DNA碱基对,这些因变量和应变量数量多到吓人,必须靠建构一套计算量高达1018的高等分析模型才能解决。
因此SUNY与IBM合作,建构一套搭配软硬件的数据分析系统,以往平均需要27.2小时的工作,缩短到现在只要11.7分钟即可完成。而且这套系统不仅大大简化和加速了复杂的分析过程,还提供了不同类型的变量值,如:分类变量、分配卜瓦松变量或连续常态变量等。过去,只要研究中增加一个新的变量值,研究团队就必须重新编写整个算法,而现在只需按几个键即可完成。
大数据系统分析的应用除了MS的研究以外,全球估计超过3300万人感染,至今没有方法可以完全治愈的艾滋病,以及罕见疾病等,都已开始利用大数据进行大型的医学研究。
临床实验
临床试验藉由大数据而有了重大的改变,可利用临床验数据、仪器读数等,进行比较效果研究、临床决策支持系统、远距病人监测及加强医学数据透明度等方面。
拥有数据数据保护的早产儿
所谓的早产儿是指怀孕不到37周就提早出世的宝宝。这些提早降临人世的小仙子,如果出生后体重不到1500公克,很可能会因为免疫系统尚未发育完全而受到感染,一旦感染之后就很容易引起呼吸衰竭、肺出血及败血症。
不过,加拿大多伦多市立儿童医院里的早产儿,却可以睡得特别安详,因为他们是有数据数据保护的「data baby」。随着医疗设备的发展,利用医疗监测仪器监测病患的生命征象,如血压、心跳和体温等,已经是非常普遍的事了。通常这些仪器还具有警报功能,一旦生理的数据数值超出正常范围时就会发出警示,医疗人员就会采取因应行动。但是即使医术再精湛、经验再丰富的医护人员,可能也无法准确地察觉这些异常的发生时间和严重性,尤其当发生在脆弱的早产儿生身上。根据美国弗吉尼亚大学追踪以往的数据显示,新生儿受到感染初期的12到24小时,因为脉搏和心跳几乎都可在接受的范围内,因此医护人员很难从生命征象数据的改变中察觉,等到警示灯响起,常常为时已晚。
连续监测和记录这些生理性数据,可以观察出新生儿是否遭受感染的早期征兆,但数据量实在太过庞大了。估计这些监测设备每一秒钟就会产生1000个读数。以往是30到60分钟由医护人员归纳出一个数据做为纪录,然后储存72小时。如果要把这些读数统统记录起来,根本是不可能的事。
但这项不可能的任务,并没有吓跑安大略省理工学院和IBM。他们使用来自怀生研究中心的最新技术,利用江河运算平台支持大量数据的收集和分析,一天24小时不间断地收集和记录着包括早产儿的体温、心跳、血氧饱和浓度和血压等电子监测仪器产生的大量数据,以及周遭环境如温度、湿度等相关数据。在保护病人的隐私安全考虑下,这些数据会直接传到安大略省理工学院研究中心和IBM华生研究中心;系统会分析和研究哪些因素的交互作用会造成感染,甚至哪几床的新生儿因为符合条件较多,可能出现疾病或感染的风险较大。之后,系统再将分析结果提供给医护人员比较判读。这些动作都在数秒内完成。藉由这项计划,儿童病房里的医护人员已经可以提前18到24小时,预防新生儿败血症的发生。
由于大数据在规模(Volume)、增加速度(Velocity),以及价值性(Value)上正呈现几何上升,而其数据所表现的多样性变化(Variety)与数据的有效性(Validation),更容易成为企业的风险源头。面对排山倒海而来的大数据,企业需运用大数据,迅速将数据转化成商业智能,运用分析信息,提升市场的洞察能力,做出更准确的营运决策。例如:电信业者可以分析手机在基地台漫游的特性,提供更好的在地费率;信用卡业者可以每天定期分析各种信用贷款所产生的风险,动态调整信贷利率;便利超商可以分析消费者的购买习惯,动态调整架上存货数量等;制造业者可透过现场制造系统所记录的大量在线实时生产数据进行分析,以协助制造业改善制程、提升良率,并减少物料浪费。因此大数据将是企业未来所面临的关键挑战。鉴于目前信息以超乎想象的速度产生、累积、消逝,而企业所面临的商机亦有相同的循环表现。透过海量信息的实时性分析与运用,将可对不同信息的需求者,产生不一样的价值与意义。若能持续在既有的数据中发掘价值,同时考虑动态信息所带动的巨大冲击,并藉此掌握瞬息万变的市场契机,则大数据的分析与应用,将有助于各类型企业在相关营运领域中,引领下一阶段的企业永续发展。基于以上的发展潮流与态势,麦肯锡(Mckinsey)管理顾问公司于2010年已指出未来引领企业发展趋势的十大科技,其中即包含了大数据的获取与分析、云端运算服务的公共价值,以及企业多层面的参与互动及服务。在这些技术与行动通讯网络的整合应用下,企业未来所产生的数据量将呈现倍数成长,并导致过去传统的储存技术即将遇到瓶颈,因此,虚拟化的云端运算分析技术,以及大数据的管理,将成为各方面所即将面临处理的新课题。从目前的技术发展 来看,未来各项实体化设施,将可能在未来藉由虚拟化的技术,得以降低各项成本的支出,然而云端运算与大数据的应用,绝非仅为建置一个大型数据中心即可,对于后续所产生大量数据下的数量管控、数据的质量与分析结果,以及这些数据所衍生之相关应用与服务,才是现阶段所应关心的重点。计算设施(Computer)网络设施(Network)储存设施(Storage)数据数量管控数据应用服务数据质量分析虚拟化(Virtualization)为了结合技术、数据,以及应用分析与服务等三项议题的探讨,本演讲大数据主要阐述BIG DATA 在生技医疗卫生上之应用与研究;抛砖引玉系望能激起大家投入医疗大数据的研究!
第四篇:对医疗大数据的认识
重庆大学研究生文献综述
对医疗大数据的认识
姓
名: 学
号: 指导教师: 专
业:
重庆大学光电工程学院
二O一六年十一月 医疗大数据产生的背景
在任何一个初具规模的医院,每天接待上万的患者前来就诊,患者的基本信息、影像信息与其他特殊诊疗信息汇集在一起是一个庞大的数据。据统计,上海市区域医疗信息平台(上海市“医联工程”及县区卫生数据中心)已经积累了覆盖3900万人群、1400TB数据量的电子诊疗与健康档案等医疗卫生数据(涵盖了全市38家三级医院3900万就诊人群的医疗信息,包括患者基本信息、就诊信息、健康档案、检验及影像检查报告、医学影像图像文件、住院相关病历、医保结算等医疗卫生数据,涉及就诊记录2.1亿条,处方记录9.1亿条)。
日积月累,这个数据量将会持续快速增长,为医院的数据存储、集成、调用等应用带来巨大压力。除了数据规模巨大之外,医疗行业的数据类型和结构极其复杂,如PACS影像、B超、病例分析等业务产生的非结构化数据,这些数据存储复杂,并且对传统的处理方法和技术带来巨大挑战【1】。医疗大数据得到人们的关注,并渴望有一种新的技术可以从这些看似杂乱无章的数据中得到价值。目前,为了提高人们的健康水平以及医疗水平,医疗行业在大数据环境下的各个领域异常活跃[2]。医疗大数据的相关概念
2.1 医疗大数据的定义
医疗数据是医生对患者诊疗和治疗过程中产生的数据,包括患者基本数据、入出转数据、电子病历、诊疗数据、医学影像数据、医学管理、经济数据等,以患者为中心,成为医疗信息的主要来源。
随着医疗卫生信息化建设进程的不断加快,医疗数据的类型和规模正以前所未有的速度快速的增长,以至于无法利用目前主流软件工具,在合理的时间内达到撷取、管理并整合成为能够帮助医院进行更积极目的经营决策的有用信息。规模巨大的临床实验数据、疾病诊断数据以及居民行为健康数据等汇聚在一起形成了医疗大数据。
2.2 医疗大数据的主要来源
2.2.1 制药企业、生命科学
药物研发所产生的数据是相当密集的,对于中小型的企业也在百亿字节(TB)以上的。在生命科学领域,随着计算能力和基因测序能力逐步增加,美国哈弗医学院个人基因组项目负责人詹姆·鲍比就认为,到2015年,将会有5000万人拥有个人基因图谱,而一个基因组序列文件大小约为750MB[3]。
2.2.2 临床医疗、实验室数据
临床和实验室数据整合在一起,使得医疗机构面临的数据增长非常快,一张普通CT图像含有大约150MB的数据,一个标准的病理图则接近5GB。如果将这些数据量乘
以人口数量和平均寿命,仅一个社区医院积累的数据量就可达数万亿字节甚至数千万亿字节(PB)之多。
2.2.3 费用、医疗保险、利用率
患者在就医过程中产生的费用信息、报销信息、新农合基金使用情况等。
2.2.4 健康管理、社交网络
随着移动设备和移动互联网的飞速发展,便携化的生理设备正在普及,如果个人健康信息都能连入互联网,那么由此产生的数据量将不可估量。
2.3 医疗数据的基本类型
2.3.1 医院信息系统(HIS)数据
HIS是医院的核心系统,是对医院及其所属各部门的人流、物流、财流进行综合管理的系统,围绕着医疗活动的各个阶段产生相关数据,包括各门诊数据及病房数据两大主流数据流。
2.3.2 检验信息系统(LIS)数据
LIS是HIS的一个重要组成部分,其主要功能是将实验仪器传出的检验数据经分析后,生成检验报告,通过网络存储在数据库中,使医生能够方便、及时的看到患者的检验结果。
2.3.3 医学影像存档和传输系统(PACS)数据
PACS数据主要是将数字化医院影像科室日常核磁、CT、超声、各种X线机、各种红外仪等设备产生的图像存储起来。
2.3.4 电子病历(EMR)数据
EMR不同于以医疗机构为中心的门诊或者住院病历,是真正以患者为中心的诊断和其他检验数据的“数据池”,它将患者诊断过程中生成的影像和信号,如X线检查、CT扫描等纳入电子病历中,并以统一的形式组织起来。
2.4 医疗大数据的特性
2.4.1 数据规模大(volume)
例如一个CT图像含有大约150MB的数据,而一个基因组序列文件大小约为750MB,一个标准的病理图则大得多,接近5GB。
2.4.2 数据结构多样(variety)
相对于其他行业,医学中的数据类型更加多种多样,如电子病案中关于人口学特征的数据为纯文本型;检验科中有关患者生理、生化指标为数字型;影像科中如B超、CT、MR、X线片等为图像资料。
医疗数据通常会包含各种结构化表、非(半)结构化文本文档(XML和叙述文本)、医疗影像等多种多样的数据存储形式。
2.4.3 数据增长快速(velocity)
一方面,医疗信息服务中包含大量在线或实时数据分析处理,例如,临床决策支持中的诊断和用药建议、流行病分析报表生成、健康指标预警等;另一方面,得益于信息技术的发展,越来越多的医疗信息被数字化,因此在很长一段时间里,医疗卫生领域数据的增长速度将依然会很快。
2.4.4 数据价值巨大(value)
毋庸置疑,数据是石油,是资产,是资源,医疗大数据不仅与每个人的个人生活息息相关,对这些数据的有效利用更关系到国家乃至全球的疾病防控、新药品研发和顽疾攻克的能力。
2.4.5 多态性
医疗大数据包括纯数据(如体检、化验结果)、信号(如脑电信号、心电信号等)、图像(如B超、X线等)、文字(如主诉、现/往病史、过敏史、检测报告等),以及用以科普、咨询的动画、语音盒视频信息等多种形态的数据,是区别于其他领域数据的最显著特征。
2.4.6 不完整性
医疗数据的搜集和处理过程经常相互脱节,这使得医疗数据库不可能对任何疾病信息都能全面反映。大量数据来源于人工记录,导致数据记录的偏差和残缺,许多数据的表达、记录本身也具有不确定性,病例和病案尤为突出,这些都造成了医疗大数据的不完整性
2.4.7 时间性
患者的就诊、疾病的发生过程在时间上有一个进度,医学检测的波形、图像都是时间函数,这些都具有一定的时序性。
2.4.8 冗余性
医学数据量大,每天都会产生大量信息,其中可能会包含重复、无关紧要甚至是互相矛盾的记录。医疗大数据的主要应用
根据全球管理咨询公司麦肯锡的一份最新报告显示,医疗保健领域如果能够充分有效地利用大数据资源,医疗机构和消费者便可节省高达4500亿美元的费用[4]。
3.1 服务居民
居民健康指导服务系统,提供精准医疗、个性化健康保健指导,使居民能在医院、社区及线上的服务保持持续性。例如,提供心血管、癌症、高血压、糖尿病等慢病干
预、管理、健康预警及健康宣教(保健方案订阅、推送)。
医疗机构物联网的建设,包括移动医疗、临床监控、远程患者监控等(例如,充血性心脏的标志之一是由于保水而增加体重,通过远程监控体重发现相关疾病,提醒医生及时采取治疗措施,防止急性状况发生),减少患者住院时间,减少急诊量,提高家庭护理比例和门诊医生预约量。
3.2 服务医生
临床决策支持,如用药分析、药品不良反应、疾病并发症、治疗疗效相关性分析、抗生素应用分析;或是制定个性化治疗方案。
3.3 服务科研
包括疾病诊断与预测、提高临床试验设计的统计工具和算法、临床实验数据的分析与处理等方面,如针对重大疾病识别疾病易感染基因、极端表型人群;提供最佳治疗路径。
3.4 服务管理机构
规范性用药评价、管理绩效分析;流行病、急病等预防干预及措施评价;公众健康监测,付款(或定价)、临床路径的优化等。
3.5 公众健康服务
包括危及健康因素的监控与预警、网络平台、社区服务等方面。国内外医疗大数据技术应用现状
4.1 国外医疗大数据技术应用现状
美国远程医疗(telemedicine)公司研制成功了一款功能强大的医疗设备“智能心脏”(smartheart),把手机变成了一款功能齐全的医疗工具,用来监测用户可能存在的心脏病问题。智能心脏与智能手机相连,在安装运行了相应的程序后,手机拥有“医疗级”的心脏监测功能,并能够在30s内在手机屏幕上显示用户的心电图。医生可随时对患者的心脏进行监测和分析,提前做好预防措施。智能心脏解决了心脏病预防方面最关键的问题—时间。这在心脏病预防领域是一项重大的突破性技术。目前,“智能心脏”设备已经开始在网上销售。
意大利电信近期推出了Nuvola It Home Docto 系统,可让在都灵Molinette 医院的慢性病患者通过手机在家中监测自己的生理参数,相关数据将自动的通过手机发送到医疗平台,也可以通过ADSL、WiFi 和卫星网络得到应用。医生通过网页接入这
个平台,及时获取数据并调整治疗方案。
4.2 国内医疗大数据技术应用现状
IBM在上海的部分医院推出了BYOD系统,即员工自费终端,用来提高医生和护士在医院的移动性。通过和开发商合作,推出移动护理应用,将医生和护士的各种移动终端连在同一网络下,便于医生和护士了解患者在医院的位置和健康状况,也提高了医生和护士的移动性。
在上海,医联工程横向覆盖全市三级医院,纵向连通各区属医疗机构,已覆盖3900万患者,建成国内最大的患者诊疗档案库,拥有8.2亿条医嘱、1.8亿个病案、8100万份检验检查报告和107太字节医学影像数据;医联工程在服务医改、支撑资源整合、分布式影像网络会诊、三级医院诊疗信息社区调阅等方面,大幅度提升了区域卫生服务水平。
医联工程建成以来,对于患者,就医更方便,“一院办卡,跨院就医”“就医一站式付费”,共发放1300余万张医联卡,每月提供70万专家预约号源,人均节约就诊时间60min、排队时间45min;对于医生,服务看诊、提高医疗质量,支持每日5000人次实时诊疗档案调阅、1.25万人次重复医疗智能提醒,节约大量医疗费用;对于管理者,实现精细化管理,建成集医疗管理、绩效考核和统计分析为一体的整合平台,为医院管理提供决策支持。医疗大数据安全
5.1 人的安全
医疗大数据安全中“人”的安全,涉及的是数据隐私保护问题。在医疗过程中,患者的个人隐私主要有:在体检、诊断、治疗、疾病控制、医学研究过程中涉及的个人肌体特征、健康状况、人际接触、遗传基因、病史病历等[5]。这些内容还能被分为显性与隐性,显性一般是医嘱、诊断书、X线片、检查结果、报告单、病历、病案、住院患者床头卡等数据;隐性则是指蕴藏在这些数据历的信息,如患者血液组织所蕴含着的基因信息,患者罹患疾病所反应出的生活方式或者折射出的家族遗传历史等。
5.2 数据安全
一是易成为网络攻击的显著目标,在网络空间中,医疗大数据的关注高,其中含有的敏感数据会吸引潜在的攻击者;二是对现有存储或者安全防范措施提出挑战,特别是数据大集中后复杂多样的数据存放在一起,常规的安全扫描手段无法满足安全要求。这些问题将表现在数据资源共享、数据资产界定和盘活,以及数据真实性判断等各个方面。医疗大数据的未来展望
6.1 社会化医学
曾任美国克利夫兰医学中心(Cleveland Clinic)心血管科主任的美国心脏病学家埃里克·托普(Eric Topol),新近出版了一本名为《颠覆医疗》[6]的书,在此书中他认为:互联网的沉浸式和参与式文化培育了消费者,“每10个美国人中就有超过8位在网络上查询与健康相关的问题”,甚至有的“患者会自带着一系列摘自网络的医学问题”去访问医生,对自身病情、疾病和药物的知悉程度较过去高出很多,与此同时,医生的权威性大幅度降低。由此可见,这就是未来的趋势—社会化医学。
6.2 个性化医学
个性化医疗,是指以个人基因组数据位基础,结合蛋白质组和代谢组等相关内环境数据,考察遗传变异、对特定疾病的易感性和对特殊药物的反应的关系,为患者量身设计出最佳治疗方案,以期达到治疗效果最大化和副作用最小化的定制医疗模式。实施个性化医疗,首先针对特定疾病亚群进行分类,然后根据这些亚群的特异性发病机制进行药物开发,最终对这些亚群患者进行针对性治疗。这些涉及医学、生物、环境、社会和心理等诸多因素,传统的数据分析技术会遭遇瓶颈,很难以开展针对性研究,故而引发了大数据技术的介入。在现有研究中,通过对医疗大数据的分析和利用,可以完善个性化医疗。较著名的是德国默克公司正与Regenstrief研究院一起实施的个性化医疗项目。考察遗传变异、对特定疾病的易感染性和对特殊药物的反应三者之间的关系,然后在药物研发和用药过程中考虑个人的遗传变异因素。针对不同的患者采取不同的治疗方案,或者根据患者的实际情况调整药物剂量,可以减少副作用。总结
根据国际数据公司(International Data Corporation,IDC)的预测,中国的大数据市场在2012~2016年将增长5倍,其中最多份额将集中在政府、银行、医疗卫生、电信等四大行业【7】。医疗行业的数据已进入大数据时代,使用大数据库作为工具,将会辅助产生更有效、更加经济的医疗政策,更好的产品和服务[8]医疗大数据为我国带来了机遇的同时也带来了挑战,虽然只是刚刚起步,但是前景还是值得期待的。
参考文献
[1](于广军 杨佳泓主编 医疗大数据 上海科学技术出版社P14)
[2](Kayyali B,Knott D,Van Kuilen S.The big-data revolution in US health care: Accelerating value and innovation[J].Mc Kinsey & Company,2013)[3](David Marco,John Wiley.Building and managing the meta data repository: a full lifecycle guide[M].New York: John Wiley & Sons Inc,2000)
[4](Kayyali B,Knott D,Van Kuilen S.The big-data revolution in US health care: Accelerating value and innovation[J].Mc Kinsey & Company,2013)[5](汤啸天.个人健康医疗信息和隐私权保护[J].同济大学学报:社会科学版,2006,17(3):117-123)
[6](http://)
[7](Inmon W.Building the data warehouse[M].3rd ed.New York: John Wiley & Sons Inc,2002)
[8](郭晓科主编 《大数据》 清华大学出版社 p22)
第五篇:金准人工智能 大数据时代下的健康医疗行业报告
金准人工智能 大数据时代下的健康医疗行业报告
前言
大数据及AI技术在健康医疗领域应用场景包括、辅助决策、健康/慢病管理、机构智能化管理、基因数据等。预计2019年,辅助决策类中的影像辅助诊断将首先落地,主要因为其90%的准确率,可以快速为医生提供丰富的细节信息。其他应用场景,医疗机构的智能化管理,将在各省市区域信息平台及三大健康医疗数据集团推动下进行。全科辅助决策、健康/慢病管理、人工智能新药研发等,大多处于产品研发中期。针对这三个领域,企业仍需投入大量技术人才,以缩短流程路径,提升产品准确率。
一、大数据在健康医疗行业中应用价值
1.健康医疗行业面临的困境
1.1全球医疗困境
人口的增长和老龄化,发展中国家医疗市场的扩张、医学技术的进步和人力成本的不断上涨将推动支出增长。2017-2021年全球医疗支出预计将以每年4.1%的速度增长,而2012-2016年的增速仅为1.3%。
慢性病发病率提升,变化的饮食习惯以及日益增加的肥胖度加剧了慢性病的上升趋势,特别是癌症、心脏病和糖尿病,目前中国糖尿病患者约有1.14亿,而全球患者人数预计将从目前的4.15亿增加至2040年的6.42亿。
传统研发(R&D)成本上升,产品上市速度慢,2004年至2014年药物开发成本增加了145%。
劳动力不足,在人口结构的变化和技术的迅速发展下,熟练和半熟练医疗保健工作者将大幅减少。1.2中国特色困境 人口老龄化加剧。
供需结构失衡,金准人工智能专家统计2016年我国每千人口执业(助理)医师2.31人。2015年我国每千人口医师数量在OECD统计的国家中排名处于25-30之间。同时,我国医生执业环境较差,促使进入医疗系统的优秀人才逐年趋少。
医疗资源发展失衡,据金准人工智能专家了解,2010-2015年三级医院诊疗人次及住院人次复合增长率分别为14.6%和21.9%,而基层医院仅为3.8%和0.5%。传统就医模式使得三级医院人满为患,导致就医体验差及优质医疗资源浪费严重,因此,我国仍把推行分级诊疗作为当前首要任务。
医保透支,《中国医疗卫生事业发展报告2017》预测,2017年城镇职工基本医疗保险基金将出现当期收不抵支的现象,到2024年将出现累计结余亏空7353亿元的严重赤字。商业健康险的发展可有效弥补医保不足。在成本支出方面,健康险利用市场规律帮助医院合理控费,同时,还可增加社会保障的收入来源,减轻国家医保基金的负担。提升医保控费能力,探索创新支付机制迫在眉睫。
因此,改善现有就医模式,推行分级诊疗势在必行。分级诊疗推行需建立在信息、资源及利益互通上。2015年,国家卫计委提出分级诊疗制度将在2020年全面确立,包括基层首诊、双向转诊、急慢分诊、上下联动分诊诊疗等。新模式的搭建过程中,主要存在以下3个问题。1)信息不流通,各医疗机构间多为信息孤岛,患者信息无法进行快速共享流通;2)资源不流通,优质医生多集中在各大省会的顶级医院,且三甲医院医生精力有限,每年可支援的基层医疗更是有限;3)利益不互通,医院之间缺乏有效的利益捆绑机制,以促进患者在院间的流通。
2.大数据助力我国医疗生态全面升级
大数据技术的应用,将从体系搭建、机构运作、临床研发、诊断治疗、生活方式五个方面带来变革性的改善。由于我国医疗体系的强监管性,大数据若要在行业内实现其价值,需由国家建立一套自上而下的战略方针,从而引导医院、药企、民办资本、保险等机构企业构建项目,相互合作,最终实现从“治疗”到“预防”的就医习惯的改变,降低从个人到国家的医疗费用。麦肯锡曾在2013年预测,在美国医疗大数据的应用有望减少3000-4500亿美元/年的医疗费用。
2.1健康医疗大数据宏观利好
宏观环境利好条件满足,静待细分市场突围。我国健康医疗大数据已进入了初步利好阶段,国家作为政策引导方,已出台了50余条“纲要”或“意见”,可穿戴设备、人工智能等技术的发展也为产品研发奠定了基础,且头部资本已进入市场。下一步,各方需静待产品与市场需求相融合,共同探索具备商业化或临床价值的大数据产品。
2.2健康医疗大数据政策利好 政策引导,明确健康医疗大数据战略意义。2015年8月国务院发布了《促进大数据发展行动纲要》,指出发展医疗健康服务大数据,构建综合健康服务应用。随后,国务院、卫计委相继发布了多项政策,以促进各省市政府将健康医疗大数据提升至战略层面。
政策引导,顶层设计推动大数据项目前行。2018年科技部官网发布了14个重点专项2017项目申报指南“精准医学研究”等生物医学领域的5大专项,累计共拨 经费总概算12亿元。其中与健康医疗大数据密切有关的项目有,“重大慢性非传染性疾病防控”4.5亿元,“精准医学研究”1.3亿元,“生殖健康及重大出生缺陷防控研究”0.9亿元。此外,2月科技部发布了“主动健康和老龄化科技应对”2018年申报指南。
2.3健康医疗大数据资本利好
2018年Q1大数据投融资事件35起,行业热潮正式开启。金准人工智能专家将IT桔子中披露的医疗健康投融资数据进行了分类整理,发现2014年起健康医疗类大数据投融资事件增多,2016年最多共66起,2017年略有下降。2018年,健康医疗大数据仅在Q1便发生了35起投融资事件,其中12件来自医疗信息化建设,多为利用AI、语义识别、数据模型,挖掘诊疗信息,连接院内院外平台等类别的企业。受人工智能热潮影响,2017年辅助决策类共发生17次投融资事件,2018Q1共5起,预计未来将会有更多资本进入该领域。
2.4健康医疗大数据社会结构
老龄化及不良习惯诱导身体不适,提升人均就医次数至5.8。2017年,我国65岁以上人口占比11.4%,出生率12.43%(2016年出生率12.95%),人口结构呈现老龄化趋势。以2013年为基础,65岁以上人群两周就诊率26.4%,且在现代生活习惯的影响下,糖尿病、高血压等慢性病发病率也在不断提升。金准人工智能专家认为诊疗人次仍将持续上升,医疗体系也将面临巨大压力。
2.5健康医疗大数据技术利好
采集技术成熟促使数据爆发性增长,数据价值急需被挖掘。健康医疗大数据领域涉及的相关技术范围非常广,如底层数据采集中包括信息化、物联网、5G技术,处理分析中包括深度学习、认知计算、区块链、生物信息学及医院信息化建设等。据IBM统计,全球大健康数据正以每年48%的速度增长,在2020年数据量将超过2300Exabytes。金准人工智能专家预估2020年,全球健康物联网设备出货量将达到161万台。院内数据方面,金准人工智能专家在2016年统计,医院管理信息系统整体已实施比例在70-80%之间,且集中于三级医疗机构,大量健康医疗数据的积累为算法搭建提供了基础。在处理分析方面,人工智能、生物信息学需要与实际应用场景相结合,以便搭建有效模型。
二、大数据在健康医疗行业中发展概况
1.健康医疗大数据分类及应用
本篇报告将健康医疗大数据分为三大类,院外数据、院内数据以及基因数据。院外数据包括健康档案、智能硬件体征及环境监测/检测,院内数据包括就医行为、临床诊疗等,基因数据包括外显子、全基因等。在具体场景应用方面,多为不同种类的数据相互交叉结合应用,如预防预警,需要结合智能硬件监测、诊疗用药历史等数据才能为用户提供及时的预警监测。
2.多项细分场景同时探索,辅助诊断将首先迎来商业化 健康医疗大数据行业以数据规模为基础,且在政策和资本鼓励下,部分应用场景进入市场启动期,如健康管理、辅助决策(全科辅助决策、影像病理辅助诊断等)、医疗智能化等。下一阶段,随着企业大数据/AI技术长期的应用实践探索,产品不断更新完善,预估2-5年的内,产品将首先在B端客户中进行推广;随后,伴随软件友好度和准确度的上升,在B端客户使用的影响下,C端市场将展开竞争。
3.健康医疗大数据产业链概述
始于用户,终于用户。健康医疗大数据产业链的上游是数据供应商(医疗机构等)或存储计算服务(云服务商。中游为产业链核心企业,多为具有影像识别、深度学习、自然语义分析等核心技术的技术型企业。该类企业可为聚集了大量健康医疗相关数据的机构提供数据处理服务,在分析及可视化后赋予数据价值。下游为应用场景,分为B端和C端。B端包括医院、药企、政府、保险、PBM等企业,其最终的目的是提升医疗服务的效率和质量,降低患者及健康人群的就医费用。
3.1健康医疗大数据上游现状
数据已成规模,院内数据在样本质量与规模中胜出。
健康医疗大数据产业链上游所提供数据的质量与样本量将决定,中游企业是否可以快速有效的进行模型训练。整体来看,院内、院外及基因数据供应方均面临三个问题,质量、样本量及安全。1)院内数据在质量和规模上最具竞争力。各省市TOP级的三级医疗机构多存有高质量的诊疗数据,且已具备一定规模。医院外联系统中多存有大量就医行为数据,然而这类数据的应用将依赖政策指导,且面临隐私安全等文图。2)基因数据为企业的核心资源,已具备一定规模和质量,且多由中游企业自建数据库自行采集,或者通过与实验室合作的方式获取。3)健康类数据多由智能硬件或在线医疗企业采集,该类数据增长快速,但是维度多且缺乏整合,质量参差不一。
3.2健康医疗大数据中游现状
北京大数据先行,上海、广东、浙江紧随。金准人工智能专家就IT桔子中正在进行融资的103家创业公司分析,发现主要集中在北上广深一线城市,该现象受医疗资源、政府态度、医生接受度三方面影响。1)北上广深拥有多家TOP级三甲医院,优质医疗资源丰富且信息化程度高,因此企业能够获得可观的高质量数据样本;2)初期阶段,医疗大数据技术的探索多由地方政府拨款支持,如2018年2月由北京大学医学部和大数据研究院共同筹备建立北京大学健康医疗大数据研究中心。因此地方性政策支持变得尤为重要;3)一线城市的医生对新技术接受程度较高,因此在产品上市后相对较易试运行。
3.3院外数据之应用场景
大数据及AI技术,提升企业用户服务规模及能力平安好医生IPO报告中公布,2017年互联网医疗市场规模达到150亿元人民币,在线咨询量达到23.8千万次。由此可见,互联网医疗可触达的用户规模将越来越大,而仅靠医生或相关从业人员在后台回答问题并不能满足日益增长的用户量。因此,企业需依赖大数据或AI等技术优化问诊、健康/慢病管理等产品的功能,从而有效满足用户需求,最终提升付费率。
此外,对于不断扩张的企业,大数据及AI技术辅助提升服务效率,降低人力成本;使得在付费率低的情况下(好医生IPO披露2017年付费转化率为2.7%),也可以形成稳定的营收与较高的利润率。金准人工智能专家认为,随着企业AI智能分诊、AI健康管理路径等模型成熟且全面应用后,院外数据的应用市场将进入快速成长期。
3.4院外数据的商业路径 核心能力提升用户健康,延伸能力创造商业价值。能够提供健康管理服务的企业主要分类两类。一类是偏健康数据收集类企业,针对健康或慢病人群提供饮食、运动等个性化健康方案。另一类是偏轻问诊类,提供智能分诊、轻问诊、预约、转诊等服务。目前,C端服务盈利能力有限,部分企业依托其健康管理或问诊能力,为企业端客户服务。如妙健康依托其多维度健康数据及平台搭建能力,为雇主提供内部员工的健康管理服务,为疾控慢病中心搭建健康信息平台提供技术服务。如平安好医生结合其终端智能应用,为用户提供智能分诊,为医生提供辅助决策等服务,辅助政府搭建区域信息化。
数据到行为干预仍需过程,企业付费是首选。大部分移动医疗公司在经历了4-5年数据沉淀后,积累了大量的数据样本,然而如何通过技术将其转化为可被解读的报告仍需时间。目前,健康医疗大数据行业的支付方主要集中在B端,包括医院、药企、药店、保险、政府等多类企业;且在主要支付方中,药企、保险已形成了一定的支付习惯。健康医疗大数据的收费方式有多种,包括项目制、Saas服务收费、软件租赁费、增值服务费等;前三种为现阶段主要的收费方式,而增值服务费将随着大数据及AI应用场景的增多而增加。
3.5院内数据之应用场景
大数据技术应用广泛,以提升诊疗及管理效率为主。在研发成本、运营成本的不断提升下,医疗机构、药企、药店、保险等机构或企业均急需一套解决方案,以便在降低临床研发、运营管理、营销成本的同时提升顾客满意度,最终增加营收。该类企业利用人工智能技术分析挖掘已有信息,为医疗机构、药企提供有效的改善运营、提升服务效率的解决方案。目前,提供相关业务的企业主要来自三种,1)创业型,多为AI技术公司,如推想、羽医甘蓝、博识医疗语音等技术型企业;2)信息化/互联网等企业新业务拓展,如东软医疗的区域信息化、微医的微医云业务等;3)政府主导的健康医疗大数据集团,如中电集团将在程度规划、建设和运营国家健康医疗大数据平台,开展健康医疗领域的数据汇集、治理、共享开放和应用生态建设。
3.6院内数据的商业路径
依托技术与数据,收费模式玩法多。就院内数据付费方来看,药企、体检的付费意愿及能力最强;医院、保险、药店等机构企业的付费意愿较弱,需要时间进行市场培育。此外,在商业化道路上,医学影像类公司也可以针对器械、美容等高端机构进行产品研发,满足其高端用户的服务及心理需求。现阶段,针对不同客户常见收费方式有三种,1)软件租赁或解决方案,企业为医院机构或政府(省市卫计委)搭建系统或软件服务(语音录入、电子病历搜索等),获取一定技术服务费或软件租赁费。2)数据分析收入,企业为体检机构提供影像识别服务,提高影像读取效率;或利用机器学习为药企提供服务,以便提高药物发现的“命中”几率。3)产品绑定,将成熟模型与健康医疗器械绑定,辅助提升其市场竞争力。大数据企业将获得一定比例的提成或资源。4)按使用次数收费,未来AI技术在获得三类器械认证后,患者可在就医时实现按次付费。
细分之辅助决策
辅助诊断替代医生重复性工作,减少近八成工作量。辅助决策类企业采用的技术多为认知计算、深度学习、计算机视觉、自然语言处理。针对科室或疾病领域的不同,其领域也不同,包括影像辅助诊断、病理辅助诊断及全科辅助决策等。其中全科辅助决策准确率85%左右,仍有较大提升空间;影像和病理辅助诊断的准确率超过90%,其产品正在落地中。现阶段,各企业主认为辅助诊断的价值在于为医生提供病灶性状描述、自动生成报告、精准定位病灶,降低漏检风险。1)针对三甲医院医生,辅助诊断将替代医生重复性工作,为其提供更多的信息,以便医生制定最佳的治疗方案。或者在短时间内监测患者的肿瘤变化,以便医生及时观察患者术后恢复情况。该类解决方案单价较高,从几十万到上百万均有。2)针对基层医疗机构,系统将直接给出结果,快速有效的进行肿瘤的初筛,提高基层医生的诊疗效率及质量,释放医疗资源。针对基层医疗机构的解决方案价格相对低一些,未来可能以按次收费为主。3)全科辅助决策,将帮助大型三级医院或在线医疗公司实现快速分诊,提升效率。其价格将在几万到几十万之间。
细分之辅助诊断
降低数据标注成本,构建临床应用流程。行业发展初期,企业的主要困境集中在产品研发落地阶段。在研发落地过程中,企业需要不断丰富数据库,发现CornerCase。目前,大多企业进行数据标注主要来源以下三种形式,人工标注、机器标注以及医院已有结构化数据。1)人工标注为主流方式,该方式能够提供较高质量的标注数据,但也面临着高成本的问题。原因是,数据标注人员多为医生或具备临床经验的执业医生或医学生,该类人员收费较高每人每天在百元以上,且一张图标注时长多达半小时。2)机器标注,体素科技提出了AFT*标注法,将主动学习和迁移学习整合成单一框架。在肠镜检查帧分类、息肉监测和肺帅塞检测中表明该类标注成本至少可以减少一半。3)已有结构化数据,医院本身会存储一定量的结构数据,然而该部分数据仍要在处理筛选后才可使用。此外,针对新技术的应用,医疗机构缺乏相应的上线流程,因此,企业在模型训练过程中,建立可复制的临床流程与标准,针对不同层级医疗机构的应用场景提供有效解决方案是关键所在。
基因数据的快速发展
临床与消费基因需求增长,促使数据分析产业前行。金准人工智能专家整理公开数据显示,全球基因测序数据分析市场规模发展迅速,2012年市场规模不超过2亿美元,预计2018年将接近6亿美元,复合增长率为22.7%。金准人工智能专家分析认为,随着高通量测序设备的广泛应用,基因数据量也呈倍数增长。数据量的增长,也使得基因测序的工作重心从繁重的人工测序转到了中游的数据分析上。下游临床应用及消费基因的成熟,为数据分析提供了客观的支付方。因此在应用终端的推动下,中游数据分析产业将迎来快速增长,现阶段生物信息公司业务往往大而杂,而专注某一医疗领域的生物信息公司(如精准癌症)少之又少。国内市场专注基因组数据分析的生物信息公司并不多,该领域值得期待。
三、典型企业案例分析 1.平安好医生:探索AI应用落地,提升服务效率与能力
平安好医生创建于2014年8月,自成立之初便开始布局AI+医疗项目。目前,好医生涉及的主要项目包括“AI助手”、“现代华佗计划”、“家庭医生”和“一分钟诊所”,“AI助手”主要应用于线上辅助问诊环节,“现代华佗计划”致力于中医行业的标准化、信息化、智能化,“家庭医生”运用智能问诊等技术,运用于家庭端医疗健康管理,“一分钟诊所”除智能问诊外、还推出智能诊断、智能药方,协助医生问诊。平安好医生已于2018年5月于港交所挂牌上市,成为互联网医疗第一股,股票代码01833.HK,融资11亿美元。
平安好医生依托其AI+医疗技术,能大幅提升医疗服务效率及能力,以便覆盖更多的患者用户和B端客户。C端用户可在其移动APP、家庭智能终端等平台,接入平安好医生的家庭医生、健康管理、消费医疗及健康商城业务。针对B端客户,平安好医生可为其定制系统,并嵌入到机构或企业平台软件中。如,好医生将智能问诊系统接入三级医院信息化软件中,帮助其实现院内快速分诊;如为企业雇主开通PC端口,为其员工提供健康管理等服务,以提升雇主的竞争力。未来,好医生将在AI技术领域持续投入,不断寻求和领先研究机构、大学及企业的合作机会,以实现在AI技术研发和应用上的资源整合、优势互补。
2.妙健康:基于健康行为大数据+AI的健康管理模式
企业简介:妙健康隶属于三胞集团,全称为北京妙医佳信息技术有限公司,致力于打造为集健康数据收集、健康行为干预、健康增值服务于一体的综合性健康管理平台。妙健康至今已完成4.5亿元融资,投资机构包括阳光融汇资本、中信资本、农银无锡基金、江中中医药基金等。
业务模式:妙健康已通过自身的优势在移动健康管理领域拓展出多种新型的B2B2C模式,如:健康管理+保险、健康管理+运营商、健康管理+新零售、健康管理+员工福利等,并已与中国联通、华为、阳光保险等诸多国际知名品牌达成合作。
大数据布局:在数据采集方面,妙健康通过健康数据及服务开放平台“妙+”接入多维度数据;在数据分析方面,妙健康通过自建数据AI团队(公司规模200人,研发团队占比60%)及外部合作(阿里云等)两种方式提升人工智能在健康管理领域的应用水平。在终端应用方面,妙健康以移动端APP作为入口为用户提供健康管理服务,探索以健康行为大数据和人工智能为基础的新型健康管理模式。
3.蓝信康:数据提升健康,数据驱动智能
企业简介:蓝信康隶属上海科瓴医疗科技有限公司,是旗下的互联网服务品牌。公司成立于2014年10月,致力为B端企业客户提供健康管理和会员管理的SaaS解决方案。2016年3月,蓝信康获得永太科技和盈科资本联合投资的2500万元人民币A轮融资。
业务模式:蓝信康结合智能硬件、云端算法技术和智能化管理系统,对合作客户的会员、健康和用药进行大数据分析,为B端客户(药店、医院、药企等)提供慢病管理、会员管理、健康咨询和专业培训等一系列服务。
4.金蝶医疗:区域电子病历系统,实现共享互联
企业简介:金蝶医疗作为科技创新企业,为中国医疗健康行业提供信息化和互联网化整体解决方案。目前,已有3000家医院与医疗卫生机构选择金蝶医疗“数字化医院”、“移动互联网医院”、“云医院”、“HRP”等产品与解决方案,其中500家医院已与金蝶医疗共建“移动互联网医院”。金蝶医疗旨在构建医疗健康科技服务平台,助力医院适应医疗新业态,与中国医疗机构一起构建中国医疗服务新模式。
项目简介:2017年,金蝶医疗为佛山市打造了区域电子病历共享信息平台,辅助提升当地诊疗水平,提高区域医疗服务质量。该平台系统搭建包括区域电子病历库标准体系、区域级卫生数据库(居民电子病历数据库、健康档案库)的共享使用,主要服务人群是医生、医院、患者/居民。目前,平台上已有3家试点医院正正式接入。
5.阿里、百度、腾讯健康医疗大数据产业链差异化布局
BAT企业在健康医疗大数据布局中略有差异。阿里着力产业链中游,以构建云服务、AI技术为重点;腾讯以应用端为主,构建多个线上医疗服务入口的同时承接了多项线下服务相关项目;百度在2017年医疗战略调整后,将重心放在AI技术应用的新药研发领域上。金准人工智能专家认为,2018年,阿里将寻求多领域的B端应用落地的合作方(区域医疗、基因、辅助诊断等)。腾讯在承接多个区域医疗、信息平台等B端应用项目后,将寻求更多技术合作方来共同搭建完成。
5.1阿里:云为支点,布局医疗智能化,服务企业端客户
阿里系中涉及健康医疗领域的主要有阿里健康、阿里云。2014年,阿里健康推出APP,为C端用户提供在线购药、问诊等服务,2016年天猫医药馆并入,期间投资布局围绕医药流通进行;2015年推出云医院平台;2017年推出DoctorYou,通过B-B-C的模式为医生提供辅助诊断、医生培训等服务。阿里云,主要针对B端客户(医疗机构、基因测序)提供云计算服务及智能化的运营管理软件服务。
5.2腾讯:与线上线下医疗服务方深入合作,探索大数据价值
2013年,腾讯依托其流量优势,上线了微信智慧医院,2017年3.0版本中加入了AI导诊等技术。期间,腾讯针对其线上问诊服务,与近10家在线医疗企业进行了合作,且同时期与多家健康医疗APP合作,力图打造从数据监测到健康医疗服务的闭环生态。2017、2018年,腾讯将医疗市场拓展至线下,与多地政府、医院合作,探索大数据、深度学习在医疗服务、医院管理及区域信息化领域内应用场景的探索。
五、大数据应用在健康医疗中遇到的挑战及趋势 1.法规滞后减缓行业发展速度,市场应用仍需培育
2.AI技术填补大数据到信息转化路径的空白,完善产品价值
健康医疗数据多具有非结构化特性,以往的数据分析软件多针对结构化数据进行研发应用。人工智能(自然语义处理、卷积神经技术、机器学习等)技术的成熟与应用,开启了健康医疗的“大数据时代”,为如影像类的非结构化数据应用提供了可能性。
发展初期,企业端客户市场远大于用户端。在行业发展初期,企业端客户的购买需求、支付意愿和能力远大于用户端,因此企业端客户是健康医疗大数据企业主要支付方。医院药企是最早的支付方,如湘雅,2014年围绕数据互联互通、区域信息、精细化管理进行系统搭建。2016年,21家医院的肿瘤专家与IBMWatson进行合作获得个性化服务。药企,如默沙东,2015年将人工智能技术应用到药品研发中。随后,在2016、2017年,更多的药企、体检机构通过合作、收购等方式先后进入市场。金准人工智能专家认为,在市场初步探索后,政府、医院、药企、体检等企业将成为健康医疗大数据的主要支付方。
发展中期,用户端付费将带来更多可能性。随着行业发展,产品、用户教育及上下游产业的逐渐成熟,服务于用户端的企业将迎来无限商机。如,影像识别、基因测序在经过临床验证后,作为常规检测项目,将列入医保或健康险的可报销项目。健康慢病管理场景下,用户线上进行的建议、干预、上下转诊等健康或轻医疗服务的收费模式也将更加灵活多变,形成以按次、按会员、按年卡等多种收费形式。
长期来看,协同竞争者将成为赢家。金准人工智能专家认为,在健康管理、慢病管理以及诊前、诊中、诊后环节打通的场景下,单家企业或机构的服务供给能力有限。只有依赖多方角色协同合作,配合提供健康医疗服务,才能满足用户需求。未来健康医疗产业中的胜出方,不单再是个体,而是不同领域的企业共同合作完成的生态体系。因此,企业在构建核心优势的同时,还需要具备战略眼光,及发现投资优秀合作伙伴的能力。该体系的核心产业包括健康医疗大数据公司、医生、健康医疗服务提供方,辅助产业包括数据采集方(智能硬件等、区域信息平台)、运营商、物流服务、云服务等。
总结
金准人工智能专家认为,假设2022年人工智能技术辅助决策应用应用落地,市场规模将达到55.86亿元人民币,其收费模式将包括软硬件解决方案、软件搭载、按次收取等多种方式。
健康医疗大数据快速发展的先决条件有三条,1)政策支持,顶层政策推动的同时,各类细节管理办法也要及时跟上市场发展;如,CFDA需要就基于人工智能技术的临床应用,开发新的监管框架,为申请三类证开通通道。2)市场认可,健康医疗大数据及AI技术的临床及商业价值快速被市场认同,即企业客户与患者用户均具备一定的数据消费意愿与能力。3)资本支持,大数据及AI技术的应用研发需要大量资金支持,在产品尚未全面铺开时,市场需要资本不断的注入以维持研发能力。