第一篇:HIMSS:医疗数据发展带来的价值(范文)
中国数字医疗网HC3i
HIMSS:医疗数据发展带来的价值
在本届HIMSS大会上,医疗行业中大数据和商业智能的应用成为与会嘉宾讨论的两大重要议题。美国家庭医师协会(the American Academy of Family Physicians)正在研究大数据和商业智能给医疗行业带来的价值。该协会在本届HIMSS大会上提交的一份分析报告指出,要通过详细的基准数据提高医疗服务质量,改善医患之间的关系。值得一提的是,详实的公共卫生数据和患者个人的就诊信息可有效避免患者不必要的重复住院,并可成功预防医疗保险中的欺诈行为。
“借助临床数据,我们可以做很多有价值的分析。Steven Waldren们可以与电子病历数据整合到一起,从而满足电子病历有效使用)的要求。
美国家庭医师协会的此次研究是与美国医疗IT服务商医疗管理数据、实验室数据和临床数据整合起来,“现在,我们正在做一件非常有意义的研究,成功。”Waldren非常自豪地说。
Emdeon高级执行副总裁“现在我们公司的系统内已经累积了相当数量的患者数据,我们邀请到数据分析公司Atigeo加入到此项研究中。近期,详细讨论了如何借助这些”
Atigeo
指出:“随着医疗信息化的普及,医疗IT系统内存储了TB最终目标。”
原文标题:Analytics take on fraud, readmissions and population health
原文作者:Tom Sullivan
来源:中国数字医疗网
第二篇:【独家】HIMSS 2014:医疗IT技术未来十年发展
中国数字医疗网HC3i
【独家】HIMSS 2014:医疗IT技术未来十年发展
十年前,美国医疗IT迈开了大胆的一步。布什总统在他的2004年国情咨文演说中宣称,十年之内大部分的美国人将使用电子病历,并由此启动了健康信息技术十年规划。约翰.克里2004年总统竞选时也同意这一主张,而约翰.麦凯恩、希拉里.克林顿以及2008年竞选的奥巴马总统均一脉相承。的确,奥巴马总统对此更进一步,他大力支持通过HITECH法案,意在提供一个管理规范、财政扶持的框架来助力健康信息技术目标的实现。过去的十年我们跋山涉水,征程非常遥远。截至目前,几乎所有的医院都已经运用了电急症期后的过渡到责任医疗组织(ACO)存在。消费者们都明白,能提供更好的医疗服务。这是激动人心的十年。
然而,我们眼前还有很多事情尚未完成。又少。健康信息还是没有跟上这些患者。未来十年医疗IT
编者注:David Brailer深顾问。
原文标题:原文作者:
来源:中国数字医疗网
第三篇:大数据将给百姓生活带来什么
大数据将给百姓生活带来什么?
摘要:汽车无人驾驶、挑选演员和剧本、计算机编辑新闻„„大数据将无孔不入,改变生活的方方面面。无人驾驶的汽车,提供符合学生个性化的教学辅导材料,计算机来编辑新闻„„日前,在北京召开的“首届大数据时代创新与媒介变革研讨会”上,专家们提出,大数据将给我们生活带来颠覆性的影响。
关键词:无人驾驶、通讯设备、个性化教学、观众心理、学生个性化 正文:
从“无人驾驶”到“移动办公”
近日,一辆自动驾驶汽车刚刚完成横跨美国之旅。这辆蓝色的汽车从旧金山出发,花了9天时间,途经15个州,驶过3400英里,最终顺利抵达纽约。一路上,99%的驾驶都是由汽车自己完成,只有在城区道路上,才有人工干预。
保时捷汽车控股集团大众品牌总经理张久鹏对此并不感到惊讶。他在大数据时代研讨会上透露,保时捷在去年就成功实现了长距离的无人驾驶。现在汽车里装载了电脑、各种通讯设备,与联通合作,从“无人驾驶”到试验“移动办公”。
“未来办公不再局限于一地,而是移动一族了。”张久鹏说,从家出发到公司可能会堵车1小时或更久,很多司机因此非常烦躁。现在可设置预期目的地,然后让车无人驾驶。车里面放置各种可折叠的办公用品,人们就能在车里完成视频会议、文件审阅和会签等在办公室里做的事。
张久鹏表示,除“无人驾驶”和“移动办公”外,大数据还给汽车用户带来了其他便利。如给汽车做保养维修,需要把车开到4S店或维修场所,现在该方式已发生了质的改变。人们可在家里通过手机APP或电话,找人上门来给车做保养;还可通过APP,查看爱车行驶轨迹,包括驾驶员的相貌特征、车内使用环境以及汽车行驶过程中的耗时、油耗、功率、行驶时间、里程等相关数据。
从用户数据匹配到精准营销
“大数据正在成为未来媒体的最核心、最有价值的内容本身,它能帮助用户实现私人定制。”北京邮电大学教授王立新说,通过IT技术进步,使供需双方信息实现成本接近于零的精准智能化匹配,从而把人类带入“自经济”时代。
王立新举例说,“一台冰箱生产成本约1200元人民币,最后利润仅38元。如果用大数据赚钱,我的口号是‘冰箱不要钱白送’。然后在冰箱里加两个功能。一是增加信息扫描系统,二是把路由器装在冰箱里,将所有消费数据都发送到企业云数据库里。”消费者买东西不用去商场,直接给企业打电话,有人给消费者送货上门,而且其商品价钱会更便宜。关于冰箱里食品的保质期,还能提供免费预报。
“比如你在这里开会,手机响了,信息提示‘主人,别讲了,我是你家冰箱里第四号酸奶,再过两小时你不喝掉就过保质期了。’”王立新说,通过采集到的大数据,家里买了什么食品、冰箱里牛奶等消耗掉多少都清清楚楚,然后可根据这个需求来通知饮料、乳品等生产企业,并通过协商来降低从这些企业进货的价格。
“这样的话,假设一个家庭一个月放在冰箱里的食品等花费两千元,通过大数据只赚其10%就是200元,6个月就可收回冰箱的制造成本。你想赚卖冰箱的38元纯利润,还是在未来十年赚到一到两万元的纯利润呢?关键就是采集数据、精准匹配、拼公司、平台化反向收费,永远代表用户的利益,让他们免费!”王立新说。
个性化教学、“机器人新闻”等
中文在线副总经理李林认为,大数据有利于个性化的教学支持。“通过数据分析、积累、挖掘,有利于教学和学习个性化、精准化。另外,可根据学生学习过程中出现的问题,随时诊断反馈,给学生提供符合其个性的教学辅导材料。”
中国青年政治学院新闻传播学院执行院长罗自文提出了“机器人新闻”,即随着大数据的普及,新闻产业已变成由机器来完成大部分工作,机器甚至可担任编辑工作。“数据新闻和传统新闻生产方式不一样。传统新闻生产通过记者、编辑进行报道整合。而现在我们很多新闻线索的获取、数据的挖掘、整合都是由计算机来做。有的计算机里有记者写好的模板,只要放进相应关键字词,就能产生不同的新闻。”
大数据还可帮助预测电影票房,以此为据来挑选剧本、演员等。清华大学媒介调查实验室研究员李兆鹏说,“去年年终我们成立了一个新媒体事业部,主要针对即将上映或正在上映电影进行票房预测,帮助片方进行电影口碑和观众心理的细分。我们通过搜集数据进行分析对比,对电影制片方、发行方提供数据支持。”
小马奔腾董事、君舍文化总裁钟丽芳说,以前选一个电影题材的方式“特别简单粗暴”,就是导演、制片公司老板喜欢什么就拍什么。现在随着大数据时代的到来,更多是根据受众的偏好和需求,再结合创作者擅长,找出一平衡点来选出题材。“以前在组合影视作品时,包括创意团队、演员,是凭经验来判断选择,所有影视公司抢的都是几个一线大腕。但真正抢到的不一定是市场效果最好的,只有对观众偏好更清楚才行。通过大数据分析,我们现在演员搭配会比以前更科学。”
第四篇:医疗大数据及精准医疗
医疗大数据及精准医疗
谢邦昌
台北医学大学管理学院及大数据研究中心院长/主任
大数据的趋势以及价值是现在最热门的话题,也改变了许多企业经营的方式,对于各行各业来说是势必是一个大挑战,能否将大数据的力量从危机到转机就要看现代经营者有没有转变传统型态的思维?
首先什么是大数据?传统数据一年的数据量大概为3TB左右,以现今数据来说一天的资料量为50TB,由这简单的数据量差就可以得知传统数据跟现今数据的差异多么庞大,也就是现在俗称的大数据时代。数据庞大之下,不管是银行业、传统零售业、社会建设公共方面甚至是医疗保健产业对数据处理、分析方式以及经营企业的模式将会有所改变。
在过往的医疗诊断历史,到医院看病时必须耗费许多时间等待看诊,而医生看诊又要再花费时间。当医生要求病患拍摄X光片或检验时,又要再花额外许多时间诊断。而在现今医疗信息高度发展的台湾,看诊程序从网络挂号、候诊顺序、诊间病历调阅、医师医令、处方开立、放射影像存取、检查检验数据储存等,无数的数据信息便在医院中传递、交换、储存。同时大多数的生理检验信息在你回诊时得以从电子病历中检索,这些我们认为理所当然的信息处理,在台湾我们只要花费少许的时间如一个早上便完成了,而这一切正是仰赖医学信息分析与医疗大数据的交换处理。
医学大数据的产生,主要归功于医疗设备数字化及电子化病历发展两大领域的突破,透过仪器数字化,医院得以获得更多病人疾病与健康信息纪录。而在病人医疗诊断方面,为了完善纪录病患个人资料、诊断数据与过往医疗纪录等,即促成了电子病历系统发展。医学大数据发展由过去纸张记录、纸本信息数字化、医学纪录储存到现今多信息整合,其数据量有着爆炸性的成长,不仅由过去个人社经信息、诊断信息等文字媒介,更拓展到多媒体影像信息,如X光影像,动态视讯影像信息,如核磁共振MRI以及电讯号信息,如心电图等等,这些庞大医学数据的汇集与高度整合技术能力,正是台湾医学信息领域发展领先的原因,同时更显得医学数据发展的多元应用及其重要性。
而由医疗健保产业来说,个人医疗信息终端的产生给医疗产业带来革命性的变化,连结了传统医院、政府(社会保障)、保险公司、药物生产公司等相关产业,形成新的行业生态圈。将互联网+医疗保健去建构一个智能的健康系统,在整个健康系统下会有智能的合作伙伴,包含医院、医生、诊所、学术中心、保险公司、药厂、医疗设备制造商、政府等相关人员等,接着产生出个人化的护理体系,其中包含个人健康、成本节约、提高效率、病人教育、增强通信、绩效度量、预防等相关内容,使得人们有着更健康的社会。
经常听到的医疗云、照护云以及健康云都是运用云端技术结合大数据去提供健康咨询的服务。在网络普及下,人手一台智能型手机让这些云更能够去发挥,客户只需要使用健康感知的终端,其中包含穿戴型装置、爱睡宝、电视机以及相关的智能型测量装置,就能够让亲人、医生以及相关的护理人员得知目前的身体状态,不仅如此,还可以远程监护以及远程门诊,一切都透过远程医疗平台让人们有着安全、方便、快速及健康舒适的生活环境。
大数据在生技医疗卫生发展状况及应用,大数据已深耕于经济领域且创造了巨大的经济价值
美国的大数据产业已经创造了巨大的价值,具体表现在:大数据使美国医疗服务质量得到提高。
对于医疗服务的提供方和支付方来说,在减少医疗成本的同时不断提高医疗质量和效率仍然是一个难以实现的目标,而这也是改善民生的重大机遇。2010年,全美医疗支出占国内生产总值的17.9%,比2000年增长13.8%。而且,某些慢性疾病如糖尿病的患病率正在增加,正在消耗更多的医疗资源。
对这些疾病和其他相关健康服务的管理将深刻地影响国家的福祉。在这方面大数据可以发挥作用。为在广大人群中取得最有效的医疗效果,更多地使用电子健康记录(电子健康档案),并与新的分析工具相结合,将提供挖掘信息的机会。研究人员可以利用信息寻找有效的统计趋势,并依据真实的医疗服务质量开展医疗评估。
大数据在医疗及生技业之应用
医疗及生技业大数据应用的当前需求来自疫情和健康趋势分析、电子病例、医学研发、临床试验等领域。
疫情和健康分析趋势
利用大数据进行疫情分析,说明这个地方可能处于某种疾病蔓延,实时掌握病情。
Google和疾管局一样能够掌握流感疫情
2009年又冒出了一种新的流感病毒,称为H1N1。这种新菌株结合了禽流感和猪流感病毒,迅速蔓延。短短几星期内,全球的公共卫生机构都忧心忡忡,担心即将爆发流感大流行。有些人发出警讯,认为这次爆发可能与1918年的西班牙流感不相上下,当时感染人数达到五亿人,最后夺走数千万人的性命。雪上加霜的是,面对流感可能爆发,却还没有能派上用场的疫苗,公共卫生当局唯一能努力的,就是减缓其蔓延的速度。为了达到这项目的,必须先知道当前流行感染的范围及程度。在美国,疾病管制局(CDC)要求医生一碰到新流感病例,就必须立刻通报。即使如此,通报的速度仍然总是慢了病毒一步,大约是慢上一到两星期。毕竟,民众觉得身体不舒服之后,通常还是会过个几天才就医,而层层通报回到疾管局也需要时间,更别提疾管局要每星期才整理一次通报来的数据。但是面对迅速蔓延的疫情,拖个两星期简直就像是拖了一个世纪,会在最关键的时刻,让公共卫生当局完全无法掌握真实情况。
说巧不巧,就在H1N1跃上新闻头条的几星期前,网络巨擘Google旗下的几位工程师,在著名的《自然》科学期刊发表了一篇重要的论文,当时并未引起一般人的注意,只在卫生当局和计算机科学圈里引起讨论。该篇论文解释了Google能如何「预测」美国在冬天即将爆发流感,甚至还能精准定位到是哪些州。谷歌的秘诀,就是看看民众在网络上搜寻些什么。由于Google每天会接收到超过三十亿笔的搜寻,而且会把它们全部储存起来,那就会有大量的数据得以运用。
Google先挑出美国人最常使用的前五千万个搜寻字眼,再与美国疾病管制局在2003年到2008年之间的流感传播数据,加以比对。Google的想法,是想靠着民众在网络上搜寻什么关键词,找出那些感染了流感的人。虽然也曾有人就网络搜寻字眼做过类似的努力,但是从来没人能像Google一样掌握巨量数据(big data,直译为大数据),并具备强大的处理能力和在统计上的专业技能。
虽然Google已经猜到,民众的搜寻字眼可能与流感有关,像是「止咳退烧」,但相不相关其实不是真正的重点,他们设计的系统也不是从这个角度出发。Google这套系统真正做的,是要针对搜寻字眼的搜寻频率,找出和流感传播的时间、地区,有没有统计上的相关性。他们总共用上了高达4亿5千万种不同的数学模型,测试各种搜寻字眼,再与疾管局在2007年与2008年的实际流感病例加以比较。这套软件找出了一组共四十五个搜寻字眼,放进数学模型之后,预测结果会与官方公布的全美真实数据十分符合,有强烈的相关性。
于是,他们就像疾管局一样能够掌握流感疫情,但可不是
一、两星期之后的事,而是几近实时同步的掌握!因此,在2009年发生H1N1危机的时候,比起政府手中的数据(以及无可避免的通报延迟),Google系统能提供更有用、更及时的信息。公卫当局有了这种宝贵的信息,控制疫情如虎添翼。
最惊人的是,Google的这套方法并不需要去采集检体、也不用登门造访各家医院诊所,而只是好好利用了巨量数据,也就是用全新的方式来使用信息,以取得实用且价值非凡的见解、商机或服务。有了Google这套系统,下次爆发流感的时候,全球就有了更佳的工具能够加以预测、并防止疫情蔓延。
电子病例
将分散在医院中的各个部门、各式各样的病例集中在云端,医生们可透过语意搜查找出任何病例中的相关讯息,进而为医学诊断提供更加丰富的数据。可提供以病患为中心的个人化疗程建议,或帮助对医疗问题及其患病率进行自动诊断。台湾的医疗黑金:健保数据库 Google台湾董事总经理简立峰曾表示:「我认为最有价值的宝藏,就是台湾的全民健保数据库。」,台湾医疗产业贯穿上下游的数据,全在健保数据库里面,而且几乎所有人都要加入,全世界只有台湾拥有如此完整的数据库。美国麻省理工学院电机与计算机科学院教授约John Guttag也说,相较于美国,台湾的健保是由政府买单,这让医疗数据取得变得容易,「这是台湾的机会,未来也很有机会从中获利。」
累积15年来、2千3百万人民的健保数据库,正等待着识货的伯乐来挖宝。台中荣总医生、阳明大学教授吴俊颖以亲身经验说明,过去医学界只知道,幽门螺旋杆菌跟胃癌有关,但是却没有规模够大、时间够长的临床实验可以证实,他与研究团队藉由探勘台湾的健保数据库,发现服药根除幽门螺旋杆菌,可以降低胃癌的发生率。
这篇论文不只发表在肠胃科排名第一的杂志《肠胃病学》上,更震撼了日本医学界。日本是全球胃癌罹患率最高的国家,当地医生特别把这篇论文翻译成日文,并且说服日本厚生省,对幽门螺旋杆菌感染患者全面给付杀菌疗程,不仅影响医师的临床运作、政府决策,甚至有可能改变国际性医疗行为准则。
吴俊颖认为,台湾的健保数据库内容巨细靡遗,所有医疗项目都记录得一清二楚,「它像是永不干涸的黑金,当数据越来越多串联和使用,就会越来越有价值。」然而,吴俊颖也提到,健保数据库有个缺点,就是缺乏诊断和检测结果。麻省理工学院教授Peter Szolovits也曾举例说明过,如果有一位病患发现关节肿起来,医生跟他说这「疑似」是风湿性关节炎,因此记录风湿性关节炎的费用,可能后来病人发现根本不是这个病,如果把这笔数据用在风湿性关节炎的医疗研究上,那就会变成糟糕的数据,影响研究结果。
「如果能够把健保数据库与医院病历的数据库做结合,那它就会变成最完美的医疗数据库!」吴俊颖提到,病历数据包含检测和治疗的结果,不只对于台湾医疗产业来说非常有价值,国内外的生技和医药大厂,也都会抢着要跟台湾合作。想象一个情境,有天当你到南部度假,突然感到身体不适,就近到当地的诊所就医。第一次跟你见面的医生,登入全台湾共享的医疗数据库,调出你在其他医院的病历数据,花几分钟就能对你的身体了如指掌,还能透过临床决策辅助系统,显示出跟你有相同症状的病友群体、使用各种药物的治疗状况,透过大数据分析可以协助医生在最短时间内,找出最适合的治疗方式。
「很多人以为这样的愿景,离现实生活非常遥远,其实台湾已经走在半路上了。」台大医院竹东分院院长王明巨如此说道。的确,台湾医疗机构的病历电子化程度很高,很有可能成为全球第一个全国医院流通电子病历的国家。医学研发
运用实时监测及分析大量的仪器数据,建构预测模型,并利用统计工具改善临床试验设计,分析临床试验数据。发展个人化医学及疾病发作模式等医疗研发。利用大数据解决多发性硬化症的算法运算复杂度
位于水牛城的纽约州立大学(SUNY)是一个领先全球的多发性硬化症(MS)研 究中心。MS是一种具破坏性的、面性的神经系统疾病,影养全球近百人。这种疾病会使人的大脑和骨随发炎并产生神经病,导致患者可能出现行动不便、视力受损、疼痛等症状。
MS的病因是很复杂的,没有一个单一基因是可能的致病源。因此自2007年以来,SUNY就一直希望透过扫描MS患者的基因组的变化来开发新的治疗方式,透过从原本成千上万的基因序列的变异SNP,SNP指的是单核桃多型性,来获得单一样品,研究基因产物和其他基因产物及环境因素进行的交互作用。
研究人员的想法是以多个SNP变异点结合不同的环境变因,并使用一种被称之为「AMBIENCE」的算法,来检测县性和非线性两种数据数据中的相关性,以识别这些交互作用之间的关系。但是这个想法就如同大海捞针,因为环境变因包括像是实验对象曝晒太阳的时间长短、维生素D产生的量、吸烟的情况等皆有可能影响研究结果。况且人类的基因由23对染色体所组成,其中包含约30亿个DNA碱基对,这些因变量和应变量数量多到吓人,必须靠建构一套计算量高达1018的高等分析模型才能解决。
因此SUNY与IBM合作,建构一套搭配软硬件的数据分析系统,以往平均需要27.2小时的工作,缩短到现在只要11.7分钟即可完成。而且这套系统不仅大大简化和加速了复杂的分析过程,还提供了不同类型的变量值,如:分类变量、分配卜瓦松变量或连续常态变量等。过去,只要研究中增加一个新的变量值,研究团队就必须重新编写整个算法,而现在只需按几个键即可完成。
大数据系统分析的应用除了MS的研究以外,全球估计超过3300万人感染,至今没有方法可以完全治愈的艾滋病,以及罕见疾病等,都已开始利用大数据进行大型的医学研究。
临床实验
临床试验藉由大数据而有了重大的改变,可利用临床验数据、仪器读数等,进行比较效果研究、临床决策支持系统、远距病人监测及加强医学数据透明度等方面。
拥有数据数据保护的早产儿
所谓的早产儿是指怀孕不到37周就提早出世的宝宝。这些提早降临人世的小仙子,如果出生后体重不到1500公克,很可能会因为免疫系统尚未发育完全而受到感染,一旦感染之后就很容易引起呼吸衰竭、肺出血及败血症。
不过,加拿大多伦多市立儿童医院里的早产儿,却可以睡得特别安详,因为他们是有数据数据保护的「data baby」。随着医疗设备的发展,利用医疗监测仪器监测病患的生命征象,如血压、心跳和体温等,已经是非常普遍的事了。通常这些仪器还具有警报功能,一旦生理的数据数值超出正常范围时就会发出警示,医疗人员就会采取因应行动。但是即使医术再精湛、经验再丰富的医护人员,可能也无法准确地察觉这些异常的发生时间和严重性,尤其当发生在脆弱的早产儿生身上。根据美国弗吉尼亚大学追踪以往的数据显示,新生儿受到感染初期的12到24小时,因为脉搏和心跳几乎都可在接受的范围内,因此医护人员很难从生命征象数据的改变中察觉,等到警示灯响起,常常为时已晚。
连续监测和记录这些生理性数据,可以观察出新生儿是否遭受感染的早期征兆,但数据量实在太过庞大了。估计这些监测设备每一秒钟就会产生1000个读数。以往是30到60分钟由医护人员归纳出一个数据做为纪录,然后储存72小时。如果要把这些读数统统记录起来,根本是不可能的事。
但这项不可能的任务,并没有吓跑安大略省理工学院和IBM。他们使用来自怀生研究中心的最新技术,利用江河运算平台支持大量数据的收集和分析,一天24小时不间断地收集和记录着包括早产儿的体温、心跳、血氧饱和浓度和血压等电子监测仪器产生的大量数据,以及周遭环境如温度、湿度等相关数据。在保护病人的隐私安全考虑下,这些数据会直接传到安大略省理工学院研究中心和IBM华生研究中心;系统会分析和研究哪些因素的交互作用会造成感染,甚至哪几床的新生儿因为符合条件较多,可能出现疾病或感染的风险较大。之后,系统再将分析结果提供给医护人员比较判读。这些动作都在数秒内完成。藉由这项计划,儿童病房里的医护人员已经可以提前18到24小时,预防新生儿败血症的发生。
由于大数据在规模(Volume)、增加速度(Velocity),以及价值性(Value)上正呈现几何上升,而其数据所表现的多样性变化(Variety)与数据的有效性(Validation),更容易成为企业的风险源头。面对排山倒海而来的大数据,企业需运用大数据,迅速将数据转化成商业智能,运用分析信息,提升市场的洞察能力,做出更准确的营运决策。例如:电信业者可以分析手机在基地台漫游的特性,提供更好的在地费率;信用卡业者可以每天定期分析各种信用贷款所产生的风险,动态调整信贷利率;便利超商可以分析消费者的购买习惯,动态调整架上存货数量等;制造业者可透过现场制造系统所记录的大量在线实时生产数据进行分析,以协助制造业改善制程、提升良率,并减少物料浪费。因此大数据将是企业未来所面临的关键挑战。鉴于目前信息以超乎想象的速度产生、累积、消逝,而企业所面临的商机亦有相同的循环表现。透过海量信息的实时性分析与运用,将可对不同信息的需求者,产生不一样的价值与意义。若能持续在既有的数据中发掘价值,同时考虑动态信息所带动的巨大冲击,并藉此掌握瞬息万变的市场契机,则大数据的分析与应用,将有助于各类型企业在相关营运领域中,引领下一阶段的企业永续发展。基于以上的发展潮流与态势,麦肯锡(Mckinsey)管理顾问公司于2010年已指出未来引领企业发展趋势的十大科技,其中即包含了大数据的获取与分析、云端运算服务的公共价值,以及企业多层面的参与互动及服务。在这些技术与行动通讯网络的整合应用下,企业未来所产生的数据量将呈现倍数成长,并导致过去传统的储存技术即将遇到瓶颈,因此,虚拟化的云端运算分析技术,以及大数据的管理,将成为各方面所即将面临处理的新课题。从目前的技术发展 来看,未来各项实体化设施,将可能在未来藉由虚拟化的技术,得以降低各项成本的支出,然而云端运算与大数据的应用,绝非仅为建置一个大型数据中心即可,对于后续所产生大量数据下的数量管控、数据的质量与分析结果,以及这些数据所衍生之相关应用与服务,才是现阶段所应关心的重点。计算设施(Computer)网络设施(Network)储存设施(Storage)数据数量管控数据应用服务数据质量分析虚拟化(Virtualization)为了结合技术、数据,以及应用分析与服务等三项议题的探讨,本演讲大数据主要阐述BIG DATA 在生技医疗卫生上之应用与研究;抛砖引玉系望能激起大家投入医疗大数据的研究!
第五篇:大数据+精准医疗
大数据+精准医疗
2012年全国居民慢性病死亡率为533/10万,占总死亡人数的86.6%。心脑血管病、癌症和慢性呼吸系统疾病为主要死因,占总死亡的79.4%,其中心脑血管病死亡率为271.8/10万,癌症死亡率为144.3/10万(前五位分别是肺癌、肝癌、胃癌、食道癌、结直肠癌),慢性呼吸系统疾病死亡率为68/10过标化处理后,除冠心病、肺癌等少数疾病死亡率有所上升外,多数慢性病死亡率呈下降趋势。慢性病的患病、死亡与经济、社会、人口、行为、环境等因素密切相关。一方面,随着人们生活质量和保健水平不断提高,人均预期寿命不断增长,老年人口数量不断增加,我国慢性病患者的基数也在不断扩大;另一方面,随着深化医药卫生体制改革的不断推进,城乡居民对医疗卫生服务需求不断增长,公共卫生和医疗服务水平不断提升,慢性病患者的生存期也在不断延长。慢性病患病率的上升和死亡率的下降,反映了国家社会经济条件和医疗卫生水平的发展,是国民生活水平提高和寿命延长的必然结果。当然,我们也应该清醒地认识到个人不健康的生活方式对慢性病发病所带来的影响,综合考虑人口老龄化等社会因素和吸烟等危险因素现状及变化趋势,我国慢性病的总体防控形势依然严峻,防控工作仍面临着巨大挑战。
大数据的分析和应用都将在医疗行业发挥巨大的作用,提高医疗效率和医疗效果。
一、临床操作
在临床操作方面,有5个主要场景的大数据应用: 1.比较效果研究
通过全面分析病人特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定病人的最佳治疗途径。
基于疗效的研究包括比较效果研究(Comparative Effectiveness Research,CER)。研究表明,对同一病人来说,医疗服务提供方不同,医疗护理方法和效果不同,成本上也存在着很大的差异。精准分析包括病人体征数据、费用数据和疗效数据在内的大型数据集,可以帮助医生确定临床上最有效和最具有成本效益的治疗方法。医疗护理系统实现CER,将有可能减少过度治疗(比如避免那些副作用比疗效明显的治疗方式),以及治疗不足。从长远来看,不管是过度治疗还是治疗不足都将给病人身体带来负面影响,以及产生更高的医疗费用。
2.临床决策支持系统
临床决策支持系统可以提高工作效率和诊疗质量。目前的临床决策支持系统分析医生输入的条目,比较其与医学指引不同的地方,从而提醒医生防止潜在的错误,如药物不良反应。通过部署这些系统,医疗服务提供方可以降低医疗事故率和索赔数,尤其是那些临床错误引起的医疗事故。在美国Metropolitan儿科重症病房的研究中,两个月内,临床决策支持系统就削减了40%的药品不良反应事件数量。
3.医疗数据透明度
提高医疗过程数据的透明度,可以使医疗从业者、医疗机构的绩效更透明,间接促进医疗服务质量的提高。
根据医疗服务提供方设置的操作和绩效数据集,可以进行数据分析并创建可视化的流程图和仪表盘,促进信息透明。流程图的目标是识别和分析临床变异和医疗废物的来源,然后优化流程。仅仅发布成本、质量和绩效数据,即使没有与之相应的物质上的奖励,也往往可以促进绩效的提高,使医疗服务机构提供更好的服务,从而更有竞争力。
4.远程病人监控
从对慢性病人的远程监控系统收集数据,并将分析结果反馈给监控设备(查看病人是否正在遵从医嘱),从而确定今后的用药和治疗方案。
2010年,美国有1.5亿慢性病患者,如糖尿病、充血性心脏衰竭、高血压患者,他们的医疗费用占到了医疗卫生系统医疗成本的80%。远程病人监护系统对治疗慢性病患者是非常有用的。远程病人监护系统包括家用心脏监测设备、血糖仪,甚至还包括芯片药片,芯片药片被患者摄入后,实时传送数据到电子病历数据库。举个例子,远程监控可以提醒医生对充血性心脏衰竭病人采取及时治疗措施,防止紧急状况发生,因为充血性心脏衰竭的标志之一是由于保水产生的体重增加现象,这可以通过远程监控实现预防。更多的好处是,通过对远程监控系统产生的数据的分析,可以减少病人住院时间,减少急诊量,实现提高家庭护理比例和门诊医生预约量的目标。
5.对病人档案的先进分析
在病人档案方面应用高级分析可以确定哪些人是某类疾病的易感人群。举例说,应用高级分析可以帮助识别哪些病人有患糖尿病的高风险,使他们尽早接受预防性保健方案。这些方法也可以帮患者从已经存在的疾病管理方案中找到最好的治疗方案。
二、付款/定价 对医疗支付方来说,通过大数据分析可以更好地对医疗服务进行定价。以美国为例,这将有潜力创造每年500亿美元的价值,其中一半来源于国家医疗开支的降低。
1.自动化系统
自动化系统(例如机器学习技术)检测欺诈行为。业内人士评估,每年有2%~4%的医疗索赔是欺诈性的或不合理的,因此检测索赔欺诈具有巨大的经济意义。通过一个全面的一致的索赔数据库和相应的算法,可以检测索赔准确性,查出欺诈行为。这种欺诈检测可以是追溯性的,也可以是实时的。在实时检测中,自动化系统可以在支付发生前就识别出欺诈,避免重大的损失。
2.基于卫生经济学和疗效研究的定价计划
在药品定价方面,制药公司可以参与分担治疗风险,比如基于治疗效果制定定价策略。这对医疗支付方的好处显而易见,有利于控制医疗保健成本支出。对患者来说,好处更加直接。他们能够以合理的价格获得创新的药物,并且这些药物经过基于疗效的研究。而对医药产品公司来说,更好的定价策略也是好处多多。他们可以获得更高的市场准入可能性,也可以通过创新的定价方案,更有针对性疗效药品的推出,获得更高的收入。
在欧洲,现在有一些基于卫生经济学和疗效的药品定价试点项目。
三、研发
医疗产品公司可以利用大数据提高研发效率。拿美国为例,这将创造每年超过1000亿美元的价值。
1.预测建模
医药公司在新药物的研发阶段,可以通过数据建模和分析,确定最有效率的投入产出比,从而配备最佳资源组合。模型基于药物临床试验阶段之前的数据集及早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。
2.提高临床试验设计的统计工具和算法 使用统计工具和算法,可以提高临床试验设计水平,并在临床试验阶段更容易地招募到患者。通过挖掘病人数据,评估招募患者是否符合试验条件,从而加快临床试验进程,提出更有效的临床试验设计建议,并能找出最合适的临床试验基地。比如那些拥有大量潜在符合条件的临床试验患者的试验基地可能是更理想的,或者在试验患者群体的规模和特征二者之间找到平衡。
3.临床实验数据的分析
分析临床试验数据和病人记录可以确定药品更多的适应症和发现副作用。在对临床试验数据和病人记录进行分析后,可以对药物进行重新定位,或者实现针对其他适应症的营销。实时或者近乎实时地收集不良反应报告可以促进药物警戒(药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防)。或者在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。
这些分析项目是非常重要的。可以看到最近几年药品撤市数量屡创新高,药品撤市可能给医药公司带来毁灭性的打击。2004年从市场上撤下的止痛药Vioxx,给默克公司造成70亿美元的损失,短短几天内就造成股东价值33%的损失。
四、更具体一些,大数据已经得到实际应用的已经有如下场景
1.组学大数据精准医疗
人类通过开展组学研究及不同组学间的关联研究,从环境、生活方式和行为等暴露组学,至个体细胞分子水平上的基因组学、表观组学、转录组学、蛋白组学、代谢组学、宏基因组学,再到个体健康和疾病状态的表型组学等。利用大数据将各种组学进行综合及整合,既能为疾病发生、预防和治疗提供全面、全新的认识,也有利于开展个体化医学,即通过系统整合生物医学与临床数据,可以更准确地预测个体患病风险和预后,有针对性地实施预防和治疗。
2.大数据虚拟药物研发
快速识别生物标志物和研发药物。利用某种疾病患者人群的临床数据和组学数据,可以快速识别有关疾病发生、预后或治疗效果的生物标志物。在药物研发方面,医学大数据使得人们对病因和疾病发生机制的理解更加深入,从而有助于识别生物靶点和研发药物。同时,充分利用海量临床数据和组学数据、已有药物的研究数据和高通量药物筛选,能加速药物筛选过程。
3.生物大数据流行病防治
快速筛检未知病原和发现可疑致病微生物。通过采集未知病原样本数据,对病原进行测序,并将未知病原与已知病原的基因序列进行比对,从而判断其为已知病原或与其最接近的病原类型,据此推测其来源和传播路线、开展药物筛选和相应的流行疾病防治。
4.互联网大数据公卫监测
利用互联网大数据以及有关专业数据实时开展公共卫生监测。公共卫生监测包括传染病监测、慢性非传染性疾病及相关危险因素监测、健康相关监测,如出生缺陷监测、食品安全风险监测等。此外,还可以通过覆盖全国的患者电子病历数据库进行疫情监测,通过监测社交媒体或频繁检索的词条来预测某些传染病的流行。
5.大数据健康管理
实时开展大数据健康管理,通过可穿戴设备对个体体征数据,如心率、脉率、呼吸频率、体温、热消耗量、血压、血糖、血氧、体脂含量等数据的实时、连续监测和流数据挖掘、分析,提供实时健康指导与建议,更科学地实施个性化健康管理。
6.大数据疾病谱研究
了解人群疾病谱的改变,这有助于制定新的疾病防治策略。全球疾病负担研究是一个应用大数据的实例,该研究应用的数据范围广、数据量巨大,近4700台并行台式计算机完成了数据准备、数据仓库建立和数据挖掘分析的自动化和规范化计算,应用大数据研究人群疾病谱。
7.大数据人群队列研究
以大数据为导向的人群队列研究逐渐成为医学研究的热点。超大规模队列研究具有大样本-如数十万人群,前瞻性-如数十年长期随访,多学科-如基础、临床、预防、信息等多学科合作,多病种-如对多种疾病进行研究,多因素-如探讨多种危险因素,整合性-如监测系统、信息系统、医保系统的整合,共享性-如生物标本和数据资源的共享,等特点,经过长期随访能够产出大量人群数据,基于大数据的人群队列研究更具有科学性、可靠性和权威性。