第一篇:大数据+精准医疗
大数据+精准医疗
2012年全国居民慢性病死亡率为533/10万,占总死亡人数的86.6%。心脑血管病、癌症和慢性呼吸系统疾病为主要死因,占总死亡的79.4%,其中心脑血管病死亡率为271.8/10万,癌症死亡率为144.3/10万(前五位分别是肺癌、肝癌、胃癌、食道癌、结直肠癌),慢性呼吸系统疾病死亡率为68/10过标化处理后,除冠心病、肺癌等少数疾病死亡率有所上升外,多数慢性病死亡率呈下降趋势。慢性病的患病、死亡与经济、社会、人口、行为、环境等因素密切相关。一方面,随着人们生活质量和保健水平不断提高,人均预期寿命不断增长,老年人口数量不断增加,我国慢性病患者的基数也在不断扩大;另一方面,随着深化医药卫生体制改革的不断推进,城乡居民对医疗卫生服务需求不断增长,公共卫生和医疗服务水平不断提升,慢性病患者的生存期也在不断延长。慢性病患病率的上升和死亡率的下降,反映了国家社会经济条件和医疗卫生水平的发展,是国民生活水平提高和寿命延长的必然结果。当然,我们也应该清醒地认识到个人不健康的生活方式对慢性病发病所带来的影响,综合考虑人口老龄化等社会因素和吸烟等危险因素现状及变化趋势,我国慢性病的总体防控形势依然严峻,防控工作仍面临着巨大挑战。
大数据的分析和应用都将在医疗行业发挥巨大的作用,提高医疗效率和医疗效果。
一、临床操作
在临床操作方面,有5个主要场景的大数据应用: 1.比较效果研究
通过全面分析病人特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定病人的最佳治疗途径。
基于疗效的研究包括比较效果研究(Comparative Effectiveness Research,CER)。研究表明,对同一病人来说,医疗服务提供方不同,医疗护理方法和效果不同,成本上也存在着很大的差异。精准分析包括病人体征数据、费用数据和疗效数据在内的大型数据集,可以帮助医生确定临床上最有效和最具有成本效益的治疗方法。医疗护理系统实现CER,将有可能减少过度治疗(比如避免那些副作用比疗效明显的治疗方式),以及治疗不足。从长远来看,不管是过度治疗还是治疗不足都将给病人身体带来负面影响,以及产生更高的医疗费用。
2.临床决策支持系统
临床决策支持系统可以提高工作效率和诊疗质量。目前的临床决策支持系统分析医生输入的条目,比较其与医学指引不同的地方,从而提醒医生防止潜在的错误,如药物不良反应。通过部署这些系统,医疗服务提供方可以降低医疗事故率和索赔数,尤其是那些临床错误引起的医疗事故。在美国Metropolitan儿科重症病房的研究中,两个月内,临床决策支持系统就削减了40%的药品不良反应事件数量。
3.医疗数据透明度
提高医疗过程数据的透明度,可以使医疗从业者、医疗机构的绩效更透明,间接促进医疗服务质量的提高。
根据医疗服务提供方设置的操作和绩效数据集,可以进行数据分析并创建可视化的流程图和仪表盘,促进信息透明。流程图的目标是识别和分析临床变异和医疗废物的来源,然后优化流程。仅仅发布成本、质量和绩效数据,即使没有与之相应的物质上的奖励,也往往可以促进绩效的提高,使医疗服务机构提供更好的服务,从而更有竞争力。
4.远程病人监控
从对慢性病人的远程监控系统收集数据,并将分析结果反馈给监控设备(查看病人是否正在遵从医嘱),从而确定今后的用药和治疗方案。
2010年,美国有1.5亿慢性病患者,如糖尿病、充血性心脏衰竭、高血压患者,他们的医疗费用占到了医疗卫生系统医疗成本的80%。远程病人监护系统对治疗慢性病患者是非常有用的。远程病人监护系统包括家用心脏监测设备、血糖仪,甚至还包括芯片药片,芯片药片被患者摄入后,实时传送数据到电子病历数据库。举个例子,远程监控可以提醒医生对充血性心脏衰竭病人采取及时治疗措施,防止紧急状况发生,因为充血性心脏衰竭的标志之一是由于保水产生的体重增加现象,这可以通过远程监控实现预防。更多的好处是,通过对远程监控系统产生的数据的分析,可以减少病人住院时间,减少急诊量,实现提高家庭护理比例和门诊医生预约量的目标。
5.对病人档案的先进分析
在病人档案方面应用高级分析可以确定哪些人是某类疾病的易感人群。举例说,应用高级分析可以帮助识别哪些病人有患糖尿病的高风险,使他们尽早接受预防性保健方案。这些方法也可以帮患者从已经存在的疾病管理方案中找到最好的治疗方案。
二、付款/定价 对医疗支付方来说,通过大数据分析可以更好地对医疗服务进行定价。以美国为例,这将有潜力创造每年500亿美元的价值,其中一半来源于国家医疗开支的降低。
1.自动化系统
自动化系统(例如机器学习技术)检测欺诈行为。业内人士评估,每年有2%~4%的医疗索赔是欺诈性的或不合理的,因此检测索赔欺诈具有巨大的经济意义。通过一个全面的一致的索赔数据库和相应的算法,可以检测索赔准确性,查出欺诈行为。这种欺诈检测可以是追溯性的,也可以是实时的。在实时检测中,自动化系统可以在支付发生前就识别出欺诈,避免重大的损失。
2.基于卫生经济学和疗效研究的定价计划
在药品定价方面,制药公司可以参与分担治疗风险,比如基于治疗效果制定定价策略。这对医疗支付方的好处显而易见,有利于控制医疗保健成本支出。对患者来说,好处更加直接。他们能够以合理的价格获得创新的药物,并且这些药物经过基于疗效的研究。而对医药产品公司来说,更好的定价策略也是好处多多。他们可以获得更高的市场准入可能性,也可以通过创新的定价方案,更有针对性疗效药品的推出,获得更高的收入。
在欧洲,现在有一些基于卫生经济学和疗效的药品定价试点项目。
三、研发
医疗产品公司可以利用大数据提高研发效率。拿美国为例,这将创造每年超过1000亿美元的价值。
1.预测建模
医药公司在新药物的研发阶段,可以通过数据建模和分析,确定最有效率的投入产出比,从而配备最佳资源组合。模型基于药物临床试验阶段之前的数据集及早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。
2.提高临床试验设计的统计工具和算法 使用统计工具和算法,可以提高临床试验设计水平,并在临床试验阶段更容易地招募到患者。通过挖掘病人数据,评估招募患者是否符合试验条件,从而加快临床试验进程,提出更有效的临床试验设计建议,并能找出最合适的临床试验基地。比如那些拥有大量潜在符合条件的临床试验患者的试验基地可能是更理想的,或者在试验患者群体的规模和特征二者之间找到平衡。
3.临床实验数据的分析
分析临床试验数据和病人记录可以确定药品更多的适应症和发现副作用。在对临床试验数据和病人记录进行分析后,可以对药物进行重新定位,或者实现针对其他适应症的营销。实时或者近乎实时地收集不良反应报告可以促进药物警戒(药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防)。或者在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。
这些分析项目是非常重要的。可以看到最近几年药品撤市数量屡创新高,药品撤市可能给医药公司带来毁灭性的打击。2004年从市场上撤下的止痛药Vioxx,给默克公司造成70亿美元的损失,短短几天内就造成股东价值33%的损失。
四、更具体一些,大数据已经得到实际应用的已经有如下场景
1.组学大数据精准医疗
人类通过开展组学研究及不同组学间的关联研究,从环境、生活方式和行为等暴露组学,至个体细胞分子水平上的基因组学、表观组学、转录组学、蛋白组学、代谢组学、宏基因组学,再到个体健康和疾病状态的表型组学等。利用大数据将各种组学进行综合及整合,既能为疾病发生、预防和治疗提供全面、全新的认识,也有利于开展个体化医学,即通过系统整合生物医学与临床数据,可以更准确地预测个体患病风险和预后,有针对性地实施预防和治疗。
2.大数据虚拟药物研发
快速识别生物标志物和研发药物。利用某种疾病患者人群的临床数据和组学数据,可以快速识别有关疾病发生、预后或治疗效果的生物标志物。在药物研发方面,医学大数据使得人们对病因和疾病发生机制的理解更加深入,从而有助于识别生物靶点和研发药物。同时,充分利用海量临床数据和组学数据、已有药物的研究数据和高通量药物筛选,能加速药物筛选过程。
3.生物大数据流行病防治
快速筛检未知病原和发现可疑致病微生物。通过采集未知病原样本数据,对病原进行测序,并将未知病原与已知病原的基因序列进行比对,从而判断其为已知病原或与其最接近的病原类型,据此推测其来源和传播路线、开展药物筛选和相应的流行疾病防治。
4.互联网大数据公卫监测
利用互联网大数据以及有关专业数据实时开展公共卫生监测。公共卫生监测包括传染病监测、慢性非传染性疾病及相关危险因素监测、健康相关监测,如出生缺陷监测、食品安全风险监测等。此外,还可以通过覆盖全国的患者电子病历数据库进行疫情监测,通过监测社交媒体或频繁检索的词条来预测某些传染病的流行。
5.大数据健康管理
实时开展大数据健康管理,通过可穿戴设备对个体体征数据,如心率、脉率、呼吸频率、体温、热消耗量、血压、血糖、血氧、体脂含量等数据的实时、连续监测和流数据挖掘、分析,提供实时健康指导与建议,更科学地实施个性化健康管理。
6.大数据疾病谱研究
了解人群疾病谱的改变,这有助于制定新的疾病防治策略。全球疾病负担研究是一个应用大数据的实例,该研究应用的数据范围广、数据量巨大,近4700台并行台式计算机完成了数据准备、数据仓库建立和数据挖掘分析的自动化和规范化计算,应用大数据研究人群疾病谱。
7.大数据人群队列研究
以大数据为导向的人群队列研究逐渐成为医学研究的热点。超大规模队列研究具有大样本-如数十万人群,前瞻性-如数十年长期随访,多学科-如基础、临床、预防、信息等多学科合作,多病种-如对多种疾病进行研究,多因素-如探讨多种危险因素,整合性-如监测系统、信息系统、医保系统的整合,共享性-如生物标本和数据资源的共享,等特点,经过长期随访能够产出大量人群数据,基于大数据的人群队列研究更具有科学性、可靠性和权威性。
第二篇:医疗大数据及精准医疗
医疗大数据及精准医疗
谢邦昌
台北医学大学管理学院及大数据研究中心院长/主任
大数据的趋势以及价值是现在最热门的话题,也改变了许多企业经营的方式,对于各行各业来说是势必是一个大挑战,能否将大数据的力量从危机到转机就要看现代经营者有没有转变传统型态的思维?
首先什么是大数据?传统数据一年的数据量大概为3TB左右,以现今数据来说一天的资料量为50TB,由这简单的数据量差就可以得知传统数据跟现今数据的差异多么庞大,也就是现在俗称的大数据时代。数据庞大之下,不管是银行业、传统零售业、社会建设公共方面甚至是医疗保健产业对数据处理、分析方式以及经营企业的模式将会有所改变。
在过往的医疗诊断历史,到医院看病时必须耗费许多时间等待看诊,而医生看诊又要再花费时间。当医生要求病患拍摄X光片或检验时,又要再花额外许多时间诊断。而在现今医疗信息高度发展的台湾,看诊程序从网络挂号、候诊顺序、诊间病历调阅、医师医令、处方开立、放射影像存取、检查检验数据储存等,无数的数据信息便在医院中传递、交换、储存。同时大多数的生理检验信息在你回诊时得以从电子病历中检索,这些我们认为理所当然的信息处理,在台湾我们只要花费少许的时间如一个早上便完成了,而这一切正是仰赖医学信息分析与医疗大数据的交换处理。
医学大数据的产生,主要归功于医疗设备数字化及电子化病历发展两大领域的突破,透过仪器数字化,医院得以获得更多病人疾病与健康信息纪录。而在病人医疗诊断方面,为了完善纪录病患个人资料、诊断数据与过往医疗纪录等,即促成了电子病历系统发展。医学大数据发展由过去纸张记录、纸本信息数字化、医学纪录储存到现今多信息整合,其数据量有着爆炸性的成长,不仅由过去个人社经信息、诊断信息等文字媒介,更拓展到多媒体影像信息,如X光影像,动态视讯影像信息,如核磁共振MRI以及电讯号信息,如心电图等等,这些庞大医学数据的汇集与高度整合技术能力,正是台湾医学信息领域发展领先的原因,同时更显得医学数据发展的多元应用及其重要性。
而由医疗健保产业来说,个人医疗信息终端的产生给医疗产业带来革命性的变化,连结了传统医院、政府(社会保障)、保险公司、药物生产公司等相关产业,形成新的行业生态圈。将互联网+医疗保健去建构一个智能的健康系统,在整个健康系统下会有智能的合作伙伴,包含医院、医生、诊所、学术中心、保险公司、药厂、医疗设备制造商、政府等相关人员等,接着产生出个人化的护理体系,其中包含个人健康、成本节约、提高效率、病人教育、增强通信、绩效度量、预防等相关内容,使得人们有着更健康的社会。
经常听到的医疗云、照护云以及健康云都是运用云端技术结合大数据去提供健康咨询的服务。在网络普及下,人手一台智能型手机让这些云更能够去发挥,客户只需要使用健康感知的终端,其中包含穿戴型装置、爱睡宝、电视机以及相关的智能型测量装置,就能够让亲人、医生以及相关的护理人员得知目前的身体状态,不仅如此,还可以远程监护以及远程门诊,一切都透过远程医疗平台让人们有着安全、方便、快速及健康舒适的生活环境。
大数据在生技医疗卫生发展状况及应用,大数据已深耕于经济领域且创造了巨大的经济价值
美国的大数据产业已经创造了巨大的价值,具体表现在:大数据使美国医疗服务质量得到提高。
对于医疗服务的提供方和支付方来说,在减少医疗成本的同时不断提高医疗质量和效率仍然是一个难以实现的目标,而这也是改善民生的重大机遇。2010年,全美医疗支出占国内生产总值的17.9%,比2000年增长13.8%。而且,某些慢性疾病如糖尿病的患病率正在增加,正在消耗更多的医疗资源。
对这些疾病和其他相关健康服务的管理将深刻地影响国家的福祉。在这方面大数据可以发挥作用。为在广大人群中取得最有效的医疗效果,更多地使用电子健康记录(电子健康档案),并与新的分析工具相结合,将提供挖掘信息的机会。研究人员可以利用信息寻找有效的统计趋势,并依据真实的医疗服务质量开展医疗评估。
大数据在医疗及生技业之应用
医疗及生技业大数据应用的当前需求来自疫情和健康趋势分析、电子病例、医学研发、临床试验等领域。
疫情和健康分析趋势
利用大数据进行疫情分析,说明这个地方可能处于某种疾病蔓延,实时掌握病情。
Google和疾管局一样能够掌握流感疫情
2009年又冒出了一种新的流感病毒,称为H1N1。这种新菌株结合了禽流感和猪流感病毒,迅速蔓延。短短几星期内,全球的公共卫生机构都忧心忡忡,担心即将爆发流感大流行。有些人发出警讯,认为这次爆发可能与1918年的西班牙流感不相上下,当时感染人数达到五亿人,最后夺走数千万人的性命。雪上加霜的是,面对流感可能爆发,却还没有能派上用场的疫苗,公共卫生当局唯一能努力的,就是减缓其蔓延的速度。为了达到这项目的,必须先知道当前流行感染的范围及程度。在美国,疾病管制局(CDC)要求医生一碰到新流感病例,就必须立刻通报。即使如此,通报的速度仍然总是慢了病毒一步,大约是慢上一到两星期。毕竟,民众觉得身体不舒服之后,通常还是会过个几天才就医,而层层通报回到疾管局也需要时间,更别提疾管局要每星期才整理一次通报来的数据。但是面对迅速蔓延的疫情,拖个两星期简直就像是拖了一个世纪,会在最关键的时刻,让公共卫生当局完全无法掌握真实情况。
说巧不巧,就在H1N1跃上新闻头条的几星期前,网络巨擘Google旗下的几位工程师,在著名的《自然》科学期刊发表了一篇重要的论文,当时并未引起一般人的注意,只在卫生当局和计算机科学圈里引起讨论。该篇论文解释了Google能如何「预测」美国在冬天即将爆发流感,甚至还能精准定位到是哪些州。谷歌的秘诀,就是看看民众在网络上搜寻些什么。由于Google每天会接收到超过三十亿笔的搜寻,而且会把它们全部储存起来,那就会有大量的数据得以运用。
Google先挑出美国人最常使用的前五千万个搜寻字眼,再与美国疾病管制局在2003年到2008年之间的流感传播数据,加以比对。Google的想法,是想靠着民众在网络上搜寻什么关键词,找出那些感染了流感的人。虽然也曾有人就网络搜寻字眼做过类似的努力,但是从来没人能像Google一样掌握巨量数据(big data,直译为大数据),并具备强大的处理能力和在统计上的专业技能。
虽然Google已经猜到,民众的搜寻字眼可能与流感有关,像是「止咳退烧」,但相不相关其实不是真正的重点,他们设计的系统也不是从这个角度出发。Google这套系统真正做的,是要针对搜寻字眼的搜寻频率,找出和流感传播的时间、地区,有没有统计上的相关性。他们总共用上了高达4亿5千万种不同的数学模型,测试各种搜寻字眼,再与疾管局在2007年与2008年的实际流感病例加以比较。这套软件找出了一组共四十五个搜寻字眼,放进数学模型之后,预测结果会与官方公布的全美真实数据十分符合,有强烈的相关性。
于是,他们就像疾管局一样能够掌握流感疫情,但可不是
一、两星期之后的事,而是几近实时同步的掌握!因此,在2009年发生H1N1危机的时候,比起政府手中的数据(以及无可避免的通报延迟),Google系统能提供更有用、更及时的信息。公卫当局有了这种宝贵的信息,控制疫情如虎添翼。
最惊人的是,Google的这套方法并不需要去采集检体、也不用登门造访各家医院诊所,而只是好好利用了巨量数据,也就是用全新的方式来使用信息,以取得实用且价值非凡的见解、商机或服务。有了Google这套系统,下次爆发流感的时候,全球就有了更佳的工具能够加以预测、并防止疫情蔓延。
电子病例
将分散在医院中的各个部门、各式各样的病例集中在云端,医生们可透过语意搜查找出任何病例中的相关讯息,进而为医学诊断提供更加丰富的数据。可提供以病患为中心的个人化疗程建议,或帮助对医疗问题及其患病率进行自动诊断。台湾的医疗黑金:健保数据库 Google台湾董事总经理简立峰曾表示:「我认为最有价值的宝藏,就是台湾的全民健保数据库。」,台湾医疗产业贯穿上下游的数据,全在健保数据库里面,而且几乎所有人都要加入,全世界只有台湾拥有如此完整的数据库。美国麻省理工学院电机与计算机科学院教授约John Guttag也说,相较于美国,台湾的健保是由政府买单,这让医疗数据取得变得容易,「这是台湾的机会,未来也很有机会从中获利。」
累积15年来、2千3百万人民的健保数据库,正等待着识货的伯乐来挖宝。台中荣总医生、阳明大学教授吴俊颖以亲身经验说明,过去医学界只知道,幽门螺旋杆菌跟胃癌有关,但是却没有规模够大、时间够长的临床实验可以证实,他与研究团队藉由探勘台湾的健保数据库,发现服药根除幽门螺旋杆菌,可以降低胃癌的发生率。
这篇论文不只发表在肠胃科排名第一的杂志《肠胃病学》上,更震撼了日本医学界。日本是全球胃癌罹患率最高的国家,当地医生特别把这篇论文翻译成日文,并且说服日本厚生省,对幽门螺旋杆菌感染患者全面给付杀菌疗程,不仅影响医师的临床运作、政府决策,甚至有可能改变国际性医疗行为准则。
吴俊颖认为,台湾的健保数据库内容巨细靡遗,所有医疗项目都记录得一清二楚,「它像是永不干涸的黑金,当数据越来越多串联和使用,就会越来越有价值。」然而,吴俊颖也提到,健保数据库有个缺点,就是缺乏诊断和检测结果。麻省理工学院教授Peter Szolovits也曾举例说明过,如果有一位病患发现关节肿起来,医生跟他说这「疑似」是风湿性关节炎,因此记录风湿性关节炎的费用,可能后来病人发现根本不是这个病,如果把这笔数据用在风湿性关节炎的医疗研究上,那就会变成糟糕的数据,影响研究结果。
「如果能够把健保数据库与医院病历的数据库做结合,那它就会变成最完美的医疗数据库!」吴俊颖提到,病历数据包含检测和治疗的结果,不只对于台湾医疗产业来说非常有价值,国内外的生技和医药大厂,也都会抢着要跟台湾合作。想象一个情境,有天当你到南部度假,突然感到身体不适,就近到当地的诊所就医。第一次跟你见面的医生,登入全台湾共享的医疗数据库,调出你在其他医院的病历数据,花几分钟就能对你的身体了如指掌,还能透过临床决策辅助系统,显示出跟你有相同症状的病友群体、使用各种药物的治疗状况,透过大数据分析可以协助医生在最短时间内,找出最适合的治疗方式。
「很多人以为这样的愿景,离现实生活非常遥远,其实台湾已经走在半路上了。」台大医院竹东分院院长王明巨如此说道。的确,台湾医疗机构的病历电子化程度很高,很有可能成为全球第一个全国医院流通电子病历的国家。医学研发
运用实时监测及分析大量的仪器数据,建构预测模型,并利用统计工具改善临床试验设计,分析临床试验数据。发展个人化医学及疾病发作模式等医疗研发。利用大数据解决多发性硬化症的算法运算复杂度
位于水牛城的纽约州立大学(SUNY)是一个领先全球的多发性硬化症(MS)研 究中心。MS是一种具破坏性的、面性的神经系统疾病,影养全球近百人。这种疾病会使人的大脑和骨随发炎并产生神经病,导致患者可能出现行动不便、视力受损、疼痛等症状。
MS的病因是很复杂的,没有一个单一基因是可能的致病源。因此自2007年以来,SUNY就一直希望透过扫描MS患者的基因组的变化来开发新的治疗方式,透过从原本成千上万的基因序列的变异SNP,SNP指的是单核桃多型性,来获得单一样品,研究基因产物和其他基因产物及环境因素进行的交互作用。
研究人员的想法是以多个SNP变异点结合不同的环境变因,并使用一种被称之为「AMBIENCE」的算法,来检测县性和非线性两种数据数据中的相关性,以识别这些交互作用之间的关系。但是这个想法就如同大海捞针,因为环境变因包括像是实验对象曝晒太阳的时间长短、维生素D产生的量、吸烟的情况等皆有可能影响研究结果。况且人类的基因由23对染色体所组成,其中包含约30亿个DNA碱基对,这些因变量和应变量数量多到吓人,必须靠建构一套计算量高达1018的高等分析模型才能解决。
因此SUNY与IBM合作,建构一套搭配软硬件的数据分析系统,以往平均需要27.2小时的工作,缩短到现在只要11.7分钟即可完成。而且这套系统不仅大大简化和加速了复杂的分析过程,还提供了不同类型的变量值,如:分类变量、分配卜瓦松变量或连续常态变量等。过去,只要研究中增加一个新的变量值,研究团队就必须重新编写整个算法,而现在只需按几个键即可完成。
大数据系统分析的应用除了MS的研究以外,全球估计超过3300万人感染,至今没有方法可以完全治愈的艾滋病,以及罕见疾病等,都已开始利用大数据进行大型的医学研究。
临床实验
临床试验藉由大数据而有了重大的改变,可利用临床验数据、仪器读数等,进行比较效果研究、临床决策支持系统、远距病人监测及加强医学数据透明度等方面。
拥有数据数据保护的早产儿
所谓的早产儿是指怀孕不到37周就提早出世的宝宝。这些提早降临人世的小仙子,如果出生后体重不到1500公克,很可能会因为免疫系统尚未发育完全而受到感染,一旦感染之后就很容易引起呼吸衰竭、肺出血及败血症。
不过,加拿大多伦多市立儿童医院里的早产儿,却可以睡得特别安详,因为他们是有数据数据保护的「data baby」。随着医疗设备的发展,利用医疗监测仪器监测病患的生命征象,如血压、心跳和体温等,已经是非常普遍的事了。通常这些仪器还具有警报功能,一旦生理的数据数值超出正常范围时就会发出警示,医疗人员就会采取因应行动。但是即使医术再精湛、经验再丰富的医护人员,可能也无法准确地察觉这些异常的发生时间和严重性,尤其当发生在脆弱的早产儿生身上。根据美国弗吉尼亚大学追踪以往的数据显示,新生儿受到感染初期的12到24小时,因为脉搏和心跳几乎都可在接受的范围内,因此医护人员很难从生命征象数据的改变中察觉,等到警示灯响起,常常为时已晚。
连续监测和记录这些生理性数据,可以观察出新生儿是否遭受感染的早期征兆,但数据量实在太过庞大了。估计这些监测设备每一秒钟就会产生1000个读数。以往是30到60分钟由医护人员归纳出一个数据做为纪录,然后储存72小时。如果要把这些读数统统记录起来,根本是不可能的事。
但这项不可能的任务,并没有吓跑安大略省理工学院和IBM。他们使用来自怀生研究中心的最新技术,利用江河运算平台支持大量数据的收集和分析,一天24小时不间断地收集和记录着包括早产儿的体温、心跳、血氧饱和浓度和血压等电子监测仪器产生的大量数据,以及周遭环境如温度、湿度等相关数据。在保护病人的隐私安全考虑下,这些数据会直接传到安大略省理工学院研究中心和IBM华生研究中心;系统会分析和研究哪些因素的交互作用会造成感染,甚至哪几床的新生儿因为符合条件较多,可能出现疾病或感染的风险较大。之后,系统再将分析结果提供给医护人员比较判读。这些动作都在数秒内完成。藉由这项计划,儿童病房里的医护人员已经可以提前18到24小时,预防新生儿败血症的发生。
由于大数据在规模(Volume)、增加速度(Velocity),以及价值性(Value)上正呈现几何上升,而其数据所表现的多样性变化(Variety)与数据的有效性(Validation),更容易成为企业的风险源头。面对排山倒海而来的大数据,企业需运用大数据,迅速将数据转化成商业智能,运用分析信息,提升市场的洞察能力,做出更准确的营运决策。例如:电信业者可以分析手机在基地台漫游的特性,提供更好的在地费率;信用卡业者可以每天定期分析各种信用贷款所产生的风险,动态调整信贷利率;便利超商可以分析消费者的购买习惯,动态调整架上存货数量等;制造业者可透过现场制造系统所记录的大量在线实时生产数据进行分析,以协助制造业改善制程、提升良率,并减少物料浪费。因此大数据将是企业未来所面临的关键挑战。鉴于目前信息以超乎想象的速度产生、累积、消逝,而企业所面临的商机亦有相同的循环表现。透过海量信息的实时性分析与运用,将可对不同信息的需求者,产生不一样的价值与意义。若能持续在既有的数据中发掘价值,同时考虑动态信息所带动的巨大冲击,并藉此掌握瞬息万变的市场契机,则大数据的分析与应用,将有助于各类型企业在相关营运领域中,引领下一阶段的企业永续发展。基于以上的发展潮流与态势,麦肯锡(Mckinsey)管理顾问公司于2010年已指出未来引领企业发展趋势的十大科技,其中即包含了大数据的获取与分析、云端运算服务的公共价值,以及企业多层面的参与互动及服务。在这些技术与行动通讯网络的整合应用下,企业未来所产生的数据量将呈现倍数成长,并导致过去传统的储存技术即将遇到瓶颈,因此,虚拟化的云端运算分析技术,以及大数据的管理,将成为各方面所即将面临处理的新课题。从目前的技术发展 来看,未来各项实体化设施,将可能在未来藉由虚拟化的技术,得以降低各项成本的支出,然而云端运算与大数据的应用,绝非仅为建置一个大型数据中心即可,对于后续所产生大量数据下的数量管控、数据的质量与分析结果,以及这些数据所衍生之相关应用与服务,才是现阶段所应关心的重点。计算设施(Computer)网络设施(Network)储存设施(Storage)数据数量管控数据应用服务数据质量分析虚拟化(Virtualization)为了结合技术、数据,以及应用分析与服务等三项议题的探讨,本演讲大数据主要阐述BIG DATA 在生技医疗卫生上之应用与研究;抛砖引玉系望能激起大家投入医疗大数据的研究!
第三篇:精准医疗
美国总统奥巴马在2015年国情咨文演讲中谈到“人类基因组计划”所取得的成果,并宣布了新的项目——精准医疗计划(Precision Medicine Initiative)。
精准医疗是由个性化医疗(personalized medicine)的概念衍生而来的。个性化医疗所关注的疾病治疗和预防的核心是个体,根据每个病人的个人特征制定个性化治疗方案。当前的药物越来越趋向于精确面向患有特定疾病的大量患者中少量特定人群,这部分人群有相同的分子特征,同时在分子层面上产生的问题上也保持一致。在具体实践过程中,精准医疗是指以个人基因组信息为基础,结合蛋白质组、代谢组等相关内环境信息,为患者量身设计出最佳治疗方案,以期达到治疗效果最大化和副作用最小化的一门定制医疗模式。
精准医疗的概念——即针对不同个体采取不同的预防与治疗措施——并非新鲜事物,事实上,在一个多世纪前,血型分析以及用来指导输血了。但有关精准医疗的广泛应用,还是在开发了大规模的生物数据库、通过组学等手段有效区分不同病人、以及大数据分析工具得以改进的基础上才实现的。
该计划主要包括两个方面:近期对癌症治疗的关注以及长远对健康和疾病整个范围知识应用的认识。
精准医疗的短期目标:癌症治疗
肿瘤治疗被选为精准医疗的短期目标。随着人口老龄化的进程加快,癌症已是美国以及全球其他地区主要的死亡原因。研究人员已发现,许多分子病变是驱动癌症的诱因,这表明不同癌症都有自己的基因印记、肿瘤标记物以及变异类型。虽然癌症主要是由日常生活中基因损伤积累所导致的,但可遗传性基因变异通常会增加患癌风险。这种对致癌机制的新理解已影响了在药物和抗体设计过程中,对癌症风险、分类诊断以及治疗策略的评估。许多靶向疗法已经或正在研发。
但目前常用的抗肿瘤化疗药物对患者治疗的有效性低于70%,约20%-35%的患者接受了不恰当的药物治疗。由于患者没有时间承受反复实验和不断摸索,如果在肿瘤治疗过程中能够实施个体化治疗,将能够大大提高疗效,避免过度治疗和降低患者经济负担,减少医疗资源的浪费。
随着药物基因组学以及蛋白质组学、转录组学等高通量分子检测技术的出现,分子靶向技术治疗癌症的个体化治疗手段——即从个体基因组中分析和鉴别患者之间存在的疾病相关的个体差异,并利用这些差异来合理的指导临床治疗,已经成为医学界广泛共识。所谓靶向治疗是指根据肿瘤的不同的特异性位点,抗肿瘤药物靶向性地与其发生作用从而杀死肿瘤细胞,而对正常组织影响较小。这是目前最理想的治疗模式。然而,同化疗药物一样,不同靶向药物对所有患者的有效率都非常低,通常在25%以下。造成有效率低下的主要原因在于患者体内存在单核苷酸多态性(SNP)。SNP的复杂性,决定了药物反应的多态性,药物疗效及最佳用药剂量很大程度上取决于药物相关基因变异。所以个体化用药,及个体化治疗已经成为恶性肿瘤、高血压、糖尿病等重大慢性疾病临床治疗的发展方向和最有效的手段。
例如,卫生部2010年11月首次发布了《结直肠癌诊疗规范》,明确规定:确诊为复发或转移性结直肠癌时,应进行相关基因状态检测,制定个体化治疗方案,患者确定为复发或转移性结直肠癌接受爱必妥、帕尼单抗(抗EGFR单抗)时,必须检测肿瘤组织的KRAS基因状态。肿瘤细胞表面存在着接收不同信号的通道。抗EGFR单抗通过阻断EGFR二聚体的形成,抑制其下游的细胞内信号传导,从而抑制肿瘤细胞的存活、增值等。但如果KRAS基因突变可旁路激活细胞内信号传导,从而导致抗EGFR单抗失效。所以,通过检测KRAS基因有否突变,医生就可以有针对性的区别给药。
精准医疗的长远目标:健康管理
精准医疗计划的第二部分是将加大科研进步,从而提升对疾病风险评估、疾病机制把握以及许多疾病最佳治疗方案的预测,这对扩大精准医疗在健康和卫生保健等诸多领域带来益处。
该计划将鼓励和支持新一代的科学家开发创造性的新方法来检测、测量和分析范围广泛的生物医学信息——包括分子、基因、细胞、临床、行为、生理和环境参数在内。在未来:今天的血液计数可能被数以百计的不同类型的免疫细胞普查所被取代;医疗移动设备可实现实时提供监测血糖、血压和心脏节律等方面的数据;基因型可能会揭示特定的基因变异,从而为特定的疾病提供保护;对粪便的取样可识别导致肥胖的肠道微生物。另外,血液检测也可检测出癌症早期出现或复发的肿瘤细胞或肿瘤DNA等。
精准医疗能提供一个强大的框架方案,加快其在不同领域的应用,最明显的是遗传疾病和传染病领域,在其他疾病和环境响应中也已获得积极反馈。
中国精准医疗计划将在2015下半年或明年启动,在2030年前,中国精准医疗将投入600亿元。今年2月,总书记批示科技部和国家卫生计生委,要求国家成立中国精准医疗战略专家组,共19位专家组成了国家精准医疗战略专家委员会。有了领导的重视,人力和经费的保障,相信我国在精准医疗领域必将大有作为。
如前所述,目前精准医疗的产品主要集中在肿瘤突变分子检测的用药指导方面,目前相关产品包括有关肿瘤基因突变、融合、表达等检测项目。由于在多项肿瘤诊疗规范中都规定了使用靶向药物等之前,必须要对相关基因突变情况进行检测,因此该市场潜力巨大。
肿瘤领域的基因测序是精准医疗最重要的组成部分,其应用将覆盖肿瘤的易感基因检测,早期筛查,疾病确诊,个性化用药指导,随诊与疗效评价等众多治疗环节。根据世卫组织(WHO)发表的《全球癌症报告2014》,全球癌症病例增长快速,从2012年的1400万人到2025年的1900万人和2035年的2400万人,全球癌症患者和死亡病例都在令人不安地增加,新增癌症病例有近一半出现在亚洲,其中大部分在中国,中国新增癌症病例高居第一位,肿瘤作为人类寿命的头号威胁其发病率和消费刚性远超产前筛查等市场。
基因测序技术是肿瘤个体化治疗的必备,一是检测肿瘤易感基因,利用DNA测序技术确认导致患者患病的基因或者受检者是否携带有肿瘤易感基因,寻找患者适用的肿瘤靶向治疗药物或者其他适宜的治疗手段。如果能在肿瘤早期阶段发现,并干预治疗,将极大地提高治愈率,显著延长患者生存时间,无论是CTC,还是ctDNA,都是聚焦外周血肿瘤早期筛查,高通量测序是主要技术手段。二是检测肿瘤靶向药靶点,在分子靶向药使用之前检测病人是否携带药物靶点,实现肿瘤的个体化治疗,以提高用药效率,达到最佳疗效并减少治疗费用。目前FDA已经批准了部分基因诊断肿瘤个体化治疗方案,高通量测序技术未来在现有的肿瘤个体化治疗基础上,或将提供更为详尽的治疗与用药方案,并能够更为高效地发现和药物作用机制有关的基因靶点,这些都具有重要的临床意义。
精准医疗具有广阔的前景,但就目前市场推广而言,还有些不能忽视的要素,譬如监管部门的控制力度、医疗保险的覆盖程度。以及医生的接受程度等。
第四篇:精准医学和大数据将成为医疗行业的助力(模版)
精准医学和大数据将成为医疗行业的助力
到目前为止,医疗行业还是采取通用型(one-size-fits-all)方式,但是如果我们能够根据看护人员和卫生保健专业人员收集到的数据点来评估治疗会怎么样呢?这就是精准医学,一种基于数据、算法和精准分子工具的新型医疗形式。
例如,在精准医学方面处于领先地位的加州大学旧金山分校目前正在训练医生在诊断和治疗的过程中要和他们的病人进行不同的对话,以便于对他们的而社会、环境和经济等背景情况有所了解。精准医学将人们对医疗的关注点从识别症状到了解并治疗疾病机制。另外,精准医学还在环境和社会因素对健康的影响有所侧重。那些了解科技和医学目标的人能够为解读和联系这些数据点提供平台,在精准医学的价值链当中创造价值。精准医学的概念不是美国总统奥巴马首次提出的,但是却因为去年初奥巴马在在美国国会作国情咨文报告时提出精准医学一词,使其成为世界各国关注的热点。我国也在去年成立了19人的国家精准医疗战略专家委员会,并计划在2030年前投入600亿元。
精准医疗是增加疗效,降低副作用,降低治疗费用的重要手段。詹启敏院士表示,目前的医疗技术很多都已经达到了“天花板”,临床治疗方案的效果已经达到极限。比如,同样的肿瘤类型和同样的疾病分期病人,采用相同的治疗方案情况下,只有不到50%的病人产生理想疗效,50%~70%的病人效果不明显或者没有疗效。治疗过程中有很大的被动和盲目性。根据前瞻产业研究院的数据显示,精准医学中的基因测序市场规模年均复合增速达到21.2%,到2018年预计将会突破1.1万亿的市场规模。
詹启敏院士表示,精准医学的发展离不开生物样本库、多组学分析平台及大数据三大平台的支撑。“谁拥有生物样本资源谁就掌握了医学科技的主动权,谁就能占据医学竞争的制高点。”而多组学分析平台是大数据的重要来源,包括测序技术、芯片技术以及培养培养组学、大数据、医学复合型人才团队等。第三,大数据平台本身包括数据的搜集、储存、分析、利用、共享和安全。这些数据包括了社区数据、队列数据、临床数据、组学数据还有结构生物学、药物分子信息等等,大数据在药物研发里面可以帮助确立新靶点、新结构,研发新药物,帮助制订新的诊疗方案以及确定在诊疗过程当中新的标准、新的规范
和指南。
近年来,资本在精准医学领域的布局呈现出日趋火热的态势。有相关统计显示,截止目前,国内精准医疗投资标的共计171家,领域分布于基因测序、PCR、基因芯片、液体活检、细胞免疫治疗、抗体药物以及肿瘤大数据、抗体相关、精准诊断等。此前曾有分析指出,目前精准医疗正处于绝佳布局良机。一方面精准医疗行业正在蓬勃兴起,未来将涌现出非常多的投资标的;另一方面,精准医疗目前正处于想象到现实的爆发临界点,如基因测序成本已经降到1000美元以下,未来还仍将继续呈下降趋势,这让精准医疗的大规模应用指日可待,而大数据技术的发展,也使基金测序数据的处理能力快速显著提升。
第五篇:“数据”引领 “精准”扶贫
《人民邮电》“数据”引领 “精准”扶贫
——中国电信甘肃公司以大数据服务地方扶贫项目纪实
【发布日期: 2016/1/8 15:06:35】 【浏览量: 565】
“贫困人口多、贫困程度深,致贫因素多、脱贫难度大”,这是甘肃省委书记王三运对甘肃现阶段基本省情的判断。基于这样的认识,甘肃各级政府和企业都对扶贫开发给予了足够的重视并注入大量资源,中国电信甘肃公司也不例外。
“政府的需求和人民大众的利益,就是甘肃公司业务发展的力量源泉,更是目标和方向。”这是中国电信甘肃公司总经理、万维公司董事长秦学寿的坚持,也是甘肃电信以大数据服务地方精准扶贫脱贫的动力。
从最初的村通电话,到现在的双联“8分卡”、4G网络覆盖;从之前的宽带进村到如今的光纤入户、信息扶贫,每一项技术的革新和业务的推出,无不体现着甘肃电信服务民生的实际行动。如今,由其旗下全资子公司甘肃万维承建并提供服务支撑的“甘肃大数据精准扶贫管理平台”更是吹响了以大数据开展行业扶贫的号角,并凭借着雄厚的硬件和技术实力,将政府精准扶贫、精准脱贫的“精准”二字诠释得淋漓尽致。
大数据的“魔力”
针对基本省情,近年来,甘肃相继实施了“联村联户为民富民”行动、“1236”扶贫攻坚行动,有效凝聚了各方资源和力量,使全省贫困人口由692万减少到417万,贫困面由33.2%下降到19.8%。随着贫困人口的减少,过去“修一条路就能给群众打开一扇脱贫致富大门”的“撒胡椒面”式粗放扶贫已不能适应当前省情,必须向“个性化定制”的精准扶贫转变。2015年6月,甘肃省围绕“精准扶贫、精准脱贫”的总体要求,在全国率先出台了“1+17”的精准扶贫系统性工作方案。这套组合拳整合医疗、教育、农牧等所有与扶贫相关的职能部门,针对贫困户“量体裁衣”,释放政策叠加效应。在此基础上,11月底,又出台了“853”精准脱贫管理办法,狠抓精准识别,力求将军令状细化为作战图,把作战图转化为战果图。
但如何做到精准?417万贫困人口主要分布在哪、为何贫困、怎么让帮扶措施落实?非严谨细致不足以求公平,非实事求是不足以树公信。靠全省14个市州、86个县的工作人员零散的记录和统计肯定不行,这种情况下,甘肃省委、省政府提出用互联网信息化技术作为抓手,建立全省精准扶贫大数据平台。
作为“精准扶贫大数据平台”的承建者,甘肃电信万维公司第一时间与省扶贫办进行了需求对接。2015年6月11日,“全省精准扶贫精准脱贫工作会议”召开后,省长刘伟平组织召开办公会议,将“精准扶贫大数据平台”建设作为落实全省精准扶贫政策的第一件大事,进行了专题研究,提出了运用互联网平台和大数据分析等现代信息技术,通过对扶贫对象的识别、扶贫措施的落实、信息数据的分析、扶贫成效的跟踪等,形成扶贫动态化、全过程闭环管理的要求。6月12日,甘肃电信万维公司抽调70多名技术人员组成平台建设团队,正式开始平台的搭建和功能研发。
从中央到地方,从政府到企业,从工作人员到贫困户,“精准扶贫大数据平台”的建设被寄予厚望,也赢得了众多关注的目光。平台建设启动以来,省长刘伟平,省委副书记欧阳坚,省委常委、统战部部长王玺玉多次听取进度汇报,分析存在的问题,提出建设意见和要求。
2015年9月10日,甘肃省被列为国家扶贫办全国大数据平台建设试点省份,成为在全国率先探索建设精准扶贫大数据管理平台的省。
9月18日,“三西”扶贫开发现场会议召开之际,国务院副总理汪洋在甘肃省委书记王三运的陪同下,专程赴定西市安定区李家堡镇窑坡村考察精准扶贫工作,其间详细了解了“精准扶贫大数据管理平台”的建设和使用情况,对甘肃省用大数据手段进行精准扶贫工作给予肯定。
同日,国务院扶贫办主任刘永富带领八部委九省区的相关领导观看了“甘肃省精准扶贫大数据管理平台”演示,要求通过大数据平台的管理,使精准扶贫工作得到进一步提升。
9月21日,在全国扶贫办主任座谈会上,甘肃省专门就“精准扶贫大数据管理平台”进行了汇报、演示,获得与会人员的广泛认可……
用“数据”说话
准确的数据提取和分析能力是大数据平台赢得各方关注的关键,也是价值所在。
近年来,中国电信甘肃公司依托丰富的通信基础设施,以先进的网络技术、强大的网络运行维护能力和丰富的网络管理经验为支撑,积极运用大数据、“互联网+”服务社会大众和行业发展,在政务、教育、金融、交通等各个领域取得了显著成效。此次与政府部门合作建设精准扶贫大数据平台,就是甘肃电信以智力支持和技术服务全面参与行业扶贫的积极探索与尝试。
建成后的平台按照功能分为扶贫对象、扶贫措施、扶贫成效、数据分析、绩效考核五个模块,模块间相互依存又互相独立。拿扶贫对象模块来说,在贫困户管理栏,任意选择一位贫困户,就可以看到该贫困户的生产生活情况、帮扶措施、帮扶成效等。在此基础上,平台还打通了与扶贫开发工作相关的行业部门之间的信息通道,可以通过与民政、银行、教育、住建等行业部门数据对接,建立智能分析模型,准确评估“1+17”扶贫措施叠加效应,使得扶贫对象、措施到户、项目安排、资金使用、脱贫成效更精准。
目前,大数据平台已与省卫计委新农合报销平台无缝对接,精准扶贫平台中的417万贫困户在医院就医时,刷新农合的报销卡就会自动享受特殊优惠政策,不但简化了报销流程,而且使数据实时同步,方便了资金监管。基础数据的“精准”是平台所有功能的基础,为此,平台还增加用户审计功能,与其他系统互联互通,统一识别标志,统一数据口径,实现扶贫对象全方位对比,为基层实现扶贫对象实名制动态管理提供数据依据。
通过“互联网+”和大数据对扶贫项目进行精准管理,其最终目的就是要彻底改变过去那种项目点多面广、资金零星分散、投向不准、程序不规范的状况,实现扶贫项目监管信息化、精准化和动态化,从制度上、程序上、行为上堵塞漏洞。
2015年6月底,甘肃省教育厅和扶贫办制定“精准扶贫教育支持计划”,对纳入扶贫大数据库的贫困家庭子女免收学前教育阶段保教费;对贫困家庭中职学生按照每人每年2000元标准发放助学金;对进入省内高职院校的贫困家庭学生免除学费和书本费;对贫困家庭考入高职、本科院校的学生给予每学年最高8000元的助学贷款。与此同时,省教育厅还将依据大数据平台,精准开展招生扶贫,到2017年,全省每年将有约8万名贫困家庭中职学生和约4.6万名贫困家庭高职(专科)学生接受免费职业教育。
“大数据平台的采集摸底,让我们进一步掌握了贫困家庭各个学龄段学生的状况,哪些孩子是适龄入学儿童,哪一家享受什么优惠政策,真正不让一个孩子因为贫困而失学,不让一户贫困家庭在享受国家政策上漏掉。”陇西县教育局局长杨海宾说。
大数据平台与政府的需求相融合,与贫困户的渴望相碰撞,还产生了改善农业生产条件和发展现代农业的蓬勃力量。天水市秦州区针对农户在诸如种植、养殖业建设,以及化肥、地膜、农药等配套设施中资金链断裂的瓶颈制约,依据大数据平台,以3~5户联保形式进行贷款扶持,真正把“扶贫之水”精准滴灌到“最干旱禾苗”上。太京镇张吴山村村民贾坝求就是这种模式的受益者,他家依托扶贫项目种植了5亩苹果园,现在又申请到政府提供的5万元扶贫贴息贷款,为果园设施大棚建设提供了资金保障。
“政府派来的帮扶工作队已经把我们家的经济情况录入档案,将根据这个档案给我争取扶贫帮扶政策,帮助我发展养殖业。到2020年,我家的人均纯收入将达到1万元。”这是目前家庭人均纯收入只有3000元的陇南成县二郎乡店子村村民张志强的打算。
事实上,在大数据管理平台的支撑和不断完善下,像贾坝求、张志强这样的贫困户今后将会不断获得来自政府和企业更多具有针对性的帮扶,实现脱贫致富的梦想。
基于“数据”的合力
“精准扶贫大数据管理平台”的建设,经历了顶层设计、软件开发、数据采集三个层面的工作。在设计中,省扶贫办组织涉及精准扶贫方案的23个省直相关行业部门,先后召开20余次业务研讨会议,将“1+17”各项政策措施设计成信息采集表,分为户级、村级、县级数据结构,嵌入大数据云平台,精准掌握贫困户的情况;数据采集中,全省共有15万名工作人员参与,对贫困户的信息进行核实录入,省直各行业部门对平台汇总数据进行确认对接,确保数据准确有效;甘肃电信万维公司则根据平台建设需求,75个团队成员同时开工,放弃休息,高速运转,边研发、边试点、边应用,使平台在短短的几个月时间内不断完善并稳步运营。
2015年6月11日,专题部署平台建设所需人员及资源保障;
6月12日,召开项目启动会,开始框架设计;
6月18日,进行需求对接,正式开始软件开发;
6月26日,大数据平台1.0版上线;
8月,配合省扶贫办进行第一次数据采集; 9月10日,对照问题开始2.0版本研发;
10月8日,2.0版上线,并紧接着配合用户单位进行了第二次、第三次数据采集……
这份平台建设时间表直观反映了甘肃电信万维公司建设团队的工作效率。团队制定了详细周密的“作战计划”,需求统筹、业务开发、大数据分析、运行维护、移动App开发,各个“作战”单元各司其职,认真研究每一个需求,探讨每一个技术细节。由于平台涉及面广,用户一点小小的需求,往往需要开发人员进行数个甚至数十个步骤的设计和程序编写,根据需求设计的平台“宏观框架图”达到近10米,堪称万维公司之最。
要保质保量完成平台建设任务,整个团队70多个成员的工作进度就要保持高度一致,在2015年6月团队组建到7月初第一阶段工作结束的25天、600个小时中,大家吃住在单位,夜以继日、通宵达旦地工作。团队成员管信莉还为此改变了自己已经定好的婚期,成员王富则两次推迟自己的订婚日期……
为了做好支撑服务,使平台顶层设计更加科学、更加符合各地实际,甘肃电信万维公司技术人员还配合相关行业部门先后6次深入天水市、陇南市、定西市、临夏回族自治州、平凉市等6个市州、9个县市区开展实地调研测试及试点工作;平台数据采集工作开展后,他们又认真配合省扶贫办对各级工作人员进行培训,并与省扶贫办共同起草了《甘肃省精准扶贫大数据管理平台运行管理办法》。数据采集中,大数据平台并发量最高达到15万次,甘肃电信万维公司还紧急调配增加10台服务器,使服务器总数达到96台,网络带宽由2G紧急扩展到10G,保障了各项工作的顺利开展。
“目前,我们的3.0版正在研发中,预计1月就能上线。”万维公司精准扶贫平台部负责人郭真满怀信心。截至目前,平台已完成对全省101万贫困户、417万贫困人口的动态管理,汇集到户、到村措施1100万条,数据量达到7亿个,具备精准管理功能。
按照规划,下一步,甘肃电信万维公司将在进一步完善平台顶层设计和功能的基础上,积极与各级政府进行深入合作,依托省级扶贫平台,建设市县级特色服务平台,提供更具个性化的服务,推动产业扶贫项目发展。未来,将积极打造涉及全省各个行业和部门的大数据平台,在更大范围、更广领域服务民生。
《人民邮电》2016年1月8日 一版 作者:肖成年 杨爱芬