第一篇:大数据时代商业银行信用风险论文
一、大数据时代商业银行信用风险管理SWOT分析
(一)定性分析
1.优势分析。商业银行在多年发展中,拥有广大的客户群体,积累了客户基本资料、客户交易、客户存贷款等大量数据。在大数据时代,商业银行凭借其雄厚的资本,可以建立大数据服务器等设备,将这些传统数据与其他来源数据进行整合,数据分析人员通过云计算等技术手段挖掘出有价值的信息,从各个角度分析客户需求以及识别信贷风险,从而有助于商业银行更加科学地评价经营业绩、评估业务风险、配置全行资源,引导银行业务科学健康发展。
2.劣势分析。在现有的银行交易系统中,客户的身份证、交易流水等大量信息已被银行掌握,但缺少如客户的家庭情况、收入状况、消费习惯、兴趣爱好等其他方面的信息。另外,目前小微企业客户信息以及商业银行的产业链客户信息也比较缺乏,直接影响着银行对这些客户提供金融服务的水平。再者,大数据时代下,需要金融专业人才和数据分析人才相互配合,才能充分挖掘数据价值,但数据分析人员较为匮乏也将成为商业银行的软肋。
3.机会分析。刚刚进入大数据时代,商业银行应率先构架大数据战略体系,制定大数据发展战略,突破同质性,实施差异化业务发展战略,从而赢得先机。如果大数据获得成功应用,将为银行创造先发竞争优势,使银行决策从“经验依赖”向“数据依据”转化,打造不可复制的核心竞争力。“数据—信息—商业智能”将逐步成为银行定量化、精细化管理的发展路线,数据分析也将成为其风险防控的法宝。
4.威胁分析。大数据在给商业银行带来前所未有的机遇的同时,也给其带来了诸多威胁,例如大数据存在的风险、网络安全、数据失真等。在大数据开发利用过程中,云计算技术将会得到广泛应用。但是云计算将数据存入云端,而云端往往是由第三方服务器实现存取的,如果第三方将数据泄露,将会给银行带来极大的风险。另外,互联网金融正在颠覆着传统的金融模式,网商具有活跃的交易记录和巨大的金融需求,但商业银行很难开发到这些客户,将给银行带来挑战。
(二)定量分析
除了对大数据时代商业银行信用风险管理面临的内外部环境进行定性分析外,还可以进行定量分析。具体思路为:
①确定包括优势与劣势、机会和威胁等多于10个的内外部环境因素;
②利用主观赋权法、客观赋权法、层次分析法(AHP法)等任一方法确定各因素的权重;
③给各个因素打分,分值范围为1到5分,评分越高说明因素越重要;
④将各个因素的权重与得分相乘,从而最终计算出各个因素的加权分数;
⑤各个因素加权分数计算代数和得出公司的总加权分数,然后根据分数进行判断。某商业银行内外环境分析如附表所示。由附表可以看出,该银行外部机会大于外部威胁,内部优势大于内部劣势,应抓住大数据带来的机遇,充分利用信息技术,更加科学地评估业务风险、配置全行资源,引导银行业务科学健康发展。
二、基于大数据的商业银行征信系统构建
目前,我们已经进入了大数据时代,由于大数据包含的信息量大而且非常复杂,传统的系统已不能满足银行新的分析需求,有必要建立一个统一的数据环境,构建大数据的商业银行征信系统,采取新分析算法,搭建大数据跨业务的统一应用平台,从而满足银行精细化管理、差异化服务、提升风险分析能力的需求。
(一)大数据时代商业银行征信系统概述
在金融交易安全日益突出的今天,如何迅速、有效地发现各类欺诈行为,对保证商业银行的正常运作和国家人民财产安全都显得十分重要。商业银行征信系统要针对信贷风险防控工作的实际特点,通过客户交易信息以及客户其他信息收集来加强客户信用风险监测。系统总体见附图。附表某商业银行内外环境分析内部环境评分权重加权分外部环境评分权重加权分⑴整体竞争优势明显;30.100.30⑴云计算的快速发展;50.150.75⑵良好的客户群体;50.150.75⑵数据来源多样化;50.251.25⑶资本雄厚,有能力建立大数据库;40.050.20⑶科技发展为数据应用提供支持;40.200.80⑷拥有专业客户人才;30.200.60⑷精准评估业务风险;40.251.00⑸良好的内控环境;50.251.20⑸先入为主的机会;40.150.60优势⑹丰富的风险防控经验;50.251.25机会⑹精细化管理的趋势。40.100.40小计1.004.30小计1.004.80⑴缺乏个人客户基本信息;-30.25-0.75⑴网商的竞争;-50.3-1.50⑵缺乏小微企业基本信息;-30.20-0.60⑵大数据安全风险;-50.25-1.25⑶缺少产业链客户的信息;-40.20-0.80⑶网络安全面临挑战;-30.2-0.60⑷缺乏专业的数据分析人才;-30.10-0.30⑷外部风险事件的影响;-30.15-0.45⑸缺乏非结构化数据收集能力;-50.15-0.75⑸外部风险来源多样化。-30.1-0.30劣势⑹商业运营模式面临变革。-30.10-0.30威胁小计1.00-3.50小计1.00-4.10优势劣势合计0.80机会威胁合计0.70系统将从海量数据中提取出有关联的数据信息,以发现潜在或已知的风险,系统将数据仓库、模型库、知识推理、人机交互四者有机地结合起来,充分发挥数据挖掘的作用,通过建立风险评估模型较好地处理数据资源中存在的模糊性和随机性,在成熟的模式识别技术和智能分析技术的辅助下,对银行业务的全方位、多角度的可靠性分析和风险评估,有助于商业银行实施全面风险管理体系,从而进一步提高融资、贷款、授信等方面的风险评估、监控水平。
(二)大数据时代商业银行征信系统工作原理
1.数据原料。数据原料是商业银行风险防控中的关键一环,它直接影响到数据挖掘的效率、精准度以及所得模式的有效性。目前,商业银行针对客户资料和消费记录都建立了功能庞大的消费市场数据库系统,在以大数据引领、以智能化为核心的产业变革时代,银行要真正将数据作为风险控制的源点,有效整合来自银行网点、PC、移动终端设备、社交网络、征信机构等传来的结构化和非结构化的海量数据,既要获取常规渠道的数据,又要收集社会化媒体数据,真正将数据作为战略性资产,实现从管控风险向经营风险方向的转型。
2.数据工厂。数据工厂是利用数据挖掘理论与技术将数据中潜在的、有用的模式搜索出来,是整个征信系统最为关键的一步,也是技术难点。在数据工厂中,系统通过数据抽取工具、数据集成工具、数据过滤工具、数据挖掘工具以及模式评估工具等,从海量数据原料中提取辅助决策的关键性数据,并经过归纳总结、推理、分析数据,利用数据挖掘中分类、聚类、偏差检测、概念分析、异类分析、关联分析、时序演变分析和元数据挖掘等功能,完成对银行信用风险控制、银行市场风险评估和银行操作风险评估,从而帮助决策者对信息预测和决策起作用。
3.数据产品。数据工厂最终的结果是数据产品,把所有最终经挖掘发现的知识直观地通过可视化技术展示给商业银行,以帮助其理解和解释数据挖掘的结果,控制信贷风险。这些数据结果既包括传统的诸如违约率、违约损失率、违约暴露和违约期限等客户信用信息,也包括客户的其它方面的信用记录、客户的信用评级以及对市场风险的评估。当然,整个数据挖掘过程是一个不断反馈、循环往复的过程,信用评级结果也是动态变化的。
4.数据应用。经过数据挖掘得出的风险评估结果为商业银行评估信贷业务的风险和收益情况提供了量化工具,改变了单纯被动信用风险管理模式。在此背景下,商业银行应规范贷款审批标准和审批程序,优化金融信用监控机制,完善组织架构和规章制度,实施风险动态防控,使信贷风险管理体系健康运行。
三、大数据时代商业银行信用风险管理应注意的问题
在“大数据”时代,商业银行面临着信用风险防控的新形势,要积极做好如下应对工作。
(一)风险意识要思维开放
商业银行在进行风险预测时,需要考量政策、人为的操作风险、市场环境等等众多因素,但现有的技术水平难以支撑挖掘大数据的商业价值。因此,商业银行需要具备一种像互联网一样的开放式思维,建立分析数据的习惯,重视“大数据”开发利用,关注与风险预测高度相关的大数据信息,如客户的基础信息(如客户开立账户时留存的住址、年龄、从事行业、性别等等)、客户交易信息(如客户在ATM机上的存取款情况、使用银行卡、购买理财、使用其他业务的记录等等)、外部的信息(从互联网、电信运营商、证券交易所等处挖掘来的有关信息)等,用数据说话,从而提高不确定风险的预测水平。
(二)数据整合要注重质量
大数据很多时候是从一种非传统的角度去分析、挖掘、利用数据价值的思路。由于数据来源庞杂广泛,需要不断利用技术创新去挖掘利用大数据的价值,再加上数据之间的关联性很强,商业银行应建立自己的数据地图,整合银行内部数据和大数据链上的其它外部数据,坚持做到数据要依照标准化采集,确保数据来源真实可靠,杜绝以假乱真;同时构建专门的数据分析方法和使用体系,对数据进行规范化处理,并严格按照国家法律法规进行使用,从而确保数据质量,提高数据应用性。
(三)系统建设要高屋建瓴
大数据具有一般数据所不具备的特殊性,传统的处理工具和解决方案难以满足针对大数据的处理和分析需要,因此需要采用新的处理模式,才能发挥大数据的效能。商业银行需要投入大量资源加快完善高度集中、完备、综合、专业的数据仓库系统,建设完善数据仓库项目,从而适应“大数据”技术的需要。在系统建设中要高屋建瓴,要把对于非结构化数据分析的技术与现有的、基于结构化数据的分析工具相结合,预装一些成熟的数据挖掘算法和文字文本的算法,完善数据挖掘工具的扩展性,便于数据分析人员能够快速地进行大数据分析。同时,对资源的投入一定要有相当的前瞻性,并兼顾当前实际,尽可能地实现资源利用最大化。
第二篇:商业银行信用风险防范论文
摘要:首先介绍了商业银行信用风险及其防范方法的概况,接着分析了利用期权防范商业银行信用风险的原理,最后结合国际经验和我国银行业现状, 讨论了利用期权防范商业银行信用风险的意义。
关键词:商业银行;信用风险;期权;防范商业银行信用风险及其防范方法的概述
由于商业银行经营对象和经营过程的特殊性,自其产生之初,风险就与之相伴而生、形影不离。根据《新巴塞尔资本协议》,现代银行业所面临的风险主要包括信用风险、市场风险和操作风险。其中信用风险又称违约风险,主要是指商业银行贷款过程中由于借款者违约而给银行造成损失的可能性。信用风险不但在计量、管理等方面均比操作风险、市场风险更复杂,而且长期以来一直是商业银行所面临的最大风险。 利用期权防范商业银行信用风险的原理
期权是20世纪70年代国际金融创新中发展起来的一种金融衍生工具。在金融风险管理中,期权是进行套期保值、回避价格风险的理想工具。所谓期权实质是一种选择权,是指一种能在未来某特定时间以特定价格买入或卖出一定数量的某种特定资产的权利。期权购买者在支付一定费用的基础上便获得这种选择权。如果未来价格向不利于期权购买者的方向变动,期权购买者则可选择执行期权,从而在一定程度上通过对冲弥补这种不利的价格走势给其带来的损失。相反,如果未来价格向有利于期权购买者的方向变动,则期权购买者会选择放弃执行期权,他所损失的仅仅是当初为了获得这种选择权而支付的费用。因此,虽然期权购买者为了获得这一权力额外支付了一定费用,但却有效规避了价格不确定性带来的风险。从这个角度上看,期权十分类似于汽车保险。车主为了在车辆出险时获得一定的经济补偿,向保险公司支付一定的保险费购买保险。如果车辆出险使车主遭受损失,由于购买了汽车保险,车主可以从保险公司获得赔偿以弥补其所遭受的损失。相反,如果在此期间车辆没有出险,则车主的最大损失也不过是保险费。
商业银行同样可以利用期权的这种风险对冲机制进行信用风险防范。商业银行在发放贷款的同时购买期权,这就相当于为其贷款购买了一份保险。一旦贷款违约事件发生,商业银行就可以从期权出售者那里获得一定的补偿,以弥补借款者信用水平向不利于银行的方向变化而给银行带来的损失,将信用风险转移给期权出售者。银行最大损失就是从期权出售者那里购买期权所支付的费用。商业银行利用期权对冲信用风险的方法大致可以分为两类,一类对贷款利率进行保值,另一类对贷款金额进行保值。
第一类方法利用期权对贷款利率进行保值,以达到防范信用风险。它的主要原理是要求商业银行在发放贷款的同时,买进一个利率看涨期权。根据投资学的基本原理,任何金融资产的收益率都可以看成是无风险利率和风险溢价之和。因此,贷款利率水平作为贷款人的发放贷款的收益率也是由这两个因素决定的。其中,风险溢价是对贷款人承担信用风险的补偿。当借款人信用等级下降时,作为贷款人的商业银行所承担的信用风险相应扩大,相应应提高风险溢价水平以及贷款利率水平。固定利率贷款由于在贷款存续期间内利率固定不变,银行无法通过对贷款利率的调整,获得相应的补偿。因此,固定利率贷款既无法规避无风险利率的不利变化可能给其造成的损失,也无法规避借款人信用风险扩大,进而风险溢价水平扩大可能造成的损失。当前为了防范利率风险,商业贷款特别是国际长期贷款往往被设计成浮动利率贷款,使得在贷款存续期间内,贷款利率能够随基准利率的变化而变化,可在一定程度上规避无风险利率变化带来的损失,但贷款合约签定后,信用风险溢价则仍然是固定的,无法回避。
第二类方法利用期权对贷款金额进行保值,从而达到防范信用风险。其主要原理是要求商业银行在发放贷款的同时,买进与该笔贷款金额相对应的贷款合约价格看跌期权。当借款者违约事件发生时,商业银行作为期权的购买者可以一个事先已经约定价格出售这笔贷款,从而弥补由于借款者违约而给其带来的损失。 利用期权防范商业银行信用风险的意义
3.1 有利于提高信用风险管理水平
商业银行作为信用创造和信用中介的主体,不可避免地成为整个社会信用风险的集散地。因此,妥善地管理和控制信用风险是商业银行生存所必须掌握的一门技术。在商业银行的信用风险管理方法中十分重要的一条就是对包括贷款和各类投资在内的资产实现多样化、分散化,通过减小资产组合内各类资产的相关性,使组合内信用风险相互对冲抵消。然而,实践中的贷款分散化并非无懈可击。商业银行往往都有比较稳定的客户信用关系、经营领域、区域优势、行业优势、信息优势以及贷款规模经济效应等,这使得银行信用风险很难分散化。我国四大国有商业银行脱胎于国有专业银行,历史上有明显的业务分工,这在一定程度也限制了贷款分散化。此外,贷款分散化还有可能对银行效益产生负面影响。而期权克服了贷款分散化的缺陷,在允许贷款相对集中的同时,通过期权的非对称性风险收益机制将商业银行面对的信用不确定性进行拆分,对冲并转移对其不利的信用不确定性,而保留对其有利的信用不确定性。从而使商业银行对信用风险管理由消极被动转为积极主动,有利于提高信用风险管理的水平。
3.2 有利于降低商业银行的不良贷款率
在我国社会主义改革过程中,由于产权制度的不合理及体制改革的严重滞后,使得社会信用风险逐渐集聚到了银行体系。长期以来一直困扰着我国商业银行的大量不良贷款正是这一问题的集中体现。为解决这一问题,我国采取了一系列措施,如资产管理公司进行债转股、资本重置和贷款出售等,取得了一定效果,但仍不足以使银行彻底摆脱信用风险。使用期权来防范信用风险无疑为我国商业银行降低不良贷款开拓了思路,提供了新工具。
3.3 有利于提高资本充足率及回报率
为了促进国际银行业的稳健经营,巴塞尔协议规定,银行资本充足率要达到8%,也就是要求银行的总资本不能低于加权风险资产总额的8%,其中加权风险资产总额是由银行各项资产与风险权重的乘积来确定。因此,风险权重越高,对银行资本金数量的要求也就越高。由于利用期权等衍生工具做套期保值可以达到规避风险的目的,因此《新巴塞尔资本协议》对银行已经采用期权等衍生工具进行套期保值的交易头寸的资本要求相对较低。如果能实现完全套期保值,则银行可以不必提取专项资本;如果无法实现完全套期保值,银行可以仅对其敞口头寸提取20%的专项资本。由此可见,通过期权来防范信用风险后,同样数量的贷款资产所要求的作为贷款保证金的资本金数量下降,意味着同样数量的资本金可以支持更多的贷款资产,从而使得资本充足率得到提高,并有效地利用了财务杠杆,提高资本回报率,这对于资本充足率普遍比较低的我国商业银行是非常有利的。
3.4 有利于推进金融业混业经营
由于我国直接和间接融资市场发展不平衡,企业融资长期倚重以银行贷款为主的间接融资方式。而非银行类金融机构往往被通过立法排斥在存放款业务之外。商业银行利用期权来防范信用风险,为非银行类金融机构间接涉足贷款市场提供了可能性。非银行类金融机构参与期权交易在分散化解银行所承受的信用风险的同时,也有利于非银行类金融机构自身投资组合的分散化,有助于其取得更好的经济效益。根据国外经验,保险公司通常是此类期权的出售者。一方面,保险公司尤其人寿保险公司拥有稳定的长期性资金来源,另一方面,保险公司可运用其在风险管理上的优势,进一步在不同领域进行信用风险的再分散化。可见,期权的应用有助于推进金融业的混业经营,实现不同金融机构间的业务融合和优势互补,改善其资产组合结构,扩展了金融市场的广度和深度,有利于提高金融体系的整体运行效率。
参考文献
[1]伊斯雷尔·尼尔肯.实用信用衍生产品[M].北京: 机械工业出版社,2002.
[2]巴塞尔银行监管委员会.巴塞尔银行监管委员会文献汇编[R].北京: 中国金融出版社,2002.
第三篇:大数据时代
大数据时代
近年来,随着互联网、移动互联网、智能手机及传感器等的普及,信息流量有了爆发性的增长,两会以后,互联网里最热的词汇,就是李克强总理在政府工作在报告里面提到的“互联网+”,大数据将会更广泛的被运用到各个领域,越来越多的业内人士开始谈论“大数据”,如何利用大数据,成为政府和众多企业关心的热点?
互联网+《大数据》紧紧围绕这些问题展开,帮您如何利用大数据为企业从战略上面进行指导挖掘和预测,从战术上进行营销服务和安全措施,精彩我们共同期待。
第一篇大数据很热,大数据不神秘(趋势)有人说,如果你不知道大数据,你就OUT了 --大数据到底有多热 什么样的数据算是大数据 --大数据的特点和概念辨析 乱我心者,大数据之事多烦忧 --大数据并不象你想象的那样神秘 身边的大数据
--大数据就在你我身边
案例分析:淘宝是如何利用大数据淘宝的 小结:不管你愿不愿意,大数据已经在那里 电话:010---59002742 010--59004371 第二篇:认识大数据 1.什么是大数据 2.大数据应用的意义
3.大数据在企业经营中应用的意义 4.对大数据的认识误区 案例分析
第三篇:大数据时代变革 1:大数据时代的思维变革 2:大数据时代的商业变革 3:大数据时代的管理变革
第四篇:大数据在营销中的运用 大数据精准营销 1.什么是精确营销 2.精确营销的方法 实操教学+案例分析
第五篇:在技术中应用 数据挖掘
大数据的核心价值——挖掘 1.什么是数据挖掘? 2.数据挖掘的流程 3.数据挖掘解决的问题 结合现场实操教学+案例分析
第六篇:预测
大数据的核心价值——预测 1:如何预测? 案例分析
第七篇:大数据与云计算 1:什么是云计算
2:大数据与云计算的关系
第八篇:大数据的安全问题
大数据给信息安全带来新的挑战和机遇 大数据存储安全策略 大数据应用安全策略 大数据管理安全策略
第四篇:大数据时代
“大”数据时代 众所周知,数据本身就蕴藏着价值,但是将有用的数据与没有价值的数据进行区分看起来可能是一个棘手的问题。
显然,您所掌握的人员情况、工资表和客户记录对于企业的运转至关重要,但是其他数据也拥有转化为价值的力量。一段记录人们如何在您的商店浏览购物的视频、人们在购买您的服务前后的所作所为、如何通过社交网络联系您的客户、是什么吸引合作伙伴加盟、客户如何付款以及供应商喜欢的收款方式……所有这些场景都提供了很多指向,将它们抽丝剥茧,透过特殊的棱镜观察,将其与其他数据集对照,或者以与众不同的方式分析解剖,就能让您的行事方式发生天翻地覆的转变。
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
“大数据”这个术语最早期的引用可追溯到apache org的开源项目Nutch。当时,大数据用来描述为更新网络搜索索引需要同时进行批量处理或分析的大量数据集。随着谷歌MapReduce和Google File System(GFS)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的速度。
早在1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪 潮的华彩乐章”。不过,大约从2009年开始,“163大数据”才成为互联网信息技术行业的流行词汇。美国互联网数据中心指出,互联网上的数据每年将增长50%,每两年便将翻一番,而目前世界上90%以上的数据是最近几年才产生的。此外,数据又并非单纯指人们在互联网上发布的信息,全世界的工业设备、汽车、电表上有着无数的数码传感器,随时测量和传递着有关位置、运动、震动、温度、湿度乃至空气中化学物质的变化,也产生了海量的数据信息。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
第五篇:大数据时代
《大数据时代》读书笔记
作者:迈尔舍恩伯格
出版发行:浙江人民出版社
版次:2013年1月第一版
读者:物流一班、时菲阳
一、作者观点
谷歌有一个名为“谷歌流感趋势”的工具,它通过跟踪搜索词相关数据来判断全美地区的流感情况。这就是一个典型的“大数据”的应用例子,舍恩伯格的这本《大数据时代》受到了广泛的赞誉,他本人也因此书被视为大数据领域中的领军人物。
作者提出了三点结论:第一,要尽可能分析事物相关的“全部”数据,而不是之前的随机抽样,即“样本=总体”。第二,要乐于接受数据的繁杂,而不应过分追求其精确性。第三,重视大数据呈现的“相关关系”,而不要执于探索事物间的因果关系。
二、摘抄:
在甲型H1N1流感爆发的几周前,互联网巨头谷歌公司的工程师们在《自然》杂志上发表了一篇引人注目的论文。它令公共卫生官员们和计算机科学家们感到震惊。文中解释了谷歌为什么能够预测冬季流感的传播:不仅是全美范围的传播,而且可以具体到特定的地区和州。谷歌通过观察人们在网上的搜索记录来完成这个预测,而这种方法以前一直是被忽略的。谷歌保存了多年来所有的搜索记录,而且每天都会收到来自全球超过30亿条的搜索指令,如此庞大的数据资源足以支撑和帮助它完成这项工作。
发现能够通过人们在网上检索的词条辨别出其是否感染了流感后,谷歌公司把五千万条美国人最频繁检索的词条和美国疾控中心在03年至08年间季节性流感传播时期的数据进行了比较。其他公司也曾试图确定这些相关的词条,但是他们缺乏像谷歌公司一样庞大的数据资源、处理能力和统计技术。
虽然谷歌公司的员工猜测,特定的检索词条是为了在网络上得到关于流感的信息,如“哪些是治疗咳嗽和发热的药物”,但是找出这些词条并不是重点,他们也不知道哪些词条更重要,更关键的是,他们建立的系统并不依赖于这样的语义理解。他们设立的这个系统唯一关注的就是特定检索词条的频繁使用与流感在时间和空间上的传播之间的联系。谷歌公司为了测试这些检索词条,总共处理了4.5亿个不同的数字模型。在将得出的预测与07年、08年美国疾控中心记录的实际流感病例进行对比后,谷歌公司发现,他们的软件发现了45条检索词条的组合,一旦将它们用于一个数学模型,他们的预测与官方数据的相关性高达97%。和疾控中心一样,他们也能判断出流感是从哪里传播出来的,而且他们的判断非常及时,不会像疾控中心一样要在流感爆发一两周之后才可以做到。
所以,09年甲型H1N1流感爆发的时候,与习惯性滞后的官方数据相比,谷歌成为了一个更有效、更及时的指示标。公共卫生机构的官员获得了非常有价值的数据信息。惊人的是,谷歌公司的方法甚
至不需要分发口腔试纸和联系医生——它是建立在大数据的基础之上的。这是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。基于这样的技术理念和数据储备,下一次流感来袭的时候,世界将会拥有一种更好的预测工具,以预防流感的传播。
三、感想:
看完本书有如下感想:
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。
其次,作者认为大数据时代具有三个显著特点。
一、人们研究与分析某个现象时,将使用全部数据而非抽样数据;
二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。
三、了解数据之间的相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。
最后,作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公
司(阿里巴巴、淘宝网)。二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。