大数据时代来临读书月心得体会

时间:2019-05-12 00:08:48下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《大数据时代来临读书月心得体会》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《大数据时代来临读书月心得体会》。

第一篇:大数据时代来临读书月心得体会

一部似乎还没有写完的书

——读《大数据时代》有感及所思 读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。“在小数据时代,我们会假象世界是怎样运作的,然后通过收集和分析数据来验证这种假想。”“随着由假想时代到数据时代的过渡,我们也很可能认为我们不在需要理论了。”书中几乎肯定要颠覆统计学的理论和方法,也试图通过引用《连线》杂志主编安德森的话“量子物理学的理论已经脱离实际”来“终结”量子力学。对此我很高兴,因为统计学和量子力学都是我在大学学习时学到抽筋都不能及格的课目。但这两个理论实在太大,太权威,太基本了,我想我不可能靠一本书就能摆脱这两个让我头疼一辈子的东西。作者其实也不敢旗帜鲜明地提出要颠覆它们的论点,毕竟还是在前面加上了“很可能认为”这样的保护伞。近几十年,我们总是在遇到各种各样的新思维。在新思维面前我们首先应该做到的就是要破和立,要改变自己的传统,跟上时代的脚步。即使脑子还跟不上,嘴巴上也必须跟上,否则可能会被扣上思想僵化甚至阻碍世界发展的大帽子。既然大数据是“通往未来的必然改变”,那我就必须“不受限于传统的思维模式和特定领域里隐含的固 有偏见”,跟作者一起先把统计学和量子力学否定掉再说。反正我也不喜欢、也学不会它们。

当我们人类的数据收集和处理能力达到拍字节甚至更大之后,我们可以把样本变成全部,再加上有能力正视混杂性而忽视精确性后,似乎真的可以抛弃以抽样调查为基础的统计学了。但是由统计学和量子力学以及其他很多“我们也很可能认为我们不再需要的”理论上溯,它们几乎都基于一个共同的基础——逻辑。要是不小心把逻辑或者逻辑思维或者逻辑推理一起给“不再需要”的话,就让我很担心了!

《大数据时代》第16页“大数据的核心就是预测”。逻辑是——描述时空信息“类”与“类”之间长时间有效不变的先后变化关系规则。两者似乎是做同一件事。可大数据要的“不是因果关系,而是相关关系”,“知道是什么就够了,没必要知道为什么”,而逻辑学四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明确规定”任何事物都有其存在的充足理由。且逻辑推理三部分——归纳逻辑、溯因逻辑和演绎逻辑都是基于因果关系。两者好像又是对立的。在同一件事上两种方法对立,应该只有一个结果,就是要否定掉其中之一。这就是让我很担心的原因。

可我却不能拭目以待,像旁观者一样等着哪一个“脱颖而出”,因为我身处其中。问题不解决,我就没法思考和工作,自然就没法活了!

更何况还有两个更可怕的事情。

其一:量子力学搞了一百多年,为了处理好混杂性问题,把质量 和速度结合到能量上去了,为了调和量子力学与相对论的矛盾,又搞出一个量子场论,再七搞八搞又有了虫洞和罗森桥,最后把四维的时空弯曲成允许时间旅行的样子,恨不得马上造成那可怕的时间旅行机器。唯一阻止那些“爱因斯坦”们“瞎胡闹”的就是因果关系,因为爸爸就是爸爸,儿子就是儿子。那么大数据会不会通过正视混杂性,放弃因果关系最后反而搞出时间机器,让爸爸不再是爸爸,儿子不再是儿子了呢? 其二:人和机器的根本区别在于人有逻辑思维而机器没有。《大数据时代》也担心“最后做出决策的将是机器而不是人”。如果真的那一天因为放弃逻辑思维而出现科幻电影上描述的机器主宰世界消灭人类的结果,那我还不如现在就趁早跳楼。

还好我知道自己对什么统计学、量子力学、逻辑学和大数据来说都是门外汉,也许上面一大篇都是在胡说八道,所谓的担心根本不存在。但问题出现了,还是解决的好,不然没法睡着觉。自己解决不了就只能依靠专家来指点迷津。

所以想向《大数据时代》的作者提一个合理化建议:把这本书继续写下去,至少加一个第四部分——大数据时代的逻辑思维。

合纤部 车民

2013年11月10日篇二:大数据时代书面记录与心得体会

大数据时代书面记录与心得体会 2015年5月12日,听取了大数据时代相关技术的技术讲座。当今,大数据的到来,已经成为现实生活中无法逃避的挑战。每当我们要做出决策的时候,大数据就无处不在。大数据术语广泛地出现也使得人们渐渐明白了它的重要性。大数据渐渐向人们展现了它为学术、工业和政府带来的巨大机遇。与此同时,大数据也向参与的各方提出了巨大的挑战。大数据,其影响除了经济方面的,它同时也能在政治、文化等方面产生深远的影响,大数据可以帮助人们开启循“数”管理的模式,也是我们当下“大社会”的集中体现,三分技术,七分数据,得数据者得天下。“大数据”的影响,增加了对信息管理专家的需求。事实上,大数据的影响并不仅仅限于信息通信产业,而是正在“吞噬”和重构很多传统行业,广泛运用数据分析手段管理和优化运营的公司其实质都是一个数据公司。麦当劳、肯德基以及苹果公司等旗舰专卖店的位置都是建立在数据分析基础之上的精准选址。而在零售业中,数据分析的技术与手段更是得到广泛的应用,传统企业如沃尔玛通过数据挖掘重塑并优化供应链,新崛起的电商如卓越亚马逊、淘宝等则通过对海量数据的掌握和分析,为用户提供更加专业化和个性化的服务。大数据在个人隐私的方面,大量数据经常含有一些详细的潜在的能够展示有关我们的信息,逐渐引起了我们对个人隐私的担忧。一些处理大数据公司需要认真的对待这个问题。例如美国天睿资讯给人留下比较深刻印象的是他的一个科学家提出,我们不应该简单地服从法

律方面的隐私保护问题,这些远远不够的,公司都应该遵从谷歌不作恶的原则,甚至更应该做出更积极的努力。

生活,工作以及思维的大变革

——读《大数据时代》有感及所思

读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。

本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些变革涉及到我们生活的方方面面,几乎其影响程度可以与两次工业革命相媲美。作者在第一部分提出了三个比较令人震惊的观点,也就是大数据的精髓在于我们分析信息时的三个转变,这三个转变将改变我们的理解和组建社会的方法。并且作者将生活,工作思维的大变革和这几个方面紧紧联系在一起。

第一个转变是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。也就是说样本等于总体;第二个转变是对研究数据不会追求精度,而且追求混杂性,小数据时代下,追求精确度是合理的,因为我们收集的数据很少,所以要越精确越好,包括如今仍然也在使用这种办法;但是在某些时代,尤其是在大数据时代背景下,快速获得一个大概轮廓和发展脉络,要比精确性重要得多,既然选择了整体性,肯定要忽视细节和确定性;第三个改变是不是因果关系而是相关关系,在大数据时代,我们更需要了解一个东西是什么,而不是为什么,要找到关联无,通过一个良好的关联物的相关关系可以帮助我们捕捉预测未来。

这三个方面是大数据时代所给我们带来的思维上的改变,所谓思路决定出路,思路有了创新,有了拓展,相应的社会也就会有很大的变化。紧接着第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。个人认为本书的精髓部分是第一部分,第一部分的三个观点涉及的面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第一部分这三个观点为基础展开阐述的。这本书给我感触最深的就是这三个转变,或者说是三个观点,可以说是哲学上说的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。首先是第一个,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。这个观点足以引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结 果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像candide那样精确地翻译每一句话,它谷歌翻译之所以优于ibm的candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。而在阅读这本书时,发现这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究他们的因果关系。作者用林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的代表,从啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于他们策略的帮助。一句话,知道是什么就够了,不用知道为什么。很明显作者所举的例子都是属于商业领域的,但是对于其他领域来说这个观点就值得商榷了。比如说,在科学研究领域,你需要知其然也需要知道其所以然,找到事件发生的原理。用文中的一个例子说明,乔布斯测出整个基因图谱来治疗癌症,但是你治疗癌症你必须知道癌症发病的原理,知道哪一段基因导致了这种疾病,不可能只是说收集各种数据,然后利用其相关性来判断哪里出现了问题。

过度依赖所带来的后果。也用《少数派的报告》这部电影来说明如果痴迷于数据会导致我们将生活在一个没有独立选择和自由意志的社会,如果一切变为现实,我们将被禁锢在大数据的可能性之中。所以书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。毫无疑问,大数据将会给社会管理带来巨大的变革。

在这个信息爆炸的时代,大数据给人类社会的方方面面带来了巨大的变革,这是社会发展的潮流,不可逆转,我们只有顺应这种潮流,把握住大数据时代变革的思想,才能在时代潮流中成为佼佼者,在思维上思路上略高一筹,才能在行动中占得先机!篇四:《大数据时代》读书心得

大数据时代,引领信息全球化

——读《大数据时代》有感

如今说起新媒体和互联网,必提大数据,似乎不这样说就out了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和ibm等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。

粗浅认识之我见

舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:

一、更多:不是随机样本,而是全体数据;

二、更杂:不是精确性,而是混杂性;

三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。

我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。“大数据的简单算法比小数据的复杂算法更有效。”更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。“不是因果关系,而是相关关系。”不需要知道“为什么”,只需要知道“是什么”。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。

世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误

读。比如说舍恩伯格在提出“不是因果关系,而是相关关系。”这一论断时,他在书中还说道:“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。”由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。

大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可“量化”,大数据的定量分析有力地回答“是什么”这一问题,但仍然无法完全回答“为什么”。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节“掌控”中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:“大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”谢谢舍恩伯格!让大数据讨论从自然科学回到人文

社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。

此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。

浅薄之语抒我意

概念是研究的逻辑起点,“大数据”到底是什么?在百度上搜索到的解释是,“大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。”大数据的4v特点:数量(volume)、速度(velocity)、品种(variety)和真实性(veracity)。但舍恩伯格认为大数据并非一个确切的概念。他在书中的一段诠释更具人文色彩和社会意义:“大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。”其实,概念的界定要看研究者从哪个角度来研究它而定。

科学家的治学态度是严谨的,而人文学家更具有想象力。一些对大数据不甚了然的人往往夸大了它的作用,甚至把它神化。舍恩伯格认为大数据的核心是预测。“大数据不是要教机器像人一样思考。相

反,把数学算法运用到海量的数据上来预期事情发生的可能性。”舍恩伯格甚至不回避大数据所产生的负面影响,他在第七章里谈到让数据主宰一切的隐忧。我觉得这是实事求是的科学态度。在量子力学里有一个测不准原理:一个微观粒子的某些物理量(如位置和动量,或方位角与动量矩,还有时间和能量等),不可能同时具有确定的数值,其中一个量越确定,另一个量的不确定程度就越大。它是解释微观世界的物理现象,信息社会中的大数据会不会也有类似情况呢?如果我们再把凯文·凯利的《失控》对比来读的话就更有意思了,这样我们对整个物质世界及至人类社会就有了更全面更深刻的洞察,从物理王国到生物世界,再到信息社会。从公共卫生到商业应用,从个人隐私到政府管理,大数据无处不在。与此同时,从哪个角度探讨用什么方法研究,舍恩伯格都不会忘记大数据服务人类造福人类的终极目的和价值所在。“大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。”用中国话来说就是“人无完人”,人类在收获大数据带来的红利的同时也要承受它带来的危害。这不是对立统一的辩证唯物主义?我把它看作带着欧洲批判学派色彩的科学发展观。篇五:《大数据时代》读书心得

大数据时代,引领信息全球化

——读《大数据时代》有感

如今说起新媒体和互联网,必提大数据,似乎不这样说就out了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典著作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和ibm等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。粗浅认识之我见 舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:

一、更多:不是随机样本,而是全体数据;

二、更杂:不是精确性,而是混杂性;

三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。

第二篇:大数据时代读书心得体会

《大数据时代》是英国维克托·迈尔-舍恩伯格教授的著作,这本书也被尊为国外大数据研究的先河之作。下面是带来的大数据时代读书心得,欢迎查看。

大数据时代读书心得体会范文

1《大数据时代》是英国维克托·迈尔-舍恩伯格教授的著作,这本书也被尊为国外大数据研究的先河之作。这本书最大的优点就在于作者利用上百个例子来对大数据的方方面面做了详细解说,让外行也很容易理解。结构上,作者通过大数据时代的思维变革、商业变革和管理变革三个角度依次阐述,条理清晰。

所谓“大数据”,按作者的说法,就是“所有数据”。随着计算机运算速度和存储能力的发展,收集数据变得越来越简单,储存数据的成本越来越低。在过去,由于技术限制,人们做统计时只能收集有限的数据做样本,其中要考虑随机样本的选择,努力减小因样本问题出现的误差;统计结果往往不能重复使用,造成数据利用率低。而现在则可以做到“样本=总体”。数据的增多带来不可避免的精确性问题。“小数据”时代,一个样本的错误就可以造成对总体估计的失败,幸运的是,“大数据”时代对精确性不再那么要求苛刻——也无法要求太严格——数据的数量足以弥补这一缺陷。在对思维变革这一部分的阐述中,最重要也是全书的核心观点就是大数据时代,我们应该从追求“因果关系”的旧思维方式向追求“相关关系”转变。在我看来,这实际上是通过大数据来透视一种事物的发展趋势,而很多精确学科领域依然需要探寻“因果关系”解决更有针对性的问题,所以,这局限了这一转变只能在特定的领域发生。作者自己也说,“大数据的相关性将人们指向了比探讨因果关系更有前景的领域。”

大数据时代的数据获取方式是多种多样,数据形式也是千变万化,任何文字、行为、万物都可以被数据化后用来分析。对这些数据的利用,不仅要考虑到其初次使用价值,更要放眼它未来可能的用途以提高数据的利用率。当然数据并不是无限使用,时效、环境的变化肯定会对数据提出新的要求,所以数据的折旧也是应当考虑的。这又引出了对数据这一无形资产的估值可能性。对于这样的公司来说,数据就是他们的核心,如何在资产负债表上给他们一个公正的体现正是我们需要考虑的。

大数据时代的价值链由三部分构成,我把它们简化为“生产—分析—使用”三个环节,这对应书中的三种类型公司: 第一种是基于数据本身的公司,第二种是基于技能,第三种则是基于思维。在大数据早期,技能和思维最有价值,但作者认为,最终,大部分的价值还是必须从数据本身来挖掘。这是假定了一个成熟的市场,人人都了解了大数据的用途。

对于普通人来说,大数据时代最关心的还是隐私问题。不知不觉中,个人的一举一动都暴露在政府甚至私人企业之下,还面临潜在的泄露风险。对此,作者提出了使用者承担责任的解决办法,而不是过去那种流于形式的使用授权。大数据甚至能预测一个人的犯罪动机,这给监管者带来的难题是,预测一个人要犯罪,惩罚还是不惩罚?在这点上,社会达成“个人仅需对行为而非动机负责”的共识非常重要。

大数据时代的风险控制靠的是“算法师”,类似会计师一样的职业,对大数据的准确度或有效性进行鉴定。这能在一定程度上防止数据滥用的发生和数据独裁。当今的法律亦需对大数据监管进行修订补充。

当代大数据发展主要由科技公司推动,相信在不久的将来更多的传统领域会意识到大数据的重要性。但我们也应该保持清醒,大数据并不是万能药,对某些领域或环节,使用大数据是一种简单且实用的选择;但对某些领域,盲目使用大数据只会适得其反。

大数据时代读书心得体会范文

24月13日下午,在湖南大学东楼205参加了关于《大数据时代》的读书交流活动。通过相互交流学习,使我更深层次的理解了大数据时代的利与弊,机遇和挑战。在写心得体会前,我想再重新审视一下关于大数据的历史沿革和现实意义。

首先,最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数 据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日,却因为近年来互联网和信息行业的发展而引起人们关注。大数据作为云计算、物联网之后又IT行业又一大颠覆性的技术革命。云计算主要为数据资产提供了保管、访问的场所和渠道,而数据才是真正有价值的资产。企业内部的经营交易信息、物联网世界中的商品物流信息,互联网世界中的人与人交互信息、位置信息等,其数量将远远超越现有企业IT架构和基础设施的承载能力,实时性要求也将大大超越现有的计算能力。如何盘活这些数据资产,使其为国家治理、企业决策乃至个人生活服务,是大数据的核心议题,也是云计算内在的灵魂和必然的升级方向。

其次,进入2012年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。它已经上过《纽约时报》《华尔街日报》的专栏封面,进入美国白宫的新闻,现身在国内一些互联网主题的讲座沙龙中,甚至被嗅觉灵敏的国金证券、国泰君安、银河证券等写进了投资推荐报告。数据正在迅速膨胀并变大,它决定着企业的未来发展,虽然很多企业可能并没有意识到数据爆炸性增长带来问题的隐患,但是随着时间的推移,人们将越来越多的意识到数据对企业的重要性。正如《纽约时报》2012年2月的一篇专栏中所称,“大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”

最后,随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。著云台的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数

十、数百或甚至数千的电脑分配工作。“大数据”在互联网行业指的是这样一种现象:互联网公司在日常运营中生成、累积的用户网络行为数据。这些数据的规模是如此庞大,以至于不能用G或T来衡量。大数据到底有多大?一组名为“互联网上一天”的数据告诉我们,一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万……,截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。

首先,谈谈大数据带给生活的转变。大数据已经是信息产业发展的必然趋势,可以说,大数据现在已经开始慢慢渗透入我们的生活,如:现在流行的打车软件、三维立体化社区的建立、某些从事生产销售的行业利用大数据来优化规模和实现利益最大化。而我们很多人对大数据还很陌生,只是被动的适应着大数据给生活带来的改变。大数据时代是以云计算为基础的,所以,要实现大数据,相关的很多的硬件设备都要更新换代,信息处理系统、信息传输系统、信息反馈系统、信息决策系统都将面临新的挑战,相关产业都要重新调整产业结构,在那时,可以夸张的说,信息就是黄金,信息就是石油。大数据时代的到来会解放更多的劳动生产力,势必将会更加加剧生产力过剩的现状,社会两极分化现象会更加明显,掌握不了信息资源,很难再翻身,要防止信息垄断带来的可怕局面。大数据时代的到来会使人们的生活节奏急速加快,信息的时效性决定了它的流通速率,人们的生活节奏要跟上信息流通的速率,就不得不加快自己的节奏,人们会越来越忙,到那时,就像现在的日本,可能想找个人听你说说话,真的是一件很难的事。

第二,关于数据管理的看法。大数据时代,数据管理是一件很重要的工作,如何才能避免自己的数据被非法窃取、丢失和被盗?我的看法是,人防、技防、物防一体化。人防,即我们要从思想上牢固树立信息安全防范的意识,不主动泄露信息,要管理好自己身边的信息设备;技防,就是要运用软件来管理和处理数据,经常检查更新数据库,定时查杀电脑病毒,确保电脑状况安全;物防,就是重要的数据一定要备份保留,而且应当做到备份与原始文件是物理隔离,无关的信息应当及时删除,减轻硬盘的压力。

三、怎么保护自己的隐私。隐私,顾名思义,就是不愿意让别人看到的东西,所以,在大数据时代,更要管理好自己的隐私,以免对自己和家人造成麻烦和损失。越是隐私的信息,越要远离网络,不要再公开的社交网络储存和展示个人图片、资料等信息,免得被非法人士采用和窃取。建议还是用纸质的日记代替电脑日记,避免信息传播范围太大,管理好自己的日记本。研发一种新的硬件连接器,总是以随机码来保护自己真实IP地址,提高网络安全的可靠性,加强对联网信息的管理和保护。

不论我们情不情愿,大数据时代都会到来,现实社会是我们高喊着走向大数据时代,其实大数据时代已经向我们走来,所以与其被动接受,不如主动学习,从中找到自己的出路,成为大数据时代的建设者和受益者。

第三篇:互联网大数据时代的来临

互联网大数据时代的来临

互联网大数据时代的到来,已成为人们不可阻挡的趋势。我们进入以“互联网+”为代表的信息时代,信息化已经成为全球性、全局性、战略性的变革力量,正在深刻影响着经济、政治、军事、文化和社会等各个方面,深刻改变着人们的生产生活方式,也在推动着区域发展和行业竞争格局发生重大变化。信息时代所带来的一切重要变革,不仅来自于技术创新,更源自理念创新。从某种程度来说,没有共享,就没有互联网,海量数据只有在共享的前提下,才能够称之为大数据。只有以共享理念为引领,并将其贯穿到质检工作的各领域和全过程,善于用信息技术和互联网思维指导质检改革发展,才能给质检事业插上腾飞的翅膀,让质检工作始终适应形势变化、走在时代前列。

大数据的价值不仅在于数据本身,而在于数据所反映问题的真实性和科学性,采集和存储大量数据,只是大数据应用的第一个阶段,对所占有的数据进行深入分析,实现开发利用,从中发现新知识、创造新价值、提升新能力,取得实实在在的工作成效,才能够真正实现数据的价值。在掌握海量数据,实现互联互通的同时,我们应针对事业发展的具体需求,认真思考探索,如何才能最大程度地实现大数据的有效利用,使之能够为决策提供依据,为风险提供预警,为公众提供服务,真正成为破解改革难题,促进事业发展,助力转型升级,提高决策水平的尖兵利器。在以后的工作中快速有效地发挥互联网大数据对质检事业发展的推动作用。

互联网大数据时代的到来同时也为我们的生活带来了巨大的改变,大数据是如何影响我们的生活,简单的说,它会让我们的生活更加困难或者更加容易取决于你是否拥有分析大数据的技术。毫无疑问要想在大数据中理出头绪不是一件容易的事情,如果不具备分析数据的能力,大数据会让我们的生活、工作更加困难。例如每逢“双十一”,“剁手党”都面临痛苦的抉择:打折的商品实在太多,买什么才好呢?最终一不小心,信用卡刷爆,买了一大堆自己不需要的商品,只得含泪吃半年的“康师傅”。但是更多的时候,大数据会让我们的生活变得容易,因为科技的发展比数据的积累更迅速,过去几年已经发明了许多分析数据、处理数据的方法,这些方法已经为我们服务。

毫无疑问大数据正在改变着我们的生活。过去几年无论是医疗、健康、交通、公共安全,还是生活、购物、旅游、娱乐都已经逐渐建立起了大数据的分析系统,无论是国家还是企业对大数据的投入都数以亿计。大数据的应用也从早期的数据密集型行业(例如电信、金融、能源、科研、互联网),逐步向非数据密集型行业扩张。一个路边的奶茶店需要大数据吗?当然需要。借助微信平台,只需要扫一扫二维码,奶茶店就会获得粉丝的关注。有了这些数据不仅可以开展打折促销,还可以通过互动了解用户口味,推出新品。

在大数据时代,数据不再是静止和陈旧的,任何被遗忘在服务器中的数据,都可能被重新利用,从而发现其中与我们、与行为、与现象的相关性。维克托·迈尔-舍恩伯格说,大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,绝大部分都隐藏在表面之下。感谢科技的进步,今天我们已经能够看到冰山之下的绝大部分。

第四篇:“大数据时代”来临,企业数据管理面临挑战

“大数据时代”来临,企业数据管理面临挑战

IDC研究表明,到2020年,全球以电子形式存储的数据量将达到35ZB,是2009年全球存储量的40倍。这其中企业数据正在以55%的速度逐年增长。人们不禁感叹随着信息化的逐步推进,我们迎来了大数据时代。

何谓“大数据”?哈佛大学社会学教授加里·金谈到大数据时曾说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”通过上述的话我们可以概括出大数据主要的三个特征:量大(PB级别的数据)、实时性(更短的时间处理数据)、多样性(非结构的文档数据为主)。

以金融行业为例,当前金融行业面临的一个非常大的问题就是海量数据的存储以及对海量数据的查询优化。传统的数据存储方案已经不能满足大多数金融企业的需求,例如目前很多企业正在建设的数据中心,典型的特点是海量级(千万及以上)数据量,随着数据量的进一步增大,查询性能急剧下降,甚至无法响应,严重影响了业务的连续性,为企业的高效运营带来了挑战。Hyperstor作为兴宇中科提供的一个操作简单的、综合的、性价比高的数据管理安全解决方案。它能够实现真正的CDP数据持续保护及实时恢复。从根本上保证了企业业务的连续性,满足了企业高效运营的需求,是理想的企业级数据安全解决方案。

正是因为大数据的这些特点,给现代企业带来了如何通过数据中心变革解决企业数据管理的问题?这一问题逐渐成为了现代企业发展所面临的关键问题,其在电信、金融等“数据就是业务本身”的行业身上表现的尤为突出,并且已经让很多相信数据之力量的企业正在或者正准备做出改变。

Hyperstor作为针对企业级数据管理存储备份的一体化数据保护解决方案已经在电信,教育等行业得到广泛应用,它能够解决金融,电信等行业多年以来在系统集成、数据管理、业务整合、新业务拓展、面向客户服务以及在成本控制和核算上的系列难题,相信该解决方案将给国内多个行业发展带来一个全新的面貌。

随着信息技术的不断发展和大数据时代的来临,企业未来的数据中心,将是高可靠、高安全、易扩展、易管理、绿色高效、资源共享的智慧云数据中心。能够灵活支撑业务发展,实现监控可视化、控制自动化、管理流程化,并最终帮助企业实现基于优化的基础架构的管理。

因此,企业必须通过优化自身IT设施,实现存储容量和可用性的最大化,实施灵活性设计以支持不断变化的业务需求等相关措施来迎接大数据时代带来的机遇和挑战。

第五篇:大数据时代读书报告

这本书里主要介绍的是大数据在现代商业运作上的应用,以及它对现代商业运作的影响。《 大数据时代》这本书的结构框架遵从了学术性书籍的普遍方式。也既,从现象入手,继而通过对现象的解剖提出对这一现象的解释。然后在通过解释在对未来进行预测,并对未来可能出现的问题提出自己看法与对策。

下面来重点介绍《大数据时代》这本书的主要内容。

《大数据时代》开篇就讲了google通过人们在搜索引擎上搜索关键字留下的数据提前成功的预测了2009年美国的h1n1的爆发地与传播方向以及可能的潜在患者的事情。google的预测比政府提前将近一个月,相比之下政府只能够在流感爆发一两个周之后才可以弄到相关的数据。同时google的预测与政府数据的相关性高达97%,这也就意味着google预测数据的置信区间为3%,这个数字远远小于传统统计学上的常规置信区间5%!而这个数字就是大数据时代预测结果的相对准确性与事件的可预测性的最好证明!通过这一事以及其他的案例,维克托提出了在大数据时代“样本=总体”的思想。我们都知道当样本无限趋近于总体的时候,通过计算得到的描述性数据将无限的趋近于事件本身的性质。而之前采取的“样本<总体”的做法很大程度上无法做到更进一步的描述事物,因为之前的时代数据的获取与存储处理本身有很大的难度只导致人们采取抽样的方式来测量事物。而互联网终端与计算机的出现使数据的获取、存储与处理难度大大降低,因而相对准确性更高的“样本=总体”的测算方式将成为大数据时代的主流,同时大数据时代本身也是建立在大批量数据的存储与处理的基础之上的。

接下来,维克多又通过了ibm追求高精确性的电脑翻译计划的失败与google只是将所有出现过的相应的文字语句扫描并储存在词库中,所以无论需要翻译什么,只要有联系google词库就会出现翻译,虽然有的时候的翻译很无厘头,但是大多数时候还是正确的,所以google的电脑翻译的计划的成功,表明大数据时代对准确性的追求并不是特别明显,但是相反大数据时代是建立在大数据的基础住上的,所以大数据时代追求的是全方位覆盖的数字测度而不管其准确性到底有多高,因为大量的数据会湮埋少数有问题的数据所带来的影响。同时大量的数据也会无限的逼近事物的原貌。

之后,维克托又预测了一个在大数据时代催生的重要职业——数据科学家,这是一群数学家、统计学与编程家的综合体,这一群人将能够从获取的数据中得到任何他们想要的结果。换言之,只要数据充足我们的一切外在的与内在的我们不想让他人知道的东西都见会在这一群家伙的面前展现得淋漓尽致。所以为了避免个人隐私在大数据时代被这一群人利用,维克托建议将这一群人分为两部分,一部分使用数据为商业部门服务,而另一群人则负责审查这一些人是否合法的获得与应用数据,是否侵犯了个人隐私。无论如何,大数据时代将会到来,不管我们接受还是不接受!而且这两年,大数据这个词突然变得很火,不仅出现在阿里巴巴、谷歌等互联网公司的战略规划中,同时在我国国务院和其他国家的政府报告中多次提及,无疑成为当今互联网世界中的新宠儿。我对大数据一直好奇已久,阅读了很多资料仍不得其解,直到读完《大数据时代》才有了粗略的认识。

我侧重于从第一部分中的这三个观点谈谈自己的看法,这三个观点可以说是哲学上说的世界观,这三个观点可以说是哲学上说的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。首先是第一个,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。这个观点足以这个观点足以引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。

第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像candide那样精确地翻译每一句话,它谷歌翻译之所以优于ibm的

candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。第三个观点,不是因果性,而是相关性,这是这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究他们的因果关系。作者用林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的代表,从啤酒和尿布的案例,以及作者举的有 关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于他们策略的帮助。一句话,知道是什么就够了,不用知道为什么。很明显作者所举的例子都是属于商业领域的,但是对于其他领域来说这个观点就值得商榷了。比如说,在科学研究领域,你需要知其然也需要知道其所以然,找到事件发生的原理。用文中的一个例子说明,乔布斯测出整个基因图谱来治疗癌症,但是你治疗癌症你必须知道癌症发病的原理,知道哪一段基因导致了这种疾病,不可能只是说收集各种数据,然后利用其相关性来判断哪里出现了问题

作者在书中把大数据说的很厉害,在最后一部分分析大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。用麦克纳马拉的例子来说明对数据过度依赖所带来的后果。也用《少数派的报告》这部电影来说明如果痴迷于数据会导致我们将生活在一个没有独立选择和自由意志的社会,如果一切变为现实,我们将被禁锢在大数据的可能性之中。所以书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。毫无疑问,大数据将会给社会管理带来巨大的变革。

大数据给人类社会的方方面面带来了巨大的变革,这是社会发展的潮流,不可逆转,我们只有顺应这种潮流,在思想上和技能上做好准备才能成为时代的弄潮儿。对于一家公司或一个国家,要从根本上改变思维和观念,尽早适应这种潮流。

最后,附上一段来自原著的结语:

大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。篇二:《大数据时代》读书报告

读书报告

——读《大数据时代》

坦白地说,这是我第一本看了睡不着的书,我还记得第一次阅读时的兴奋和激动,就像一场头脑风暴。书里的事例是那么的鲜活与生动,完全颠覆我的思维方式,打破了我大脑中解决问题原有的枷锁。这本书让我明白了太多~~~ 它让我明白生活必须要主动。有些人碰到了不公就自认倒霉,能干一点的可能还会去讨个说法,但并没有解决实际问题,这一次可能挽回了那么一点点的损失,但下次遇到了仍是如此,无限循环。当你绞尽脑汁为了节约成本而提前一个月去购买一张你自以为廉价的飞机票,回头却发现,比那些只提前一天购买的人所付的钱还要高出很多时,不知你会怎么想?是被动的接受还是想方法让现实变得更美好? 它让我更好地去理解现实生活的很多情况。现在才理解,为什么网络上有这么多验证码的存在,为什么社交网要用实名制注册,为什么有这么多的“我猜你喜欢”~~~ 虽然我很喜欢那些“黑匣子”,会让我感觉很神奇,但当我真正理解的他的原理时,其实更让我兴奋不已。原来谷歌翻译背后是这样操作的,原来那些每天时不时闯进我们眼球的广告并非偶然,原来预测流感不需要疾控中心而是网络词条,原来电影在开播前就已经知道了收视率和票房~~~ 当然以上这些相当抓人眼球,但这只是大数据的表面,其真正的价值远不仅如此。人类总是以为自己很强大,能控制一切,当然最好还能预测未来。其实大数据真的可以做到,虽然不可能很精确。在我看来这样更好,大致结果可以意料,这就够了,如果发现结果不尽如人意,我们可以提前控制。当然还会有我们意想不到的情况发生,这样会让未来更充满想象,更加充满期待。

它让我懂得不能墨守成规,也不能自以为是。大数据环境是那些微型企业发展的福地,它是行业竞争重新洗牌的动力源泉。在大数据面前,小公司不需要妄自菲薄,大的商业帝国也只有打气十二分的精神才可能让自己立于不败之地。

他让我知道没有做不得,只有想不到。现在的赚取资本的方式已经不再是单靠苦力就可以解决问题的时代了,看见朋友圈里的那些做代购的,都在自我催眠“不要看我们现在是微商~~~微商将来前途无量~~~·”我一直都抱着看看不说话的心态,难免也会哂笑,真的不知道他们和菜场卖菜的有什么本质区别~~~现在是一个依靠知识科技来富国强兵的时代了,真正的优势来源于你提前想到了别人还没去想的,提早完成了别人还没有筹备的计划。

他让我学会世界上没有光杆司令,我们必须学会合作。一个人的能力是有限的,一个人的时间也是有限的,同样公司,国家都是一样的。我们知道谷歌,亚马逊,facebook以及中国的阿里巴巴,百度,新浪这些企业都很强大,可是他们仍然在不断收购合并整合其他一些小的公司,为的是引用他们的科技技术来强大自己的事业版图。

它还教会我在机会面前必须要眼疾手快。在你还在犹豫不决或是自我陶醉的时候,你的对手已经用一个非常低廉的价格得到了他想要翻身的王牌,当你发现时,要么花大血本去换取一张相似的王牌,要与他赤身搏斗。大部分情况下那些聪明的人往往会选择前者,因为他们知道宁可为自己现在的失误埋单也不会让自己靠近万丈深渊。因为若丧失了主动权,那么很有可能导致的结果就是,那个原来看起来微不足道的“小木桩”却扳倒了你这体积庞大的“大象”。

说了这么多大数据给我的启示,其实就是想突出大数据背后的那种神奇的力量。在近代我们似乎与每一样新的科技都失之交臂,但是这一次我们似乎还有机会和时代同步伐,甚至如果我们足够重视,可能还会走在时代的前沿。虽然我们现在谁都没有把握中国到底会利用大数据到什么程度,但已经有好多像周涛一样的有志之士看好中国在利用大数据上的实力,并且付诸了他们的努力。他们一直都坚信以前的落后仅仅是时间上的后知后觉,他们在这一次想

要做到与世界同步,和欧美同步发行此书,在最早一刻就向大家推广大数据这一新名词,向大家灌输着大数据的思维。对此,我也很庆幸,在恰当的时间点与大数据的偶遇。

当然,世界上没有十全十美的东西,再好的发明总是有它的缺陷,大数据也不会例外。舍恩伯格这个对大数据最有权威发言权的人,既然有能力将大数据的好处讲得淋漓尽致,毫无疑问自然也是最清楚大数据危险的人。我很尊敬他的严谨和坦诚,他在细致入微地解释大数据革命性优势的同时,毫无修饰地点明了大数据的劣根性。他很准确地说明了如果我们滥用或误用数据,我们将会受到毁灭性的打击,后果将会如何不堪设想,并且这篇幅一点都不敷衍。作者非常专业,他并没有像某些专家一样,一味地鼓吹自己的“一家之言”。而是在我们头脑发热,一哄而上之前,就给我们非常而且深刻的警醒。这也正是大数据思维的其中之一:馈前控制。

读完这本书以后,我有的确一点蠢蠢欲动,因为它让我觉得大数据并没有像想象的那么遥不可及。书中说,会好好利用大数据的有三种人:第一种是拥有庞大数据库的政府或者商业机构,他们之前只是不知道那些尘封已久的数据还可以创造巨大的价值。第二种是利用技术手段,让数据发挥它独特功能,从而帮他们解决实际问题的数据分析学家,统计师,精算师和其他一些有关于处理数据的相关人员,他们非常了解数据的状态,结构和特征。的确这两类人实力雄厚,前者拥有数据本身,而后者拥有技术。但他们有着同样的短板,那就是他们没有更为创新,灵动的视野,他们很难或者说没有更多的时间去发现那些数据的真正力量。因为他们有太多的思维定式,但种种利用大数据的成功事例表明,每次数据创造的奇迹总在那么的偶然和不经意之间。而这正是我们第三种人的长处,我们没有思维定式,更有闲暇的时间来感受生活,激发灵感。篇三:大数据时代读书笔记

大数据时代——读书笔记

一、引论

1.大数据时代的三个转变: 1.可以分析更多的数据,处理和某个现象相关的所有数据,而不是随机采样 2.不热衷于精确度

3.不热衷与寻找因果关系 2.习惯:用来决策的信息必须是少量而精确的。实际:数据量变大,数据处理速度变快,数据不在精确

3.危险:不是隐私的泄露而是未来行动的预判

二、大数据时代的思维变革 1.原因:没有意识到处理大规模数据的能力,假设信息匮乏,发展一些使用少量信息的技

术(随机采样)

1.1086年 末日审判书 英国对人的记载 2.约翰·格朗特:统计学,采样分析精确性随着采样随机性上升而大幅上升,与样本数

量关系不大

3.1890年,穿孔卡片制表机,人口普查 4.随机采样有固有的缺陷 1.采样过程中存在偏差 2.采样不适合考察子类别

3.只能得出实现设计好的问题的结果 4.忽视了细节考察

2.全数据模式:样本=总体 1.通过异常量判断信用卡诈骗 2.大数据分析:不用随机抽样,而是采用所有数据。不是绝对意义而是相对意义。

(xroom信用卡诈骗,日本相扑比赛)3.多样性的价值(社区外联系很多》社区内联系很多)3.混杂性而非精确性 1.葡萄树温度测量:数据变多,虽然可能有错误数据,但总体而言会更加精确。2.包容错误有更大好处

3.word语法检查:语料库》算法发展 4.google翻译:让计算机自己估算对应关系,寻找成千上万对译

结论:大数据的简单算法好过小数据的复杂算法 5.大数据让我们不执著于也无法执着于精确 6.mit的通货紧缩软件:即时的大数据 7.标签:不精确

8.想要获得大规模数据的好处,混乱是一种标准途经 9.新的数据库:大部分数据是非结构化的,无法被利用 10.hadoop:与mapreduce系统相对的开源式分布系统,输出结果不精确,但是非常快 结论:相比于依赖小数据和精确性的时代,大数据因为更强调数据的完整性和混杂性,帮助我们进一步接近事情的真相。“部分”和”确切“的吸引力是可以理解的。但是当我们的视野局限在我们可以分析和确定的数据上时,我们对世界的整体影响就会产生偏差和错误。不仅失去了尽力收集一切数据和活力,也失去了从不同角度观察时间的权利。

三、不是因果是相关 1.知道是什么就够了,不需要知道为什么。1.亚马逊放弃书评组,使用大数据预测人们的未来购书需求 2.2.在小数据世界,相关关系有用,但是大数据背景,相关关系大放异彩。通过找关联 物,相关关系可以帮助我们捕捉现在和预测未来 1.a和b经常一起发生,那么a发生时可以预测b发生 2.例子:沃尔玛把飓风用具和蛋挞放在一起 3.过时的寻找关联物的方法 a)原因:数据少且收集花时间 b)在建立,应用假想和选择关联物时容易犯错误 c)结论:我们不需要人工选择关联物 3.大数据的相关分析法更准确,更快 1.例子:fico我们知道你明天会做什么 2.伊百丽:根据个人信用卡交易记录预测个人收入,防止逃税 3.aviva:根据生活方式数据预测疾病 4.美国零售商target:通过购买习惯预测是否怀孕 4.通过找出新种类数据的相互联系解决日常需要:找到关联物并监控,我们可以预知未来

1.例子:ups与汽车修理预测 2.新生儿健康监测:肉眼看不到,但是计算机能看到 5.当收集分析和储存数据的成本较高时,应当适当丢弃一些数据 6.数据的非线性关系 1.幸福的非线性关系 7.快速思维模式使人们偏向于用因果关系看待周围的一切,因此经常对世界产生错误认识。这也使大脑为了避免辛苦思考而产生的捷径。大数据会经常被用来证明我们习惯的思维方式是错误的。8.证明因果关系的实验开销大,难于操作;相关关系很有用,不仅是因为能为我们提供新的视角,而且提供的视角都很清晰。一旦我们考虑因果关系,这些视角会被蒙蔽。9.大数据并非是理论消亡的时代。

四、一切皆可量化 1.莫里的信息交换计划:总结所有船只的航海日志已获得好的航线,为第一根大西洋电缆奠定基础

2.坐姿研究与汽车防盗系统 3.数据化

1.把现象转变成可指标分析的量化形式的过程 2.计量和记录促成了数据: 1.阿拉伯数字 2.计数板 3.复式记账法

3.数字化与数据化的区别

1.例子:google的数字图书馆:开始使用扫描-》数字化,进而光学识别-》数

据化。google借此改进自己的翻译 2.文化组学:定量分析揭示人类行为 4.文字变成数据:人可以阅读,机器可以分析 5.方位变成数据:需要一套标准的标记系统和收集,记录数据的工具。1. 始于古希腊

2.1884年,国际子午线会议 3.1978年,全球定位系统 4.英国汽车保险

5. ups的最佳行车路线:减少左转 6.收集用户地理位置数据,以便进行忠诚度计划。或者可以预测交通情况 6.现实挖掘

1.处理大量手机数据,发现并预测人类的行为。2.例子:预测流感隔离区域 3.例子:通过非洲预付费用户的位置信息和他们账户的资金,发现贫民窟是

经济繁荣的跳板 7.沟通变成数据

1.facebook:社交关系数据化

号。新推特频率可以预测电影票房

可能性呈现正相关 8.万物数据化

1.触觉地板:适时开关灯,确定身份,某人摔倒之后是否站起来 2.人体传感器:监控健康状态 4.结论:世界的本质是信息和数据,大数据提供新视角。

五、大数据的潜在价值 1.例子:captcha(验证码,全自动区分人类和电脑的图灵测试)与数据再利用。作者使用了新的验证码recaptcha,人们从计算机光学字符识别程序无法识别的文本扫面项目中读入单词并输出,知道他们都输出正确后才确定(用来破译数字化文本中不清楚的单词)2.大数据时代,所有的数据都是有价值的。现在,我们能够以较低成本获取并存储数据。数据的真实价值就像漂浮在海洋中的冰山,绝大部分隐藏在表面之下。3. 不同于物质性的东西,数据的价值不会随它的使用而减少,而且可不断被处理。意味着数据的最终价值远远大于它的最初价值。在基本用途完成后,数据的价值仍然存在,数据的价值是其所有可能用途的总和。4.例子:ibm与电力汽车动力系统的优化预测:大数据预测模型,甚至考虑天气预报 5.数据再利用:

1. 搜索关键词,搜索结果预测夏天流行色 2.google保存语音翻译记录,开发自己的语音识别技术 3.移动运营商长期使用大数据微调网络性能 4.有些公司可能会收集到大量的数据,但是他们并不急需使用,也不擅长使用数据,但是别的公司可以借此探寻数据的潜在价值 8.重组数据 1.例子:丹麦癌症协会与手机致癌调查:使用所有的手机用户信息和所有的中枢神经系统肿瘤信息。

随着大数据的出现,数据的总和比部分更有价值,当我们将多个数据集的总和重组在一起,重组总和本身的价值也比单个总和更大 9.可拓展数据 1.google街景和gps采集,不仅将其用于基本用途,而且进行了大量的二次利用。例如,对google自动驾驶汽车的运作 10.数据的折旧值

1.随着时间的推移,大多数数据都会失去一部分基础用途,不应用此破坏新数据 2.挑战:如何得知某些数据不再有价值 3.并非所有数据都会贬值。例子:google希望得到每年的同比数据

结论:组织机构应收集尽可能多的使用数据并保存尽可能长的时间。同时也应该与第三方分享数据

11.数据废气:用户在线交互的副产品,包括浏览哪些页面,停留多久,输入信息等 1.数据再利用的方式很隐蔽 2.例子:google的拼写检查:搜集每天处理的查询中数据搜索框的错误拼写 3.例子:google的过滤噪音技术:如果用户点击搜索结果靠后的链接,说明这个结果更加有相关性,google会把这个页面的排名相应提升。4.当用户指出了各种自动化程序的错误,实际上是训练了系统 5.例子:巴诺与数据快照,电子书阅读器捕捉人们阅读书籍的习惯 6.例子:coursera通过捕捉学生犯的错误来提示未来犯错误者

结论:数据废气可以成为公司的巨大竞争优势,和对手的强大进入堡垒 12.开放数据 1.最大的数据收集者:政府,可以强迫人们提供信息,但是信息利用效率低下。最好允许私人运营部门和社会大众访问

2.例子:flyontime网站,通过开放的数据分析航班延误可能性。3.给数据估值:从数据持有人在价值提取上所采取的不同策略入手,将数据授权给第三方

三、角色定位:数据,技术与思维 2.思维转变的重要性 3.三种大数据公司

1.基于数据本身的公司:twitter 大数据最值钱的是他本身,所以应该优先考虑数据拥有者

例子:机票预订系统ita不直接使用数据:担心暴露利润

例子:mastercard通过大数据预测客户的消费习惯 2.基于技能的公司:咨询公司,技术供应商或者分析公司:teradata 例子:埃森哲公司利用大数据检测汽车零件并节省费用

例子:微软分析公司利用大数据降低病人的再入院率 3.基于思维的公司:创新思维

例子:flightcaster飞机晚点预测

例子:prismatic分析新闻并排序 4.大数据先驱者一般有跨学科的知识 5.例子:google和amazon三者兼备 6.全新的数据中间商:从各个地方搜集数据,提取有用的信息进行利用,并不威胁数据拥有者的利益

1.社会需要定向广告

例子:inrix:分析各种汽车制造者的数据和用户的数据,提供卫星导航服务

汽车制造商们本身数据量不够,自身也没有技术利用大数据,也并不介意数据会被中间商利用。同时可以提供失业率等相关数据

例子:quantcast:收集用户访问信息来测评用户年龄等,之后发定向广告

例子:hcci收集医疗保单,分析美国医疗费用上涨是否合理

结论:

1.数据价值的转移:从技术到数据本身和大数据思维 2.传统商业模式颠覆:交易数据而不是交易技术 3.传统专家的光芒会被统计和数据学家取代,因为后者只关心数据 1.例子:谷歌翻译团队的工程师都不会说出翻译的语言 2.真正的专家不会消亡,但是主导地位会改变 3.专业技能只适用于小数据时代,因为那是需要依靠直觉和经验指导,但是

遭遇海量数据时,可以通过数据挖掘得到更多 4.数据和统计学知识将成为现代工厂的基础,人类的价值体现在交流上,以进行广泛而深刻的传播

1.例子:交互式游戏,会根据用户来改良,以数据为基础运作 5.大数据决定企业核心竞争力 1.数据规模决定价值

2.例子:劳斯莱斯通过大数据监测引擎,预测可能出问题的引擎 3.例子:苹果进军手机 4.大数据为小公司带来了机遇:能享受非固有资产规模的好处,低成本传播创新结果,只需要创新思维

5.大数据拥有者会想办法增加数据存储量 6.消费者成为数据拥有者并与中间商交易 7.大数据对中等规模的公司帮助不大:既没有灵活性也没有规模效应 6.大数据撼动国家竞争力:西方世界优势减少

四、大数据时代的管理

1.大数据会带来很多危险,因为其核心思想是用规模剧增来改变现状。2.滥用大数据的力量会伤害人身安全 3.大数据的二次利用颠覆了隐私保护法:无法征得个人同意 4.如果所有人的信息在数据库里,有意识地避免就是此地无银三百两 5.匿名化:交叉检验会检验出来 6.大数据预测:罪责判定基于对个人未来行为的预测。大数据可能会否定人的自由意志 7.数据有其局限性,数据的质量可能会很差,有误导性。8.卓越的才华并不依赖数据:apple乔布斯的才能

五、掌握大数据 1.个人隐私保护:从个人许可到让数据使用者承担责任,因为将责任从民众转移到数据使用者很有意义因为数据使用者比其他人更明白他们想怎么样使用数据,也因为他们是最大利益获得者:监管机制可以决定不同种类的个人数据必须删除的时间 2.信息模糊处理

3.个人应该为他们的行动而非倾向负责 4.打破大数据的黑盒子:大数据算法师:评估数据源,分析数据工具,解读运算结果 1.外部算法师:审计大数据的准确程度和有效性篇四:读书笔记-《大数据时代》

读《大数据时代》 初次见到维克多·迈尔-舍恩伯格教授是在《对话》栏目中,当时谈及当今各种科技信息的变化,然后在主持人的各种提问下,我逐渐了解到“大数据”这个名词,他也是现在对于大数据最有发言权的预言家。一位睿智的人总是能够给人留下很深的印象。然后在中央财经频道的特别节目《指尖上的商机》系列节目中,也谈及到大数据对于当今时代的影响和蕴藏的巨大商机。

读一本好书就像与智者交谈。今天我翻读《大数据时代》,细细品读这位智者给我们的礼物。我们首先应该明白一个概念“大数据”,他不是单单的说数据很大,或者数据很多的意思,真正的意思是:不用随机分析法这样的捷径,而采用所有数据的方法。它告诉我们一种超越现在的对于数据的一种分析方法,这个方法建立在尽可能多的数据上。下面让我们合上此书,让他从我们的思想深处开始发声吧。

首先,大数据时代是建立的基础就是有一个很庞大的数据库,我们分析的对象不是抽取样本,而是用全部的数据作为样本,“样本=总体”。这样我们能够把要调查的对象精确到每一个个体,我们能够对每一个个体提供个性化分析和服务。我们会摆脱抽样样本的误差和失误,同样我们能够细化我们研究的对象和分析的数据。我们分析的适合一个大的整体,也适合每一个个体。这是大数据分析的基础。

第二,大数据是由很多不同的纷繁复杂的数据汇总在一起的,我们必须接受他们的复杂性和不精确性,我们的研究方向除了寻找因果关系之外,增加了一种相关关系的研究。我们通过数据之间的关系,分析得到我们想要得到的结论或者是模型。在这里我们应该重点看一下,相关关系是我们打开的另一扇窗,而不能关闭因果关系的现在开着的窗户。我们开始重视相关关系,但是不能放弃对于因果关系的研究。作者也在文中阐释我们的生活还是需要因果关系的,甚至我们需要大数据算法师,我们需要了解“黑匣子”中的神秘。这是大数据时代我们应该正确认识的。

第三,大数据的原始来源是用不同的方法收集,为了有尽可能多的数据,我们现在有了电脑,搜索引擎,智能手机,可穿戴设备,社交平台,还有无数的传感器等等,我们可以把文字,位置,动作,喜好等所有的世界进行量化,他都可以用数字表示,这就是我们所有的纷繁复杂的原始数据,他们是一座钻石矿,由于无数种的相关组合可以不断地挖掘出我们所需要的信息。这是我们不断利用大数据的基础。我们需要不断更新的数据。

第四,未来在过去的尘埃中。我们分析大数据最大的作用就是预测未来,知道下一步你会做什么,知道下一个最危险的事物或人。我们用什么方法预测未来。这是一个商业,政府,甚至世界的时代,我们分析的方法就是动用自己敏锐的思维发现相关性,然后动用我们的数据分析工具对其进行相关性分析,最后我们用统计学研究出一个模型。通过模型我们能够预测未来。大数据分析的关键就在于数据,思维和技术。现在我们有快速分析的工具,正在不断收集数据,那么最重要的就是人类的思维,一个能够分析相关性,能够创新使用数据的思维。在大数据时代我们需要把统计学,软件工程师和创新思维结合在一起的人才。

第五,我们能够知道每一个人的位置,喜好,关注什么,即将干什么等等,对于每个人来说都是一个很可怕的事情,如果我们赤裸裸的暴露在阳光之下,或者我们正在暴露中,我们的隐私应该受到保护,这也是大数据时代一个亟待解决的问题,尽管我们匿名分析信息,到最后我们还是能够精确到个人,我们需要有人负责,这是安全问题,自由和科技或商业的发展产生矛盾,我们应该何去何从?我们担忧的,相信会有人来解决。这涉及到我们每个人的利益。

来暴露我们需要的产品;我们用百度、google来暴露我们所关注的事情。我想有好多双眼睛正在盯着我们,只是我们还不知道。这是一件可怕的事情。

下载大数据时代来临读书月心得体会word格式文档
下载大数据时代来临读书月心得体会.doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    大数据时代读书心得

    生活,工作以及思维的大变革 ——读《大数据时代》有感及所思 读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显......

    《大数据时代》读书心得范文合集

    大数据时代,引领信息全球化 ——读《大数据时代》有感 如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经......

    大数据时代读书心得

    一部似乎还没有写完的书——读《大数据时代》有感及所思读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作......

    大数据时代心得体会

    《大数据时代》心得体会 信息时代的到来,我们感受到的是技术变化日新月异,随之而来的是生活方式的转变,我们这样评论着的信息时代已经变为曾经。如今,大数据时代成为炙手可热的......

    高铁时代来临心得体会

    高铁时代来临,XX更应主动服务发展大局 一、高铁为时代发展带来新机遇 高铁作为一种交通工具,肇始于日本,发展于欧洲,格局大变于中国。 一条铁路可以改变一个地区的经济状况,一条......

    读书报告——《大数据时代》观后感

    读书报告——《大数据时代》观后感 大数据时代,一个被嚼烂的词汇,不知从何时起,兴起了数据科学的狂潮,本书核心论点,第一,要全体不要抽样,第二,要相关不要因果,第三,要效率不要精确。......

    市场营销读书报告--《大数据时代》

    市场营销读书报告--《大数据时代》 读书报告题目:大数据时代的生活、工作和思维变革 书名:大数据时代作者:[英]维克托·迈尔-舍恩伯格,肯尼思·库克耶 出版社:浙江人民出版社出版......

    学习《大数据时代》读书心得

    读《大数据时代》心得体会 根据公司《关于下发中国共产党员全年学习计划的通知》组织分公司全体党员个人学习《大数据时代》,读了《大数据时代》后,感觉到一个大变革的时代将......