第一篇:《大数据时代》读后感 (大学作业)
大数据的商业化应用与现实思考
———读《大数据时代》
今年5月,马云在卸任阿里巴巴CEO的演讲上说“很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数据时代又来了。”
最近几年是历史上创业环境最好的时期,时势造英雄,大数据也登上了风口浪尖,不仅出现在阿里巴巴、谷歌等互联网公司的战略规划中,同时在国务院和政府报告中多次提及,无疑成为互联网世界中的明星。《大数据时代》这本书,举出了很多现实案例,提出的精炼理论,让我受益匪浅,引发了很多思考。
本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革。其主要观点这里我就不再赘述,主要结合自己的思考谈谈想法。
一、未来的商业化应用
可以预见的是未来数据和内容将取代技术成为互联网的核心标志,大数据的价值在于基于对数据和内容的分析,继而极大的优化资源配置。大数据行业属于互联网的一个重要部分,赢者通吃的规律也同样适用,未来在大数据的商业化应用中会产生体量巨大的跨国公司。
数据本身不产生价值,如何分析和利用大数据对业务产生帮助才是关键。大数据就像地球上难以计数的土壤,正真有价值的信息就像金矿一样埋藏在地下,挖出并利用“金矿”才 是关键。随着未来的趋势,大数据将进入更务实的发展阶段,我认为大数据挖掘商业价值的方法有以下几个方面:
1.大数据交易,数据就是未来的石油、煤炭。
原始数据蕴含着巨大商业价值,获取原始数据就像开采出来的矿石,需要进一步的加工冶炼,才能发掘其价值。目前,出现了中关村数海大数据交易平台、贵阳大数据交易等企业级交易平台。2015年5月,在贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会上,贵阳大数据交易所推出《2015年中国大数据交易白皮书》和《贵阳大数据交易所702公约》,为大数据交易所的性质、目的、交易标的、信息隐私保护等指明了方向,奠定了大数据金矿变现的产业基础。
历史上无数的风险投资会为科技公司捧场,越来越多的资金会进入大数据交易市场,随着市场交易的活跃,规模的扩大;必然会产生大数据期货,主题基金债券等金融衍生品。市场的发展会进一步带动下游和上游产业的繁荣,最终形成系统化、规模化的商业体系。
2.提供商业信息,为企业经营、行业发展提供指导服务。
大数据的商业应用越来越广泛,作用也越来越明显,书中举出了一些例子,我这里再做以补充:
滴滴打车利用大数据分析实时综合调度“快车”、“专车”、“出租车”、“顺风车”甚至是滴滴巴士的资源,实现全局的交通资源优化。全局的资源配置避免了资源浪费和过度竞争,大大提高了交通资源的使用效率。
美国的一家跨国农业生物技术公司孟山都,让农民不用懂“高科技”也能享受大数据的成果。建立了农业数据联盟来统一数据标准,并通过对数据的分析为农民提供“决策服务”,农民只需在驾驶室里拿出手机,收集种子监视器传来的数据,然后将其上传给服务器,最终服务器将返回化肥的配方到农场拖拉机上,完成对农作物的精确施肥。仅仅这一项技术,每年就为美国农民节省出数亿美元的化肥支出。
未来社会中,信息就是金钱,大数据提供出来的大量有价值的信息会创造出极大的商业价值。庞大的市场需求会催生出专门利用大数据分析来提供商业咨询服务的公司,在企业级客户中将扮演举足轻重的角色。
3.政府决策智库,提高决策效率和科学性。
我在今天的今日头条qpp中看到了这样的新闻:《安徽省人民政府办公厅关于印发安徽省运用大数据加强对市场主体服务和监管实施方案的通知》。继而联想到本书中作者概况出大数据的四大特征:大量(Volume)、多样(Variety)、价值(Value)、高速(Velocity)。政府作为大型公众管理机构其信息需求与大数据一拍即合。
例如“911”事件之后,美国政府在反思中发现,多个安全部门之间协调不到位、不能及时分享情报资源,是其虽然掌握了诸多线索却没能预防恐怖事件发生的重要原因之一。通过建立“棱镜”等大数据平台,运用大数据技术和分析手段,美国的国家安全部门能够以更高效率完成对多种来源数据的分析,并揭示出不同行为间的互动关系,进而能够运用分析算法预测危险分子的行动趋势。这为安全部门预防恐怖主义等威胁国家利益的行为提供了前所未有的可能。
另外,以大数据为手段,能够提高从各种情报中“大海捞针”的水平,通过提取人们行为的时空规律性和关联性,进行犯罪预测。加利福尼亚州桑塔克鲁兹市使用犯罪预测系统,对可能出现犯罪的重点区域、重要时段进行预测,并安排巡警巡逻。在所预测的犯罪事件中,有三分之二真的发生。系统投入使用一年后,该市入室行窃减少了11%,偷车减少了8%,抓捕率上升了56%。
这样的例子有很多,大数据对政府的决策带来的改变是革命性的,但作为政府部门,其基因决定它不会直接参与对大数据的分析,但刚性需求会创造巨大的市场,将会出现类似兰德公司模式但利用大数据进行分析的决策智库,政府将会为其信息服务买单。
4.金融投资工具
传统的金融投资机构也越来越多的引用大数据来帮助决策,人在投资交易过程中无法避免的受到个人情绪,个人偏好的影响,带有主观因素;另一方面,市场瞬息万变,每时每刻都产生数以万计的交易信息,很大程度已经超出人脑的计算处理能力。未来的趋势是要让数据“说话”。
证券市场行为、各类指数与投资者的分析、判断以及情绪都有很大关系,而后者都可以从数据中获取,现实生活中拥有大量用户数据的互联网公司将其论坛、博客、新闻报道、文章、网民用户情绪、投资行为与市场行情对接,研究的是互联网的行为数据,关注热点及市场情绪,动态调整投资组合,开发出大数据投资工具,比如大数据类基金等,这些投资工具直接将大数据转化为投资理财产品。
随着技术的发展,基于大数据的金融投资工具将越来越普及,也将成为大数据商业化应用中的重要组成部分。
5.健康与医疗
书中提到的一个例子,2009年,谷歌推出“流感趋势预测“项目,在甲型H1N1流感暴发的几周前,“谷歌流感趋势”成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,并且非常及时。谷歌的判断基于人们的搜索行为,而现在在苹果iwatch的模范效应下,可穿戴设备大行其道,利用传感器收集大量的人类行为和生理运动数据,比如健身腕带可以收集有关我们走路或者慢跑的数据,行走步数、卡路里消耗、睡眠时长等;床垫监测传感器可以自动监测和记录心脏速率、呼吸速率、运动和睡眠活动„„通过计算机的分析处理,这些数据与健康记录可以用来监测我们的健康状况,并提出对应的建议和风险预警。
整个链条从采集、传输、处理、分析都离不开大数据的支持,最终构成以大数据为基础的产业系统,作为最基础的数据将具有极高的商业价值。
二、现实思考
1.大数据是否存在泡沫?
Michael Jordan教授是机器学习和大数据应用世界范围内最被尊敬的专家之一,这里引用他的他观点:
(1)目前的大数据给出的结果可靠性不够,如果急于应用到实际中,就好比是土木工程都没学好就开始造桥,结果只能造出“豆腐渣工程”
(2)作为一个科学,不够严谨(原文是“没有error bar”)。不像造桥的土木工程,经过多年的积累,明确地能告诉我们什么样的情况可以造,什么不可以,而大数据没有。
(3)有些媒体为了让公众容易理解打了些比方,但是这种比方造成了太多误解,进而造成了太多夸张的宣传。大数据还是一个没有足够严谨程度的科学。
很多时候过早对一个技术爆发热情,寄希望它可以改变世界,如果短时间没有成果,有可能热情一下子转冷又觉得这是个错误,加速抽离给这个技术的资源。显然Michael教授很担心现在公众对这个技术的热情,并不是基于对这个技术的理解,而是出于对概念的追捧,从而有可能会经历这样的态度转变。但是他认为这个领域是现实存在的,很多重要的应用,假以时日,是会创造价值的。但是现在很多媒体宣传和投资行为,存在泡沫。
原文:Machine-Learning Maestro Michael Jordan on the Delusions of Big Data and Other Huge Engineering Efforts
2.关于本书作者提出的“不是因果关系,而是相关关系”。
本书译者周涛教授在序言里表示有待商榷,他甚至认为如果放弃对因果关系的分析,是人类的堕落。
人类在不断的问“为什么”的时候成长进步,对世界万物规律性的理解是人类发展进步的原动力。一个普遍的共识是,科学的精神就是质疑,从早期的“唯上帝论”到改革开放初期风行的“超能力”,再到近期的“气功大师”;在历史发展中违背科学精神的反面案例不胜枚举;对自己不了解的事物,不能单纯的用想象力去填补。另一方面,由于自身眼界和知识的局限性,对事物的认识不够深入,要通过不断地学习来提高自己。
依照作者的观点,大数据会告诉我们,会怎么样,但是却很难说清楚为什么这样。(可能也可以解释清楚,但是我们会难以理解,就像虫洞和多维空间的概念。)
但细细想来,我认为因果关系是存在的,大数据之间的关系并不能用简单的因果关系,或者相关关系来解释;它类似于立体化的点线面之间的关系,单独数据(事件)之间必然存在因果关系,而大数据体量巨大,关系错综复杂,可以理解为众多单独数据(事件)点,点与点之间的关系构成一条线,线与线之间构成面,最终构成多个面的大数据关系,它是无数因果关系的有机立体化组合,看似错综复杂,但是其中也有规律可循。
3.大数据时代如何保护个人隐私?
我们经常用个人信息来交换服务:我们使用百度地图,交换出去现在的位置信息;我们使用QQ,交换出去自己的个人关系;我们使用天猫,交换出去联系方式甚至家庭住址。这些交换难以用价格衡量,往往也不会让人觉得心疼或不安,因为是为了得到服务。
就像走路不能抹去自己留下的脚印一样,大数据时代,你无法抹去的“数据脚印”也让你的隐私暴露风险增大。事实上,不仅包括互联网,一个人的”数据脚印”还散落于各个信息系统里面,包括手机、PC、信用卡、交通卡、视频监控等各种业务系统,这些分散在各个系统中的数据乍一看价值不大,但如果把它们深入整合、挖掘,就能发现这个消费者的性格、爱好以及消费习惯等信息,这些信息对商家非常有价值。但对消费者来说,宁静生活却往往由此被打破。
作者在书中在最后一部分分析大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。用麦克纳马拉的例子来说明对数据过度依赖所带来的后果。书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。但是这些措施会起到多大作用值得商榷。
我认为在未来个人的隐私实在是难以遁形,技术是一把双刃剑,我们应用技术提高生活水平,同时也用我们的隐私做出了交换。每个人都不是独立的,未来作为一个“社会人”,一方面在保证知情权的前提下,我们可以放弃一部分非核心的隐私,来交换更好的服务,同时要形成对自我隐私保护的习惯,另一方面要加强立法监督。
结语:
“近一百年来,总有一些公司很幸运地、有意识或无意识地站在技术革命的浪尖之上。对于一个弄潮的年轻人来讲,最幸运的,莫过于赶上一波大潮。” 这是清华大学博士、前谷歌工程师吴军写在其代表作《浪潮之巅》扉页上的话。
大数据的浪潮正在酝酿,我们必须以知识和能力武装自己,做一个冷静而又技艺精深的“冲浪者”。
学号:110150405 姓名:魏阳班级:13级广告1班
第二篇:大数据时代读后感
《大数据时代》读后感
看完“《大数据时代》——生活、工作与思维的大变革”,颇为感慨,这世界变化真的快!农业化、工业化、信息化时代的相继经历,使得世界天翻地覆。
我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。这个命题是我读这本书最大的感触。个人认为也是这本书最核心的思想。首先,书提出一个颠覆我以前认知的命题--“并非原子而是信息才是一切的本源”,将世界看做信息,看做可以理解的数据的海洋,为我们提供了一个从未有过的审视下的视角。它是一种可以渗透到所有生活领域的世界观。这个命题是在书的最后一部分中的某一段中描写的。我之所以把它放在最前面来讲,因为我觉得,这是谈数据化世界的前提,自然也是谈论大数据的前提。书的中间部分有一节讲到数据化和数字化的区别。经过我自己脑子的整理,把数据化世界这个命题列为大数据思维的第二步。写到这里,我不由得反省下,我是不是有领悟到书的精髓所在,就是第一句话。书中另一个吸引我的地方就是,有很多观点的论述,会从哲学的高度论述。虽然,自己肚子没多少墨水,但是读这些描述的时候,就会发现自己会更好的理解作者提出的命题。比如书中有一段文字
当我们说人类是通过因果关系了解世界时,我们指的是我们再理解和解释世界各种现象时使用的两种基本方法:一种是通过快速、虚幻的因果关系,还有一种就是通过缓慢、有条不紊的因果关系。大数据会改变这两种基本方法在我们认识世界时所扮演的角色。
在附上一些事例的时候,用作者提供的“本质”去看待时,很容易理解,确实是这么回事。好了,那么大数据到底改变了我们什么呢,作者给出3点,大数据的精髓在于我们分析信息时的三个转变,这些转变讲改变我们理解和组建社会的方法。
第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样(样本=总体)
第二个转变就是,研究数据如此之多,以至于我们不再热衷于追求精确度
第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。大数据告诉我们“是什么”而不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。
正如大家所知道的那样,人类的大脑具备这样的功能,它会把新输入的刺激或信息与“过去的经验或积累的部分知识”相对照,然后进行调整并接受下来。如果眼前新的现实与大脑中储存的固有信息无法协调,便会在无意识中拒绝接受新的现实;或者通过自己一知半解的知识任意推测,使自己认识到的情况偏离实际。这是人的一种本能,目的在于使自己保持冷静。所以作者称之为revolution。
讲了这么多,那么大数据到底给我们带来什么。在这里,我只想谈我感触最深的,其他的有兴趣的可以自己去了解。当然,书中提了很多,最多的就是,XXX公司或者个人利用大数据创造了多大的财富了,抛开这些表面的不说,最让我动心亦或者是害怕的是---预测。
大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习。但是这种定义是有误导性的。大数据不是要教机器像人一样思考。相反,它是把数学算法运用到海量的数据上来预测事情发生的可能性。一封邮件被作为垃圾邮件过滤掉的可能性,输入的“teh”应该是“the”的可能性,从一个人乱穿马路时行进的轨迹和速度来看他能及时穿过马路的可能性,都是大数据可以预测的范围。当然,如果一个人能及时穿过马路,那么他乱穿马路时,车子就只需要稍稍减速就好。但是这些预测系统之所以能够成功,关键在于它们是建立在海量数据的基础之上的。此外,随着系统接收到的数据越来越多,通过记录找到的最好的预测与模式,可以对系统进行改进。
在不久的将来,世界许多现在单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代。计算机系统可以发挥作用的领域远远不止驾驶和交友,还有更多更复杂的任务。别忘了,亚马逊可以帮我们推荐想要的书,谷歌可以为关联网站排序,facebook知道我们的喜好,而linkedin可以猜出我们认识谁。当然,同样的技术也可以运用到疾病诊断、推荐治疗措施,甚至是识别潜在犯罪分子上。
就像互联网通过给计算机添加通信功能而改变了世界,大数据也将改变我们生活中最重要的方面,因为它为我们的生活创造了前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。
这是大数据带来最核心的东西,动心的理由无须赘述,计算机会告诉你什么时候买什么双色球可以中头奖,想想心里是不是有一点小激动咧。当然这只是我打的一个比较夸张的比喻。至于害怕呢,书中有段话我很喜欢
公平正义的基础是人只有做了某事才需要对它负责,毕竟,想做而未做不是犯罪,社会关系于个人责任的基本信条是,人为其选择的行为承担责任。如果大数据分析完全准确,那么我们的未来会被精准的预测,因此在未来,我们不仅会失去选择的权利,而且会按照预测去行动。如果精准的预测成为现实的话,我们也就失去了自由意志,失去了自由选择的权利。既然我们别无选择,那么我们也就不需要承担责任。这不是很讽刺吗。
扯到这里,顺便扯一下,书中另一段关于自由意志的描述
在哲学界,关于因果关系是否存在的争论已经持续了几个世纪。毕竟,如果凡事皆有因果的话,那么我们就没有决定任何事的自由了。如果说我们做的每一个决定或者每一个想法都是其他事情的结果。而这个结果又是由其他原因导致的。以此循环往复,那么就不存在人的自由意志这一说了。----所有的生命轨迹都只是受因果关系的控制了。因此,对于因果关系在世间所扮演的角色,哲学家们争论不休,有时他们认为,这是与自由意志相对立。
书中举了个例子,举了部电影《少数派报告》,当我看到这里的时候,“哎哟,我居然看过这部电影,想想心里还是有点小激动”,有兴趣的可以去看下,大概就是讲警察通过预测来提前抓捕犯人,不过不是通过大数据,是通过超人类的方式。当你什么举动都可以被预测,相当于你完全暴露在太阳光下,换成你,你害怕不。
最后,附上两段结语,一段是书中的一段话,另一段是我自己瞎编的大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。
大数据终将会影响到我们,也像其他技术一样会是一把双刃剑,用得好,动心,滥用,害怕。如同核技术一样,用的话,造福地球,滥用,给个金刚石地球你,照样爆。我相信,未来的大数据的发展会如作者所说的,是一场生活、工作与思维的革命。
无论如何,大家看到这四个是不是有种,不管我上面扯得有没有道理,通不通顺,下面的话,会很有道理的样子的错觉(抄袭于《栋笃笑》)OK,无论如何,日子还是得照过。施主,我看你骨骼惊奇,是个练武奇才,最后送上《九阳神功》心法,以后维护世界和平的重任就交给你了。
他强由他强,清风抚山冈。
他横由他横,明月照大江。
他自狠来他自恶,我自一口真气足。
无处不在的大数据:各种云计算,谷歌的神通,亚马逊的推送,天涯人肉,微博万能等等等等,我们掌握了新的工具,也获取了以前从未有过的各种信息。大数据拉近了我们与现实的距离,“地球村”变成了“地球屋”,仿佛所有人所有事物都触手可及,而这些牛逼哄哄的互联网巨头就在客厅展示着世界的每一寸光景。
然而,事实真的是这样吗?首先,从应用角度出发,低廉的运算能力和存储空间,让以前的样本分析显得非常简陋——一些从全体数据挖掘出来,忽略精确而从大量数据的简单算法得出来的结论颠覆了常识。但个人觉得,这只是统计学的终极目标——并没有非常大的跨越,可能终结了回归分析,有效性验证等手段,但依旧还是统计。而革命性在于关注相关关系而非因果关系。现场讨论从神学角度挑战了因果关系的不可能——或者说人类用简单思考的逻辑来定义因果,以及用之前小数据演绎出大概率事件来推导因果,都是不正确的。真正的因果关系应该属于上帝的范畴,人类如果真的完全掌握之后,会统治整个宇宙。但我觉得,无需从神学观点来讨论,而可以借鉴量子力学对经典力学的颠覆——在原子层面上,经典力学会失效——那么在大数据层面上,普通的抽样调查直观反映会失效。而且从量子力学角度是很难推导经典力学的公式,那么从现在的惯有思维,也难以推导出大数据的因果关系。同时现场有讨论,是否计算机可以精确地模拟每个原子,然后完整地展现微观到宏观的化学反应细节?我觉得首先是计算能力不足,其次即便设定原子的运动条件真的正确,计算结果未知但宏观结果我们却已经知道——牛顿的经典力学足以应付日常绝大部分情况了。好比切西瓜,究竟刀头的铁原子和西瓜的有机分子如何作用,真的重要吗?回归到商业领域,如果我们可以提高相关性的准确度,从而提高投入效率,那就已经足够了。本来一个产品受到一半客户喜欢,但如果通过大数据挖掘到更好的定位,有百分之八十的客户喜欢,那么价值已经非常可观了。
大数据帮助我们把未来的迷雾拨开了一点,但好比《沉重的肉身》当中讨论的,更多的选择权并不能带给人幸福——因为知道自己不能做不能得到的也更多了。解决工作模式,生存意义,幸福之道等问题,关键还是看自己如何看待和使用这些新式工具以及新结论。引用《神探伽利略》里面的台词:可被重复的,一定有道理存在。那么现在重复的越来越多,更需要保持探索和敬畏之心,人才不会迷路。
第三篇:大数据时代读后感
我们生活在数据时代,因此我们不能漠视数据。然而在这个社交网络的逐渐成熟,移动带宽的迅速提升,以下是小编准备的大数据时代读后感,希望给大家带来帮助!【篇一:大数据时代读后感】
对于畅销书刊、热点话题、时尚科技,始终不太感兴趣。书刊,喜欢有一定年份的;话题,钟情于务虚的观点;新奇的产品于我无缘,习惯使用成熟的科技产品。既不清高,也非冷漠,就是要与现实保持一定的距离,给自己留一点思考的空间。这一习惯最近破了例。由于工作的原因,耳濡目染,“大数据”这个新兴概念开始频繁步入我的视野。按捺不住内心的好奇,网购《大数据时代》,手不释卷,三天读完,颇有收获。此书有如下特点。
首先,作者站在理论的制高点上,条理清楚地阐述了大数据对人类的工作、生活、思维带来的革新,大数据时代的三种典型的商业模式,以及大数据时代对于个人隐私保护、公共安全提出的挑战。其次,文中的事例贴近现实生活,贴近时代,令读者既印象深刻,又感同身受。此外,作者没有使用大量的专业术语,没有假装一副专业的面孔。纵观全书,遣词造句,均通俗易懂。
作者认为大数据时代具有三个显著特点。
一、人们研究与分析某个现象时,将使用全部数据而非抽样数据;
二、在大数据时代,不能一味地追求数据的精确性,而要适应数据的多样性、丰富性、甚至要接受错误的数据。
三、了解数据之间的相关性,胜于对因果关系的探索。“是什么”比“为什么”重要。
作者指出,随着技术的发展,数据的存储与处理成本显著降低,人们现在有能力从支离破碎的、看似毫不相干的数据矿渣中抽炼出真知烁见。在大数据时代,三类公司将成为时代的宠儿。
一是拥有大数据的公司与组织。如政府、银行、电信公司、全球性互联网公司(阿里巴巴、淘宝网)。
二是拥有数据分析与处理技术的专业公司,如亚马逊、谷歌。
三是拥有创新思维的公司,他们可能既不掌握大数据,也没有专业技术,但却擅长使用大数据,从大数据中找到自己的理想天地。
面对即将来临的大数据时代,个人将如何应对自如?这是个严肃的问题。
【篇二:大数据时代读后感】“除了上帝,任何人都必须用数据来说话。”——这是《大数据》中出现的让人印象深刻的一句话,也是全书力图传递的信息。在数字信息时代,数据和空气一样遍布生活,对于有些人来说,数据无意义,而对于有些人来说,数据,即真相。
美国是《大数据》的主角,全书通过讲述美国半个多世纪信息开放、技术创新的历史,公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,Web3.0与下一代互联网的未来图景等等,为读者一一细解数据创新给公民、政府、社会带来的种种挑战和变革。
透过全书,一个立体的美国及美国人民的思想呈现在我们面前——美国人民执著于个人隐私的保护,却又不遗余力地推动着政府信息的透明与公开。
读完此书,对生活中的数据及数据处理突然有了很大的兴趣。如果有一天,处处以数据说话,那么,政治、制度、生活将更加清明,事故、将降到最低点。
作为信息技术教师,是有必要阅读此书的!有慧根的教师将能从书中挖掘出信息技术特有的文化以及能用于教学的鲜活案例。
每天能用来阅读的时间很少,总是要等到夜深疲倦时才有空打开书本,总是在眼睛极不舒服的情况下坚持阅读,《大数据》就这样在坚持中溶入我的思想……
【篇三:大数据时代读后感】读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓道来,引人入胜,令我大开眼界。
我在想,大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。
长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。
如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。
与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的到来,教学有所改变是必然的。所以,无论环境怎么变换,数据如何复杂,我们都不能不去改变自己的教学去迎合将来的这个大数据时代。
第四篇:大数据时代读后感
大数据时代读后感
发布:励志 | 分类:读后感 | 发表评论
大数据时代读后感
(一)去年的“云计算”炒得热火朝天的,今年的“大数据”又突袭而来。仿佛一夜间,各厂商都纷纷改旗换帜,推起“大数据”来了。于是乎,各企业的CIO也将热度纷纷转向关注“大数据”来了。有一张来自《程序员》微博的漫画很形象。我觉得这张图,很真实地反映了现实中小企业云计算,大数据的现状。
不过话又还得说回来,《大数据时代》是本好书。
当然,很多IT知名人士也大力推荐,写了好多读后感来表述对这本书的喜欢没看此书之前,对所谓大数据的概念基本上是一头雾水,虽则有了解关注过现在也比较火热的BI,觉得也差不多,可能就是更多的数据,更细致的数据分析与数据挖掘。看过此书后,感觉到之前的想法,只能算是中了一小半吧---巨量的数据,而另一前:着眼于数据关联性,而非数据精确性,或许才是大数据与现时BI最大的不同,不仅仅是方法,更多的时思想方法。不过坦白讲,到底是数据的关联性重佳,还是数据的精确性更好,还真的需要时间来检验一下,至少从现在的数据分析方法来论,更多的倾向于数据的精确性。看完此书,我心中的一些问题:
1.什么是大数据?
查了查百度百科,是这样定义的:大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity--这个好像是IBM的定义吧。
以个人的观点来看:数据海量,存储海量都是大数据的基本原型吧。
2.大数据适合什么样的企业?
诚然,大数据的前提是海量的数据,只有拥有巨量的数据资源,方能从中查找出数据的关联性,才可以让通过
专业化的处理,让其为企业产生价值。针对电信运营,互联网应用这样海量用户的数据的大企业,也是在应用大数据的道路上拥有得天独厚的条件,但是针对中小企业呢?销售订单数据?若非百年老店,估计数据也是少得可怜,5,能用的可能只有消费者数据了吧。貌似大多数厂商,用来举例的也就是消费都购买行为分析为最多。同样,在公共事业类的政府机构,大数据的作用也许也能很好的发挥。反而感觉在大多数中小型企业应用大数据,似乎有点大题小作。书中说:大数据是企业竞争力。诚然,数据是一个企业的核心无形资源(利用得好的话),但是否所有的数据,或都换则方式说:所有的企业都以大数据为竞争力,是否真的合适么?是否在中小企业中,会显示得小题大做呢?
3.大数据带来的影响
当一波又一波的IT技术热潮源源不断地向我们铺面而来的时候,你甚至都没有做好准备,你都要开始迎接它所给你带来的影响了。经过物联网,云计算的推波助澜下,大数据开始登场了。但它到底给我们带来了什么呢?
1)预测未来书中以Google成功预测了未来可能发生流感的案例来开篇,表明通过大数据的应用,可以为我们的生活起一个保驾护航的指向标。实质很简单,技术改变世界。
2)变革商业大数据所带来的商机,同时会衍生出一系列与大数据相关的商业机遇与商业模式,数据的潜在价值会源源不断地发挥作用可以容易想到的是未来有专门的数据收集,数据分析,数据生成的一条数据产业链产生。影响最大的,当然是IT公司
3)变革思维书中所说:因为有海量的数据作基础,未来,我们可能更关注数据的相关,而非精细度。对这条,本人还是持保留意见的。
大数据时代读后感
(二)如今说起新媒体和互联网,必提大数据,似乎不这样说就OUT了。而且人云亦云的居多,不少谈论者甚至还没有认真读过这方面的经典着作——舍恩佰格的《大数据时代》。维克托·迈尔——舍恩伯格何许人也?他现任牛津大学网络学院互联网研究所治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人。他的咨询客户包括微软、惠普和IBM等全球顶级企业,他是欧盟互联网官方政策背后真正的制定者和参与者,他还先后担任多国政府高层的智囊。这位被誉为:大数据时代的预言家“的牛津教授真牛!那么,这位大师说的都是金科玉律吗?并不一定,读大师的作品一定要做些功课才好读懂,如果能做足功课又具备相应的理论功底,就能与之进行一场思想上的对话。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分”大数据时代的思维变革“中,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据;
二、更杂:不是精确性,而是混杂性;
三、更好:不是因果关系,而是相关关系。对于第一个观点,我不敢苟同。一方面是对全体数据进行处理,在技术和设备上有相当高的难度。另一方面是不是都有此必要,对于简单事实进行判断的数据分析难道也要采集全体数据吗?我曾与香港城市大学的祝建华教授讨论过。祝教授是传播学研究方法和数据分析的专家,他认为一定可以找到一种数理统计方法来进行分析,并不一定需要全部数据。联系到舍恩伯格第二个观点中所说的相关关系,我理解他说的全体数据不是指数量而是指范围,即大数据的随机样本不限于目标数据,还包括目标以外的所有数据。我认为大数据分析不能排除随机抽样,只是抽样的方法和范围要加以拓展。
我同意舍恩伯格的第二观点,我认为这是对他第一个观点很好的补充,这也是对精准传播和精准营销的一种反思。”大数据的简单算法比小数据的复杂算法更有效。“更具有宏观视野和东方哲学思维。对于舍恩伯格的第三个观点,我也不能完全赞同。”不是因果关系,而是相关关系。“不需要知道”为什么“,只需要知道”是什么“。传播即数据,数据即关系。在小数据时代人们只关心因果关系,对相关关系认识不足,大数据时代相关关系举足轻重,如何强调都不为过,但不应该完全排斥它。大数据从何而来?为何而用?如果我们完全忽略因果关系,不知道大数据产生的前因后果,也就消解了大数据的人文价值。如今不少学者为了阐述和传播其观点往往语出惊人,对旧有观念进行彻底的否定。
世间万物的复杂性多样化并非非此即彼那么简单,舍恩伯格也是这种二元对立的幼稚思维吗?其实不然,(www.xiexiebang.com)读者在阅读时一定要看清楚他是在什么语境下说的,不要因囫囵吞枣的浅读而陷入断章取义的误读。比如说舍恩伯格在提出”不是因果关系,而是相关关系。“这一论断时,他在书中还说道:”在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究的因果关系,找出背后的‘为什么’。“[i]由此可见,他说的全体数据和相关关系都在特定语境下的,是在数据挖掘中的选项。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。舍恩伯格认为数据化就是一切皆可”量化“,大数据的定量分析有力地回答”是什么“这一问题,但仍然无法完全回答”为什么“。因此,我认为并不能排除定性分析和质化研究。数据创新可以创造价值,这是毫无疑问的。舍恩伯格在讨论大数据的角色定位时仍把它置于数据应用的商业系统中,而没有把它置于整个社会系统里,但他在第二部分大数据时代的管理变革中讨论了这个问题。在风险社会中信息安全问题日趋凸显,数据独裁与隐私保护成为一对矛盾。如何摆脱大数据的困境?舍恩伯格在最后一节”掌控“中试图回答,但基本上属于老生常谈。我想,或许凯文·凯利的《失控》可以帮助我们解答这个问题?至少可以提供更多的思考维度。正如舍恩伯格在结语中所道:”大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。“谢谢舍恩伯格!让大数据讨论从自然科学回到人文社科。由此推断,《大数据时代》不是最终答案,也不是标准答案,只是参考答案。
此外,在阅读此书之前还必须具备一些数据科学的基本知识和基本概念,比如说什么叫数据?什么叫大数据?数据分析与数据挖掘的区别,数字化与数据化有什么不同?读前做些功课读起来就比较好懂了。
大数据时代读后感
(三)我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。这个命题是我读这本书最大的感触。个人认为也是这本书最核心的思想。从头说起吧,首先,书提出一个颠覆我以前认知的命题--”并非原子而是信息才是一切的本源“,将世界看做信息,看做可以理解的数据的海洋,为我们提供了一个从未有过的审视下是的视角。它是一种可以渗透到所有生活领域的世界观。这个命题是在书的最后一部分中的某一段中描写的。我之所以把它放在最前面来讲,因为我觉得,这是谈数据化世界的前提,自然也是谈论大数据的前提啦。书的中间部分有一节讲到数据化和数字化的区别。经过我自己脑子的整理,把数据化世界这个命题列为大数据思维的第二步。写到这里,我不由得反省下,我是不是有领悟到书的精髓所在(我认为的精髓),就是第一句话。因为回顾我整个思路,还是按照旧模式的因果关系思考模式思考问题。书中另一个吸引我的地方就是,有很多观点的论述,会从哲学的高度论述。虽然,自己肚子没多少墨水,但是读这些描述的时候,就会发现自己会更好的理解作者提出的命题。比如书中有一段文字
当我们说人类是通过因果关系了解世界时,我们指的是我们再理解和解释世界各种现象时使用的两种基本方法:一种是通过快速、虚幻的因果关系,还有一种就是通过缓慢、有条不紊的因果关系。大数据会改变这两种基本方法在我们认识世界时所扮演的角色。
在附上一些事例的时候,用作者提供的”本质“去看待时,很容易理解,确实是这么回事。好了,那么大数据到底改变了我们什么呢,作者给出3点,大数据的精髓在于我们分析信息时的三个转变,这些转变讲改变我们理解和组建社会的方法。
第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样(样本=总体)
第二个转变就是,研究数据如此之多,以至于我们不再热衷于追求精确度
第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。大数据告诉我们”是什么“而不是”为什么“。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。,出处:短美文(),转载请保留本出处,否则追究其责任,谢谢你的支持,我们会给做得更好!
正如大家所知道的那样,人类的大脑具备这样的功能,它会把新输入的刺激或信息与”过去的经验或积累的部分知识“相对照,然后进行调整并接受下来。如果眼前新的现实与大脑中储存的固有信息无法协调,便会在无意识中拒绝接受新的现实(当作没有看见);或者通过自己一知半解的知识任意推测,使自己认识到的情况偏离实际(产生错觉)。这是人的一种本能,目的在于使自己保持冷静。
所以作者称之为revolution。
讲了这么多,那么大数据到底给我们带来什么。在这里,我只想谈我感触最深的,其他的有兴趣的可以自己去了解。当然,书中提了很多,最多的就是,XXX公司或者个人利用大数据创造了多大的财富了,抛开这些表面的不说,最让我动心亦或者是害怕的是---预测。这是大数据带来最核心的东西,动心的理由无须赘述,计算机会告诉你什么时候买什么双色球可以中头奖,想想心里是不是有一点小激动咧。当然这只是我打的一个比较夸张的比喻。至于害怕呢,书中有段话我很喜欢
公平正义的基础是人只有做了某事才需要对它负责,毕竟,想做而未做不是犯罪,社会关系于个人责任的基本信条是,人为其选择的行为承担责任。如果大数据分析完全准确,那么我们的未来会被精准的预测,因此在未来,我们不仅会失去选择的权利,而且会按照预测去行动。如果精准的预测成为现实的话,我们也就失去了自由意志,失去了自由选择的权利。既然我们别无选择,那么我们也就不需要承担责任。这不是很讽刺吗。
扯到这里,顺便扯一下,书中另一段关于自由意志的描述
在哲学界,关于因果关系是否存在的争论已经持续了几个世纪。毕竟,如果凡事皆有因果的话,那么我们就没有决定任何事的自由了。如果说我们做的每一个决定或者每一个想法都是其他事情的结果。而这个结果又是由其他原因导致的。以此循环往复,那么就不存在人的自由意志这一说了。——所有的生命轨迹都只是受因果关系的控制了。因此,对于因果关系在世间所扮演的角色,哲学家们争论不休,有时他们认为,这是与自由意志相对立。
书中举了个例子,举了部电影《少数派报告》,当我看到这里的时候,”哎哟,我居然看过这部电影,想想心里还是有点小激动“,有兴趣的可以去看下,大概就是讲警察通过预测来提前抓捕犯人,不过不是通过大数据,是通过超人类的方式。当你什么举动都可以被预测,相当于你完全暴露在太阳光下,换成你,你害怕不。
最后,附上两段结语,一段是书中的一段话,另一段是我自己瞎编的。
大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。
大数据终将会影响到我们,也像其他技术一样会是一把双刃剑,用得好,动心,滥用,害怕。如同核技术一样,用的话,造福地球,滥用,给个金刚石地球你,照样爆。我相信,未来的大数据的发展会如作者所说的,是一场生活、工作与思维的革命。
大数据变革读后感 大数据变革读后感
(一)
之所以读《大数据变革》这本书,是因为当时在京东上看到这本书的宣传是具备互联网思维必读书之一。说实话,看这本书根本看不进去,不晓得是因为翻译的原因还是什么,只能说标题吸引人,内容很空泛,没有什么的可读性。现把书中的一些内容做些摘录。
大数据是市场营销和销售的下一个前沿地带。在一个日益互联的世界,对数据勤于收集和有见地的分析使得公司可以前所未有地了解它们的消费者。用有形的统计知识武装后,现在它们也可以改进企业和产品,使其比以往任何时候都更加紧密地迎合消费者的需求。在这个产品差异化已经不再是一个可持续竞争优势的世界,了解消费者是必要的。一名天才创意的头脑根据对消费者的直觉设计广告促销已经是企业界早已逝去的回忆。今天的营销需要基于数据驱动洞察每个消费者偏好制定差异化定位。
随着中国公司和消费者的成熟,我们相信这种数据驱动的营销和销售方法将变得越来越意义重大。公司未来的成功将取决于中国消费者能被怎样了解、定位和说服。领先公司已经开始思考如何准备向这个数据时代过渡,即如何从以技术为主导的方法转为客户导向战略,使用数据带来业务增长。
大数据变革读后感
(二)
大数据正影响并挑战着所有行业的商业模式。数据毋庸置疑地将成为企业的关键战略资产,处理、分析与整合数据,是企业进行市场选择、产品设计与定价、市场营销,乃至内部管理流程的指导因素,对运营模式将带来革命性改变。
2014中国绿公司年会“改变的年代:现实与远见”于20日至22日在广西南宁举行。IBM全球副总裁王阳在“大数据”变革企业经营与管理圆桌论坛上表示,大数据变革着制造业、医疗业和教育行业。
以下为文字实录:
大数据是IBM整个公司的战略。IBM在IT领域当中走了一百多年了,看整个变化,今天到大数据,其实是意料之中的。IBM刚开始建公司的时候,就是因为美国的人口普查,要积累大量的数据,那时的人口普查跟现在还不一样,需要有机器各方面的东西,还是要很长时间进行统计的,今天完全不一样,就是因为要抓取数据,但是我们今天在讲到大数据的时候,不光从技术层面来讲这个问题,更重要的是从商业模式讲。
技术层面,讲了概念之后就知道大数据需要有一个平台,需要有一个数据的抓取,它有传输,分析、建模、优化等等,最后产生你的认知,这些东西都是在大数据这个平台上所必须具备的一些特性。这些特性使得大数据平台,跨行业,不管哪个行业都有这样的平台之后,可以互相之间交融。一个非常重要的概念,大数据应该把全世界的数据,在统一的平台上相互共享,(www.xiexiebang.com)这才会是真正体现整个人类的物理空间所发生的所有事情。讲这一点就要讲到商业模式的变化,三个行业会有很大的变化,其它行业依此类推。制造业,阿里巴巴讲到了电商这方面,他知道了很多数据,其实我们已经看到小米之类的,从C2B,我跟马云八年前讲了C2B,他当时说C2B是什么,他还没做小B2C,连商城还没做。但是C2B我认为是今天如果阿里淘宝往下走的核心战略,因为有大量的数据,他知道所有人的喜好,下一代的产品应该怎么开发,这些东西拿过来之后,对商家说我认为这就是下一代产品,小米就是这样做的,在制造方向,不管成本也好,商品特性也好,还是有多大的采购量,都是可以帮助你来做这个事情,手上拿着C这个利器,可以知道B怎么开发,我叫做有计划的市场经济,因为有大数据。
第二个是医疗行业,刘总在医疗行业做了很多,王总的公司用友在医疗行业方面也有很多ERP的实现。医疗行业,我认为将来走下去,很可能就颠覆了。为什么要有这么多三甲医院,为什么有不同种医院?其实就是病人和1.76复古传奇一个平台,和医生进行交互。如果全程控制,全程监护,为什么需要一年一次的体检,而不是时时刻刻的体检?每天运动量,吃了什么东西,包括像海尔智慧的冰箱里收集所有的信息,都可以知道一个人到底生活状况怎么样,不是一年一次的体检,而是全程的,包括周边的人,什么样的数据正在传播,包括DNA,家族的东西。为什么要进行尿液检查和粪便检查?家里的马桶上放上数据采集,每天都可以报道,知道血糖所有的东西,不管眼压,现在是不是在生气,是不是在发怒,心情调和不调和,所有这些东西只要放在一个平台上面,再加上很重要的是认知,大家要注意,现在美国正在发起一个非常重要的运动,或者在这方面做研究,就是人类大脑的研究,怎样认知?有了大量的数据在这个平台上之后,像大脑一样让机器操作,能够总结出这些东西,一个人或者几个人,没法接受再去分析这么大量的数据,而这个大量的数据实时产生,必须有机器自身,让我们大脑的机构放在这张网上,让它自己进行学习、判断。我们在IBM做的实验,不一定有很多人知道,沃森这个机器人,几年前下象棋,说起来已经二十年了,下象棋打败国际象棋大师,所有这些东西我们已经做过了,前几年是美国智力竞赛的冠军,今天人类的技术发展到什么样的程度?有大量的数据,医生是超级医生,已经通过了西医的证书,可以行医,中医未尝不可,医疗行业可能就有变化,都会变化。
第三个行业是教育行业,今天的大学要好好想一想自己将来的经营模式是什么,将来每个人的学习,并不是出生在哪一个农村,因为有什么样的师资情况,没有得到很好的教育,所以这一生没有机会,不是这样了,网上都有信息,每个人只要勤奋,都可以用手机或者什么进行学习,自己在不断成长,而且平台上有大量的数据沉淀,这个人知识掌握的程度,或者在哪一方面有什么专攻,王总讲到了大数据分析师,学习过程当中,这些人对数据是非常敏感的,对数据模式或者建模过程非常敏感,这些人才是做某些事情的时候可以连起来,让他帮助我们一块做。如果这样的话,将来的企业是什么样的?将来的企业就像海尔董事长说的一样,是无边界的,你可能是我们企业的员工,在这个平台上我知道你学习的整个过程,知识的整个过程,所以我可能在某时某刻利用你,所以将来的世界是非常美好的世界,大数据给我们带来非常美好的明天!
第五篇:大数据时代读后感
颠覆精确计算数据的浪潮
----评大数据时代的思维变革
吴凯
2015年9月,经李克强总理签批,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。《纲要》明确,推动大数据发展和应用,在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。
大数据这个词汇对于当下的新闻研究者并不陌生。是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。集合大量,高速,多样,价值四大要素。舍恩伯格的《大数据时代》给我们非常详细的,系统的,包涵无数经典范例的介绍了这种时下发展势头迅猛,未来前途不可限量的新型概念。
在舍恩伯格的大数据思想中,大数据的冲击力极强的,不仅仅仅限于单个部门或者行业。不单被利用于一个行业或者只被掌握于几家公司。在《大数据时代》中,舍恩伯格把其具体分为三个大的论点进行分别论述,则是:
1大数据时代所带来的思维变革 2大数据时代所带来的商业变革 3大数据时代所带来的管理变革
本文主要评论的主体是舍恩伯格的理论的第一部分。则是大数据时代所带来的思维变革。在这个方面。舍恩伯格非常明确的指出,大数据时代下,人们需要的是利用所有的数据,而不是仅仅的依靠一部分数据。笔者认为,在很长的一段时间内,人们对数据的准确程度已经到了一种近乎苛刻的程度。对于舍恩伯格的观点。这是一种截然相反的挑战。挑战的数十年,乃至数百年的人对准确的要求。他在著作中提到,我们应该试着习惯不是确凿的准确无疑,而是庞大而又冗杂的数据中寻找到其中的规律。接下来笔者按照书中所分章节进行逐一的分析。
1更多
舍恩伯格说:当数据处理技术已经发生了翻天覆地的变化时,在大数据时代进行抽样分析就像在汽车时代骑马一样。作者非常形象的表明了在当代数据爆炸时代下,对庞大数据进行传统的抽样调查的结果已经变得不在可信,我们需要的结果,或许能从全部的数据中获得,并且更为准确。在过去,样本的整体数量不算非常的庞大,样本的随机性较小,选择的随机性比样本数量更重要,随之而来的便是非常有效的随机抽样调查方法。现如今,数据的日益增长使得该方法的绝对随机性变的包涵风险。许多学者,公司便专向研究是否能够把所有的数据进行整体的分析,显然结果是令人满意。或许在时间上,人力物力上花费了更多,但是事实证明这种调查方法在大数据时代下显得更为准确和有效。文中举出例子,苹果公司的前总裁斯蒂芬乔布斯在自身与癌症病魔抗争的过程中采用了一种不同的方法,成为了世界上第一个对自身所有DNA和肿瘤DNA进行排序的人,为此他支付了高达几十万美元的费用,而他得到的,是包括全部的庞大基因密码数据。并且,乔布斯利用这庞大的基因数据让医生通过特定的DNA进行用药,为此乔布斯开玩笑:我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人。虽然他的愿望未曾实现,但是,通过这种对人的全部基因进行大量分析,“私人订制”的医疗已经成为未来的一种新型医疗模式。而且这种方式的确有效的帮助他生命延长了许多年。
这非常引人深思,当研究对象从样本变成总体是,随之而来直观的是更多次的复杂的排列和计算,更长的工作时间,可是当在研究全部数据出现的大致趋势和结果,往往更加的趋于稳定,更大的杜绝了样本调查所谓的随机性。在笔者看来,在很长一段时间内,随机采样的确是非常好的办法,他在数据爆炸前的数据处理变的方便快捷,可当在技术支持的情况下。我们为何不选择更好的,更整体性,更准确的全面数据分析。所以,大数据的分析,总体代替样本是大势所趋。
2更杂
舍恩伯格在第二方面阐述了在大数据时代,既然要处理和接受全部的数据,那么,也必须接受海量数据内的不确定,和复杂。只有接受不确定性,我们才能打开从未涉足过的世界的窗户。
在作者的观点里,大数据通常用概论说话,而不是确凿无疑,整个社会习惯新思维需要非常长的时间。2006年谷歌开始涉足机器翻译,现如今收到了一致的好评,在翻译的正确性和流畅性上远远高于其他翻译软件,他的秘诀就在于谷歌吸收了网络上所有的翻译,他既能从各色各样的语言网站上寻找对译文件,同时寻找联合国,欧盟等国际组织的报告及文件,甚至是其余的速度书籍的语言,面对如此混乱的输入源,较其他的翻译系统而言,谷歌通过多输入源,扩大了自己的翻译来源,虽然许多的小网站的用语甚至是出现了错误的,但是在大量的数据的支持下,他做的的确比其他的系统要更加的出色。这个例子充分的说明了,在当今的时代,保持源头的单一,精确,不是提高系统质量的唯一途径,相反,你收集的越多,你的系统完善程度是更好的。当然,错误是不可避免的,但是利大于弊。从某种方面来说,多和杂,在现在的,即将变成主流。笔者在阅读中发现谷歌的例子充分的证明了舍恩伯格的远见,在一方面,这是一种退步,从百分之百的精确变成了百分之九十的正确。但是结果是好的。这就是大数据时代要求我们做的:重新审视精确性的优劣。
而在另一个方面,不精确是我们需要的,是节约时间和成本的正确选择,谷歌的邮箱会确切的标注很短时间收到的短信,比如“十一分钟之前”而当对方收到信息已经有一段时间了,则他会标注为“两个小时前,”或者是:“三天前”。则也是足够说明,精确或许真的有时候并不重要。
当然大数据的悄然流行,需要的是新的数据库的建立,是与之前无法想象的巨大的数据的储存。而作者也明确表示,大数据的数据库,并不是需要无线的空间,他就存在于多个地点,多个硬盘中,他们互不干涉,却相互联系,同时利用这互联网连接,同时更新,同时的获取着最新的数据。Hadoop就是最好的例子。Hadoop是以开源式的分布系统的基础架构,相比巨大的空间,巨大的硬盘,这显然更便捷,当他与VISA合作时,却能够将处理两年内730亿单交易的时间,从一个月缩减为1分钟,也许Hadoop不适合逻辑的记账,当时当允许少量错误的时候,他就是如此的给力。
言归至此,笔者非常同意作者的说提议,当代数字社会要求我们必须接搜混乱和不确定性,不在纠结百分之百的准确,在另一方面,这种改变,是我们在新数据时代成功的基础。
3更好
在第三个观点上,我非常不认同舍恩伯格所说的一句话:知道是什么就够,没必要知道为什么.。作者在这一方面思维个人认为有存在绝对化,作者认为,当今时代,我们不需要非得知道现象背后的原因,而是让数据自己发声音。美国的知名的亚马逊网站的推荐系统往往能够在不知道用户的任何嗜好的情况下,准确的(大致)的推算出用户可能喜欢的,或者有一元购买的,并放置在用户的推荐栏内。或许这可以说明问题。亚马逊在茫茫多的用户购买记录下,充分利用并推导了用户可能或者喜欢购买的东西。
“推荐信息往往与你以前购买的物品存在细微的关系,并且循环往复”亚马逊的詹姆斯马库斯是这样说的。
这也充分的说明了一点,我们并不需要知道他到底真心喜欢什么,我们只是在寻找着和他购买物的相关关系,便推测出了他的潜在交易。单纯的相关性,而非非常实在的因果关系。
简单来说,亚马逊并不需要知道你为什么要买这样多系。他也不知道你买这件商品的原因,他只是单纯的从你买了另一件商品从而推测出你或许需要这样的商品。当然错误是存在的,在上个观点中就已经提到了,但是在绝大多数的成功下,少数的失败是必须的。也是客观存在的。
所以,舍恩伯格大胆的提出,大数据的分析的核心就是建立在相关关系分析法基础上的预测。
也许我们谁也不知道,沃尔玛为何在飓风期间把蛋挞和飓风用品摆在一起售卖,但是可以肯定的是,效果良好。
神恩伯格告诉我们的,不要太过于的在乎为什么,只需要知道是什么,也许你就能获得成功。
总结:
综上所述,舍恩伯格所展现的大数据时代下的观念是与现代理念有一定的区别和歧义的,在一些方面甚至我们真的无法一下子就接受。让人放弃数十年甚至数百年以来对正确,对精确的执着是非常困难的。这同时也需要时间去改变。个人认为作者利用非常生动的例子说明时代的悄然改变,同时也利用不同的方法潜移默化的改变读者的思维。让读者能够理解,承认大数据时代的变化。观念的变化是正确的。这一方面足以体现作者学识的渊博,另一方面也体现着当代社会的人思想固化,改变不在一朝一夕。
面对新时代的思潮,非逆之者亡,我想,更多应该是未知者亡吧。。。