第一篇:读《与大数据同行》有感
当教育遇上大数据
——读《与大数据同行》有感
张俊强
“和书籍在一起,永远不会叹气。”
——罗曼·罗兰
暑假,没有上班时的忙碌,一杯凤凰茶、一卷书,在温馨的家里,一家人围坐在一起安静地阅读,是我最惬意的时光。
我所读的书里面,令我感触最深的是《与大数据同行:学习和教育的未来》,这本书是维克托·迈尔-舍恩斜伯格与肯尼思·库克耶关于大数据的第二部专著,赵中建教授翻译,华东师范大学出版社出版。
“大数据”一词我们并不陌生,电商通过大数据分析用户的爱好需求进行定向精准推广;深圳交警局利用大数据进行城市交通管理,将市区拥堵时间缩短;我们外出叫个网约车,出行的轨迹便会被大数据所掌握;“今日头条”会根据我们的阅读喜好,智能化推送相关文章……在互联网时代,大数据的应用正在影响着我们生活的方方面面。做为教师,我更关心的是当教育遇上大数据,如何在教育方面将大数据的价值最大化?
本书指出,大数据正在进入教育的方方面面,数据在教育中有着非凡效果,带来截然不同的教学形式;作者还提出大数据重塑学习的三个主要特征:反馈、个性化和概率预测。
北师大肖川教授在《成为有智慧的教师》一书中写到: “教学是人类诸多复杂、重要的事务之一。”做为数学教师,在教学中,我关注的是:学生的学情,基础是什么?课堂上老师讲的内容掌握了没有?我们的教学方式可不可行?怎样让每个学生都得到发展?哪些内容关乎学生的未来?……大数据重塑学习的三个主要特征:反馈、个性化和概率预测,很好地回答了这些问题。
一、反馈的及时和有效
在互联网时代,在线购物已经成为我们生活的一部分。从购物体验来看,在线购物,消费者看到的是图片和文字,不能像实体店那种质量好与不好都看得到,摸得到,因此,人们通常都会去好评率高的商家消费。这就促使商家都非常重视消费者的反馈。同样,教学也非常重视反馈。教师的教学如果没有反馈或者没有及时、正确的反馈,教师就不能及时修正和调整自己的教学行为,这样的教学就没有针对性,是低效的。
传统的教学反馈包括:1.学生课堂回答、当堂的练习;2.家庭作业;3.单元测试。我们从反馈中了解学生的掌握程度,从而调整教学进度、教学方法。在《大数据》这本书里,作者将上面这些反馈方法称为“小数据”,维克托·迈尔-舍恩斜伯格与肯尼思·库克耶认为这种教育反馈系统存在很大的缺陷:
1.不能保证收集的信息是正确的,即便是,收集的数量远远不足,而且收集的数据也没有得到有效地使用。
作者的观点我是认同的,因为我有亲身体会:在讲授新课之前,我希望了解学生的学情,比如,哪些知识是学生通过自学就可以掌握?哪些知识对学生来说属于难点,需要做重点探究?过去,我的做法是通过布置预习作业,学生完成学案,我再通过对学案的分析,掌握学生的学情,修正自己的教学策略。这种“先学后教,以学定教”的做法,似乎还不错,不但关注学生的学习起点,而且符合新课改的精神,但是,在实际操作过程当中,实际效果往往不尽如人意。前一天晚上布置的预习作业,第二天就要上新课,由于教学进度的要求,往往没有办法及时对每位同学的学案进行批改和分析,来不及修改自己的教学方案。
现在有了信息技术的支持,可以改变这种情况。我可以通过QQ家校群布置微课视频,在上课前一天让学生观看视频预习新课,学生观看微课视频之后,完成并提交相应的在线微课作业,系统自动批改并显示每题的正确率。这样,我提前就可以掌握学情,调整第二天的教学策略,做到有的放矢,这样的课堂就很有针对性了。
2.反馈是单向的,指向的都是学生。几乎所有的反馈都是针对学生的学习行为和学习结果。反馈主要关注学生掌握知识和技能的程度,而且关注共性问题为主。这种反馈很少是关于教师的,针对的是学习的结果,而不是学习的过程。
在学校里,科任教师只要能把班级考试成绩提升上去,班主任在常规评比中拿到标兵班或者流动红旗,通常就被认为是好老师、好班主任。不管学生的成绩是因为教师高效课堂或通过题海战术而取得的,关注的是结果而不是过程,关注的是学生的现状而不是未来的发展。
大数据应能改变这一现状。在课室中使用电子教科书、在线教学平台,我们可以收集到过去无法获取的学习数据,并用于学习过程的处理,在改变传统教育反馈中的即时性和单向性方面发挥重要的作用。
二、如何落实个性化教育
最早提出个性化教育的理念和思想应该是我国的圣贤先师孔夫子,夫子在两千多年前就已经提出“因材施教,有教无类”的教育思想。我们都承认学生之间的差异是存在的,但是传统的班级授课自捷克教育家夸美纽斯把它确定下来之后基本不变:班级授课制就是由一位教师根据教学计划中统一规定的课程内容对几十位学生教学。这种传统课堂教学模式只管“齐步走”,不注重学生的个性化发展。新的《数学课程标准》指出:“教师要根据学生的具体情况,有创造地设计教学过程,要正确认识学生的个体差异,因材施教,使每个学生都在原有的基础上得到发展。”这说明,我国高度重视个性化教育。
本书指出,“大多数学校的教育,在其设计之初考虑的都是处于平均水平的学生,这种做法会同时损害位于正态分布曲线两侧的学生,会使领悟力高的学生感到厌烦(甚至引发纪律问题),而领悟力低的学生会学得非常吃力。”
个性化教学的先行者——可汉学院的创始人萨尔曼·可汉指出:我们需要的是“一个尺寸适合一个人”的方式,打破“一个尺寸适合所有人”的同质性,从而使学习优化成为可能。
大数据的发展和应用,使我们可以对学生的学习信息的数据进行收集、分析和反馈、整理和分析。事实上,现在有部分APP已经在尝试做这种事情。“一起作业”、“作业盒子”是我非常喜欢的两个APP。这些APP运用大数据,根据学生一个学期以来的作业反馈数据,自动生成最适合每个学生的个性化暑假作业。借助强大的数据分析系统,大规模个性化学习就能得以实现。这个暑假,我就为上学期本人任教的学生布置了数学暑假个性化的作业。
三、精准概率预测的可能性
某同学被目标大学录取的概率是多少?班级教师怎么搭配最佳?哪些教师更适合哪个年级?哪些教师适合当班主任?家长可能会向我们咨询:孩子注意力不集中,是多动症还是单纯的注意力缺乏?学生成绩不理想的原因是什么?家长应该怎么辅导孩子的学习?……
在做这些教育决策时,我们往往根据经验来判断,未必能够给予正确的指导。随着大数据预测在精确度和细节的提高,我们可以提出更加具体和细致的建议,采取更具针对性措施。比方说,我们与其要求孩子整个暑期补课,不如有针对性的补习代数两个星期,更有利于学生整体水平的提升。
“大数据正在进入教育的方方面面,并将对这个世界的学习产生深远的影响。大数据能告诉我们什么是最有效率的,并且揭示那些过去无从发现的谜题。”教育遇上大数据,这是一场美好相遇,我们都应该做好准备,迎接大数据时代来临,成为有“数据”的教师。
END
第二篇:读《与大数据同行》心得体会
读《与大数据同行》心得体会
黄许博爱小学 黄道清
读完《大数据》,我才意识到这并不是一本枯燥无味的书籍。作者运用案例和讲故事的方式,把美国数据开放、收集、使用背后的立法故事、公民故事、技术故事、商业故事娓娓
道来,引人入胜,令我大开眼界。
大数据概念对于教育来说会产生什么样的实用价值呢?一直以来,中国教育在研究教育的数字化,比如数字化校园,这个思路就是把我们教育的内容进行数字化,其结果指向的就是电子教材的研发或者是教学过程的数字化。美其名曰,这是教育技术的重要内涵。
在教学过程中,学生的行为表现都可以被数据化,而这项研究不是任何一个专业可以深入下去的,它的专业性太强,所以我才会想到,所谓教育技术与其研究教育的数字化,不如研究教育的数据化来得实在,来的有意义。长期以来,我们并不了解教育对一个人的影响具体会如何表现,我们有的只是一个轮廓,我们也并不确定一个教师的行为对学生具体产生了哪些影响。所以,人们对教育一直有一个深深的质疑,它是不是科学的?大数据概念至少提出了关注“是什么”比“为什么”要有实际意义得多。而我们的教育恰好需要把注意力从“为什么”转移到“是什么”上面来,只有如此,才能把教育从为什么发展成“可能成为什么”上来,这会是一次思想上的革命。而对于现在地位岌岌可危的教育技术来说,把研究的重点从数字化转移到数据化上面,这才是它的出路。
如何将数据融入教学,教育者首先通过标准化全科教学处方,实现了教师授课模板和教学内容的标准化,保证每个教学过程和内容是可控的,然后结合每天的教学内容,处理好面对的数据,处理好数据,自然也就处理好了课堂的反馈,最终形成了既注重教学体验又以教学结果为导向的教学体系。
与此同时,不仅要注重课上的学生资源,在课后还要对这些资源进行跟踪处理。这与过去的教育教学显然是不同的,面对大数据时代的到来,教学有所改变是必然的。所以,无论
环境怎么变换,数据如何复杂,我们都不能不去改变自己的教学去迎合将来的这个大数据时代。
第三篇:读《大数据时代》有感
数据的故事
——读《大数据时代》有感
信息时代的到来,我们感受到的是技术变化日新月异,随之而来的是生活方式的转变„„我们这样评论着的信息时代已经变为曾经。如今,大数据时代成为炙手可热的话题。笔者在这说明信息和数据,只是试图首先说明信息、数据的关系和不同,也试图说明,为什么信息时代转变为了大数据时代?大数据时代带给了我们什么?
信息和数据的定义。维基百科解释:信息,又称资讯,是一个高度概括抽象概念,是一个发展中的动态范畴,是进行互相交换的内容和名称,信息的界定没有统一的定义,但是信息具备客观、动态、传递、共享、经济等特性却是大家的共识。数据:或称资料,指描述事物的符号记录,是可定义为意义的实体,它涉及到事物的存在形式。它是关于事件之一组离散且客观的事实描述,是构成信息和知识的原始材料。数据可分为模拟数据和数字数据两大类。数据指计算机加工的“原料”,如图形、声音、文字、数、字符和符号等。从定义看来,数据是原始的处女地,需要耕耘。信息则是已经处理过的可以传播的资讯。信息时代依赖于数据的爆发,只是当数据爆发到无法驾驭的状态,大数据时代应运而生。这是否是《大数据时代》一书所未曾阐述的背景材料?
在《大数据时代》一书中,大数据时代与小数据时代的区别:
1、思维惯例。大数据时代区别与转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。作者语言绝对,却反思其本质区别。数据的更多、更杂,导致应用主意只能尽量观察,而不是倾其所有进行推理?这也是明智之举
2、使用用途。小数据停留在说明过去,大数据用驱动过去来预测未来。笔者认为数据的用途意在何为,与数据本身无关,而与数据的解读者有关,而相关关系更有利于预测未来。
3、结构。大数据更多的体现在海量非结构化数据本身与处理方法的整合。大数据更像是理论与现实齐头并进,理论来创立处理非结构化数据的方法,处理结果与未来进行验证。
4、分析基础。大数据是在互联网背景下数据从量变到质变的过程。笔者认为,小数据时代也即是信息时代,是大数据时代的前提,大数据时代是升华和进化,本质是相辅相成,而并非相离互斥。数据未来的故事。数据的发展,给我们带来什么预期和启示?银行业天然有大数据的潜质。客户数据、交易数据、管理数据等海量数据不断增长,海量机遇和挑战也随之而来,适应变革,适者生存。我们可以有更广阔的业务发展空间、可以有更精准的决策判断能力、可以有更优秀的经营管理能力„„可以这些都基于数据的收集、整理、驾驭、分析能力,基于脱颖而出的创新思维和执行。因此,建设“数据仓库”,培养“数据思维”,养成“数据治理”,创造“数据融合”,实现“数据应用”才能拥抱“大数据”时代,从数据中攫取价值,笑看风云变换,稳健赢取未来。
冯凯旋
第四篇:读大数据时代有感
读《大数据时代》有感
15级会计ACCA 班 201526909019 李佳凌
《大数据时代》是国外大数据研究的先河之作,该书作者维克托•迈尔•舍恩伯格被誉为‚大数据商业应用第一人‛,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历。读完这本书后我有着非常深的感悟。
维克托•迈尔•舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。维克托•迈尔•舍恩伯格最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道‚是什么‛,而不需要知道‚为什么‛。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。如今,数据已经成为一种商业资本,一项重要的经济投入,可以创造新的经济利益。
大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法。第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。寻找因果关系是人类长久以来的习惯。即使确定因果关系很困难而且用途不大,人类还是习惯性地寻找缘由。相反,在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系,这会给我们提供非常新颖且有价值的观点。相关关系也许不能准确地告知我们某件事情为何会发生,但是它会提醒我们这件事情正在发生。
大数据的相关关系分析法更准确、更快,而且不易受偏见的影响。建立在相关关系分析法基础上的预测是大数据的核心。一个东西要出故障,不会是瞬间的,而是慢慢地出问题的。通过收集所有的数据,我们可以预先捕捉到事物要出故障的信号,比方说发动机的嗡嗡声、引擎过热都说明它们可能要出故障了。系统把这些异常情况与正常情况进行对比,就会知道什么地方出了毛病。通过尽早地发现异常,系统可以提醒我们在故障之前更换零件或者修复问题。通过找出一个关联物并监控它,我们就能预测未来
随着网络技术的发展成熟,传统行业不断感受到来自大数据、云计算等新技术的冲击,这些新技术意味着游戏规则的改变,大数据技术对各行各业的发展的影响尤为显著。人们对大数据的探讨越来越深入,兴趣也越来浓厚。
舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。在第一部分‚大数据时代的思维变革‛中,舍恩伯格旗帜鲜明的亮出他的三个观点:
一、更多:不是随机样本,而是全体数据;
二、更杂:不是精确性,而是混杂性;
三、更好:不是因果关系,而是相关关系。
维基百科说大数据由巨型数据集组成,这些数据集大小常超出常用软件在可接受时间下的收集、运用、管理和处理能力,或称巨量数据、海量数据、大资料,大数据的常见特点是3V:Volume、Velocity、Variety。但是通过阅读,我了解到规模巨大的数据未必就是大数据。比如伯努利实验,随着实验次数的无限增加,频率将趋近去概率,但这只能说是统计学或者是概率学,而不是大数据。将这一概率引入金融学、天文学、地理学等等领域,进而进行关联研究,但是传统的分析方法的时间是不允许这样做的,这需要搞笑计算资源与能力,将处理结果迅速呈现出来。
大数据并不是指数据本身,而是一种思维方式。
‚大数据不是要教机器像人一样思考。相反,把数学算法运用到海量的数据上来预期事情发生的可能性。‛大数据令人着迷之处还在于,它正在尝试着引导人们用科学的办法对‚预测‛挑战。作者引用了安德森的观点‚现在已经是一个有海量数据的时代,应用数学已经取代了其他的所有学科工具,而且只要数据足够,就能说明问题‛。
大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。而要为商业所用,第一从原始数据采集、数据清洗整合到构建模型分析、形成可显示化结果,整个流程必须连贯起来;第二,大数据产业化,技术成熟。
而国内目前的情况是,传统企业的流程分割化现象严重,就数据采集方面来说,因内部是各个孤立的系统而产生信息孤岛现象,又或者是数据采集过于片面。
所以传统行业能够运用大数据技术创造更大的商业价值的前提是实现信息化、数字化,并且要有新的思维,不论是公司高层还是底层(这就涉及到第三部分——管理变革)。此外,大叔级技术在国内的发展不能说顺利。首先国内的大数据技术缺乏数据准备阶段,这就使得发展大数据成为空话或者是说只是一种概念炒作,对比国外,没有媒体刻意推进和炒作,只是在脚踏实地地研究,这样出来的技术才可能是完美的成熟的。
要发展好大数据,要利用大数据创造的价值,就要改变管理的思维方式,变革管理模式。运用大数据的企业要改变,研究开发大数据的企业也要改变。
维克托〃尔耶〃舍恩伯格在《大数据时代:生活、工作与思维的大变革》中最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道‚是什么‛,而不需要知道‚为什么‛。这颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。对于大数据(Big Data)的应用,并不是他不想证明因果关系,而是并不能证明因果关系。由于大数据的收集方法和分析方法,在于把所有能收集的数据都收集,再集中分析,这种研究方法是缺乏时效性(temporality)的,所以,他并不能证明因果关系,只可以说明两者的相关关系。
可是,对于事物发展的预测,有时,影响因素成千上万,解释的理论更加是多如牛毛。大数据改造了我们的生活,它能优化、提高、高效化并最终捕捉住利益,那直觉、信仰、不确定性和创意还能扮演什么角色呢?就算大数据无法教会我们所有事情,只要能帮助我们表现更佳、更富效率、取得进步,就算缺乏深入理解也是很有用的了。一贯如是地坚持下去才有效力。即使你不明白为什么付出的努力得不到回报,但相比不努力,你要明白你已经在改善事情的结局了。
有时候,当我们掌握了大量新型数据时,精确性就不那么重要了,我们同样可以掌握事情的发展趋势。大数据不仅让我们不再期待精确性,也让我们无法实现精确性。然而,除了一开始会与我们的直觉相矛盾之外,接受数据的不精确和不完美,我们反而能够更好地进行预测,也能够更好地理解这个世界。
大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。
以上就是我的一些感悟,在大数据时代的背景下,我们应该看到其更深层次的东西,抓住机遇迎接挑战,不断进步。摘录部分:
下面摘录一部分我在知乎上看到的关于《大数据时代》的讨论,网友提出的质疑同样值得我们深思。
作者:AndyHsu来源:知乎
链接:https://www.xiexiebang.com/question/20666694/answer/18153613 花了三天的零碎时间大致看完了舍恩伯格的《大数据时代:生活、工作、思维的大变革》。我看推荐说这是‚迄今为止最好的一本大数据专著‛。目前公司在搞Hadoop、大数据应用,外面各类零碎的资料也非常多,那么想我应该去看一下这‚最好‛的专著吧。
一、主要观点上可以探讨的地方
作者提出了关于大数据的‚掷地有声‛的三个原则。这三个原则凡讲大数据必被提及,很多人奉为圭臬。但是我觉得每一点都值得探讨。这三点分别是:不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。
看完之后感觉都有点不是那么回事。1.不是随机样本,而是全体数据
这个说得好像人类从来就不知道使用全体数据可以得到更全面的结论,而非要去煞费苦心发展出一套抽样技术一样。人类早就知道处理全量数据的好处,而之所以要进行抽样分析,原因不外乎两点:一是处理能力跟不上,二是数据收集能力跟不上。作者认为人类之前主要受限于数据的处理能力而不去处理全量数据,但在目前机器处理能力有了巨大的提升的时代,限制绝大多数应用的瓶颈不是计算能力而是数据采集能力(不要去提那些极少数需要超级计算机的场合,那个和多数人无关、和本书的商业主题也无关)。但是即便如此,抽样所要针对的很多应用场景是不太可能收集全量数据的情况。比如人口普查,无论计算机力量如何强大,当前很多数据还是要人工去收集,所以这个普查还是要用抽样的方式。有意思的是,作者用人口普查是抽样分析来说明非‚全量‛时代我们被迫采用了抽样,而最终也没法说我们是否已经可以用全量数据来做人口普查了。实际上至少在目前,对于人口普查,抽样还是必然的选择(嗯,你可以设想,以后人人都装一块芯片,你可以在你的PPT里讲给你的客户和老板听)。再比如我们统计里的经典问题:怎么估算一批零件的使用寿命?怎么去分析一批奶品里的三聚氰胺?以前我们不可能去做全量测试,因为这意味着这批零件就废了,这批奶也全部用于测试了,这样测出结果也没啥意义了(嗯,你也可以说:我我们去收集历史上所有此类零件的使用情况来进行分析吧.....嗯,加油吧,雄心勃勃的骚年)。现在 ?我们还是必须依赖抽样,是必须。
即便不提这些例子,仅从逻辑而言:收集、处理数据的行为本身也在不断产生着新的数据。我们又怎么证明这些数据不是你需要的‚全量‛的一部分呢?
作者的行文中,关于什么是‚全量‛,处于不断的摇摆之中。有时指‚我们需要的所有数据‛,有时指‚我们能收集到的所有数据‛。作者举了人口普查的例子,这个全量显然指前者。而在很多商业案例中,又显然指后者。我们有能力处理越来越多的、在以前不敢想象的大量数据,但是至少目前看,我们还没可能说我们处理了‚全量‛。我们最多可以说我们能处理我们能搜集到的‚全量‛,但如果据此产生了我们已经没有遗漏数据了的感觉,认为所有数据尽在掌握了,那我认为是一种很可能导致错误的错觉。
2.不是精确性,而是混杂性
这个么,说得好像以前的人类在使用‚抽样‛数据时竟然都认为取到的数据是‚精确‛的一样。在使用抽样数据的时候,我们就知道要容忍一定的误差。我们甚至知道在就算取得了‚全样‛数据的时候,也可能因为有各种原因而导致的不精确,统计实践中对此有相当多的案例。人类从未奢望过我们通过数据分析取得的多数结论是精确的。我们从来都要在信息混杂的情况下做出大多数的决策。
3.不是因果关系,而是相关关系
这是很多人(包括作者)认为最有价值、最重大的发现,而实际上却也是最收到批评的一个观点。连译者周涛教授在序言里都表示看不下去了,他至于认为如果放弃对因果关系的分析,是人类的堕落。我不说这么高的哲学层面,只从逻辑和技术上讨论一下。
计算机能够提供给我们的结论(到目前为止以及在可见的未来),都是相关性。计算机从未提供过明确的因果关系给人类。是否因果关系,是人类在数据基础上,进行的人为判断。一直有相当多的应用,也是只考虑相关性,不考虑因果关系的:确定因果关系,是需要更大的精力、更多的投入的。所以只看相关性而不看因果性也不是什么新的结论(实际上已经是个很旧的结论了)。而这个相关性是不是可以作为决策的基础呢?这个一样离不开人的判断。有一个这样的故事:通过大量的数据分析,慈善组织得出结论:一个国家、地区的电视机的普及率与发达富裕程度很有关系(冰箱、洗衣机、空调、高跟鞋、牛仔裤,etc.,也会和发达程度有这样的相关性),于是他们就向贫困国家赠送了很多电视,认为此举可以促进该国的经济发展。你可以鬼扯电视的普及与经济文化的密切相关,但是实际上最终发现更可能是经济发展导致了电视的普及,而不是反过来。所以,我们真的不需要因果分析吗?说得玩笑一点:这个世界真的不需要脑子了吗?
作者举了一个例子:谷歌分析搜索关键字来确定哪里可能发生了流行病。认为这就是利用了相关性而不是因果性。这是没有利用因果判断吗?现在在投入巨大的机器资源进行分析之前,分析师已经预计了得病的症状可能会导致人们去网上进行相关搜索(影响了搜索行为)。谷歌存储的用户上网信息肯定远远不止一个搜索关键字,分析师为何不开足马力把‚全量‛数据、各个指标都分析一遍呢?比如用户上网地点?上网时间?上网频率?上网语言?浏览器版本?客户端操作系统?etc...为何会像导弹一样精确地将机器资源投放到了关键字上呢?
总之,对于这些原则,作者为了显出新意,说得过于绝对。而排除掉绝对的成分后,这些观点也就不显得是创新了。作者把三个数据分析人员一直秉持的原则,当做全新的东西讲了出来。时代在变化,我们或许应该经常重新审视这些原则,来确认自己的思想是不是僵化了、是不是过时了。我赞同作者重新审视这些看法,但是我觉得没必要讲得这么极端。
二、细节论据上可以探讨的地方
除了三个大原则不足以令人完全信服,在一些细节上,作者的引证也不是很严谨。
如第51页,对于拼写检查的算法的优化。作者提到,通过输入大量的数据,4种常见语法检查算法的准确率提高了很多,以此说明大数据发挥了作用。这确实是个很有启发性的例子,可以去做更深入的分析和研究,但是.....仅仅4个例子,够得出很有力的结论吗?4个算法,作者没注意到这是一个非常小的样本吗?不能因为这是4个用了大数据的采样,就认为这是一个支持大数据的有力结论了吧。(顺便我很想问问他们:为什么不测试个几十上百的算法呢?是不是面对如此‚大量‛的计算,也只好折中选择了一个抽样的小样本呢?甚至连样本数量是否合格都顾不上了吗?)
三、这本书有什么用处?
对于这样的一本书,我不明白周涛教授在译序里为什么要建议大家(以后)每个版本都应该买一本。为什么要买?难道作者理清自己脑子的过程很值得我们关注吗?
译序里说:‚作者渴求立言立说的野心‛,但是我恐怕作者是达不到这个目标的。关于作者的简介为:‚《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托〃迈尔〃舍恩伯格被誉为‘大数据商业应用第一人’,....早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。‛
总体感觉是作者有很多想法,见识过很多案例(这些案例都丰富地体现在书中了,也很有参考价值)。但并非是一个曾经和数据真正绞尽脑汁搏斗过的人(这是我瞎猜的,没有考证过他的经历。考据者请不要告诉他做过什么咨询案例,这离真正体会数据的折磨还很远。)。
第183页说道:‚...执行官们信任自己的直觉,所以由着它做决定。但是,随着管理决策越来越受预测性分析和大数据分析的影响和控制,依靠直觉做决定的情况将会被彻底改变。..."真的会么?如果你面对某一家企业做咨询,那可以这样讲。一种新技术的采用很有可能大幅提升企业的战斗力,并超越竞争对手。但是作者是期望对行业立言的人,面对整个社会我们这样讲就不严谨了。引用一个例子:中国棋院的一次训练会后,总教头马晓春对隔天要去各自的母队参加围甲的棋手们说:祝大家周末取胜。棋手们笑了:我们只有一半的人能赢啊。同样,如果大家都采用了大数据技术,那么也总有企业要在竞争中落于下风。而既然我们实际上无法真正分析‚全量‛数据,那CEO们还是会有很大的决策空间,哪怕很多决策实际上‚不科学‛。最起码,他们需要决定将有限的企业资源投入到对什么样的大数据进行分析,并如何应用分析出来的结果。嗯....我认为,这多少还是要依赖一些直觉的。
那么大家是否应该看一下这本书呢?我的答案是应该看一看。既然大数据是当前的潮流、相关的研究/商务活动层出不穷,那么做IT工作、数据工作的人对于‚最好的‛专著无论如何都必须看一下。书中集中展示了很多案例,值得作为参考和启发思维。此外,为了作为谈资、为了在写大数据PPT时有所依据,大家也得看看这本书。根据场合不同,可以对里面的内容复制粘贴、理解重写。这些内容,我相信买一版也就够了。需要提醒PPT人员的是,演示前请想清楚如何回答可能被提及的质疑。如果你对这本书的观点都深信不疑,那么你将会遇到很多的质疑。
第五篇:读《大数据》时代有感
大数据时代——信息技术进行时
——读《大数据时代》有感
2012年,出现在金融界人士、IT人士、甚至政界人士耳中最多的词毫无疑问就是“大数据”,当今社会,每天所产生的数据量是十分惊人的,各行各业都在产生庞大的数据,金融、医疗、教育、政府、商业等等,每天所产生数据总量已经不能用PB来计算,而是以EB、ZB为单位(1ZB=1024EB=1024×1024PB=1024×1024×1024TB=1024×1024×1024×1024GB)来计算,这个数据量是惊人的,但是对于人类来说,具有极其重要的意义。哲学里说,量变产生质变,当这个数据大到一定的程度时,必将对人类社会产生巨大的影响。被誉为“大数据商业应用第一人”的英国人维克托·迈尔·舍恩伯格所著的《大数据时代》前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。这本书带给我的绝对是一种震撼!比如,关于思维变革,书中认为,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。
大数据时代的到来,将不可能化为可能,比如阿里巴巴,依赖淘
宝等购物网站所产生的庞大数据,准确预测未来商场趋势,比如美国大选,依赖大数据准确预测最终结果。大数据已经可以预见未来。
08年提出了云计算的概念,并在今年产生了丰富的应用;12年提出了大数据的概念,并迅速在12年年底产生了实质性的价值,信息技术之变化,快得令人咋舌。然而,作为传承文化精髓的教师,对于信息技术又有多少研究呢?win8已经出现在各种终端上,但是有很多老师仍然沉醉于叉p;office2013也出来了,但我们绝大多数老师仍然只会用office2003。许多老师嘴上说要与时俱进,但事实上,人类的惰性在他们身上体现得格外明显。
再来说说云计算,其核心理念便是云存储和云共享,2012年体现得格外明显。且不说国外大公司推出的云服务,如微软的skydrive,仅仅在国内,就有许多大公司推出了各种云服务,金山快盘、360云盘、百度云,这些产品,无一不体现云计算的核心理念。当我开通了云服务之后,已经深深感受到云计算所带来的便利:百度云上,存储了我N多的软件、音乐、文档、图片;无论哪位朋友,需要我的某个文件,只需打开百度网盘,创建一个链接并发给他,他就能直接下载我存储在云端的文件。现在我一直在想,在这个云时代,还有必要购买优盘、移动硬盘么?这些移动存储设备,充其量只是方便我们在本地拷贝文件,异地传输,绝对是云的天下。
但是,有多少老师进入云端了呢?
思及这个问题,我感到深深的遗憾。中国教育为世人所诟病,教师自身难辞其咎!同时,对于负有教师培训重责的相关部门的不作为,表示深深的遗憾。
注:本文使用office2013写成,存储于skydrive(微软云)。