第一篇:01 中国父母易犯的十大错误
中国父母易犯的十大错误
1.让他人带孩子,不自己亲自照顾
很多中国父母以为孩子只要身边有人看著,没有生命危险就好。其实从出生开始,孩子就需要和别人交流。不会说话也可以交流。肌肤的接触,拥抱,关注的眼光,和他说话。孩子需要不断的交流,会变得比较聪明,对爱有安全感。我们很多家庭的孩子,是在没有关注的环境下长大。脑子会变得怪异呆滞。然后永远缺乏爱的安全感。终生追求那童年,婴儿时期失去却永远追不回的爱。
2.把孩子当炫耀比较的对象
中国人一方面爱面子,一方面想鼓励孩子上进。常常说,你看人家孩子多用功,成绩多好。人家又得了什么奖。这种比较最要不得。况且常常是当著很多人的面说。说难听点,孩子考试考不好只怪你基因太差。人受到基因影响太多了,包括智力,个性种种等等,并不是孩子不愿意做好。你每一次把孩子和别人比,只带给他多一份不满和痛苦。对于事情没有什么帮助。
这种比较和竞争的心里,也导致中国人团体比较无法和谐合作做事。喜欢互斗。对于能力强的人不是佩服,而是嫉妒,要拉他下来。学校的老师更是火上加油。整个家长和老师的教育观念需要加速修正。否则中国人的团队合作永远不如人。
3.不尊重孩子的隐私和权利
很多父母抱著传统的观念,把父母摆在权威的角色。认为子女是属于父母的。这种不把孩子当一个拥有完整权利个体的错误观念,导致个人和社会的很多不良的后果。父母进入子女房间应该先敲门。移动或用孩子的东西应该得到他的允许。任何牵涉到子女的决定应该先和子女商谈。不要随意翻看子女的日记或隐私。应该尊重孩子的所有权利,把他当一个成人一样尊重。这个尊重是从出生换尿片开始。换
尿片前,先和颜悦色告诉他要换尿片了,向他道歉,请他忍耐一下。这种尊重的精神是我们社会所缺乏的。导致社会缺乏服务和尊重的观念。不被尊重的人以后也不知道尊重别人。
4.把孩子塑造成自己想要的方向
很多父母把自己一生的遗憾寄托在孩子身上。一直逼孩子往自己以为是正确的路走。即使孩子并不适合,或者不喜欢。譬如学钢琴。譬如出国。在这种压力下,家庭变的不快乐。亲子的愉快时光成了斗争大会。牺牲了亲子的和谐关系,追求一些莫明其妙,也不见得正确的父母理想。当子女长大回想起童年,尽是不快乐的回忆。的确是些愚蠢父母的作为。
5.把学校成绩当成一切表现的指标
中国家长都认为越用功越好。很多父母愚蠢地以为学校的成绩代表一切。这个科举时代遗留的过时观念,仍旧深存人心。其实事实摆在面前,在学校的成绩并不代表一切。反而是全面的能力,活力,毅力,性格,才是影响他们一生的重要因素。
6.认为早起才好,睡觉就是懒惰
成长中孩子需要充分的睡眠。目前全国教育界正在集体剥夺孩子们的睡眠时间。很多孩子6点就起床。每天睡不足8小时。还在推广早起才健康的错误观念。睡不足会影响发育。脑力会减退。我们的孩子需要充分的睡眠。违法让孩子在周末学习或晚睡觉的教育人士应该用严厉的法律措施来禁止
7.认为孩子不该做家事,该把时间拿来学习
社会学家调查的结果,在家常做家事的孩子将来生活比较幸福。可能是因为处理事情的能力比较强。所以长大以后比较不容易有挫折。或者比较能面对挫折。中
国的父母为了让孩子学习,剥夺了一切孩子做家事的机会。剥夺了他学习工作,学习分担责任,学习面对问题的机会。教养出一个个只会解几题数学(又解不好)的傻孩子。中国父母应该让子女充分分担家事。学校应该全面减低作业份量。
8.缺乏幽默感和轻松的一面
或许因为各种压力,家庭的基本气氛就是逼孩子学习。什么是家庭生活?什么是亲子活动?完全不知道。父母因为生活压力,失去了幽默感,失去了轻松。一切都是逼,都是赶,都是高考。实在不知道人活著是为什么。亲子或夫妻在这种缺乏轻松和幽默感的气氛下,一个小挫折就会引爆冲突。
9.认为父母的爱是对子女不合理要求的借口
男女之间,爱并不是为一切所欲为的借口。或许因为电视剧演太多了。很多人以为爱就可以当一切的借口。很多父母常对子女说的一句话:我们这样做,也是因为爱你,为你好啊。想用这句话堵住子女的反驳。这简直荒谬。要求不合理就是不合理。别把爱扯进来当挡箭牌。父母的要求应该要合理。让孩子心服口服。
10.认为养孩子是艰苦的义务,不是享受
中国父母,经过传统的教育,习惯把养育儿女当成艰苦的义务。也因为这个苦,而常常暗示或明示子女要回报,孝顺。比较正确的态度是养孩子是一种上天赐予的享受。
第二篇:中国父母最易犯的家教错误
中国父母最易犯的家教错误(图)
2013-03-05 柯云路
【宝宝,你慢慢来】孩子,你慢慢来。你独一无二,与众不同,你有权以自己的思想主宰成长。孩子,你慢慢来。春天开花,秋天结果,成熟需要时间。小神童和小超人的人生,并不样样领先。人生不是短跑,也不是中长跑,是一场马拉松——马拉松从来没人抢跑,因为绝不会“输在起跑线上”。
人生起跑线
“起跑线”本是个体育赛事的专用名词,但这个词被越来越多地用在了成长的孩子身上,而且恰恰与体育无关。
一对夫妇皆为名校毕业生,自认为从小给孩子创造了最好的学习环境。从怀孕起就注重胎教,听名歌名曲,孩子还不大会说话就拿着五彩图片教他认字,三岁时进幼儿园而且是双语的,六岁时为进最好的学校,拿了数万元的“赞助费”。这还不算,为了让孩子有更突出的表现,假期和周末还报名各种“辅导班”。孩子的确十分争气,从小学到中学一直全力以赴学习,很少时间游戏和锻炼,而成绩则出类拔萃,每次家长会都是作为母亲最骄傲的日子。
挫折从天而降,自从上了重点高中,孩子有了变化,先是成绩下滑,后来干脆厌学。每次开家长会,班主任总要把
母亲留下来单独谈话,说孩子孤僻、不合群,上课注意力不集中,完不成作业。如此下去,考大学会成问题。
父母当然着急,除了早晚督促,还请来各科家教,但效果几乎看不到,以至于两次高考失利,一再复读。然而复读也进行不下去了,孩子的情况继续恶化,被医生诊断为“抑郁症”,需要治疗和休息。一个一米七几的小伙子自此天天待在家里,除了睡觉、吃饭就是打游戏。父母还不能说,说轻了无动于衷,说重了就会大发脾气。几次离家出走,把爷爷奶奶吓得不轻。家里的电视被砸坏了几台,手机更成为出气桶,不知摔坏了几部。
这对父母说,我们给了孩子最好的成长条件,从人生的“起跑线”就早早规划好,始终让他处在最优越的位置,再也想不到今天的局面。
另一对夫妇三年前喜得双胞胎,除将两边的四个老人轮流接到家中照料外,还为孩子各请了保姆。好不容易盼他们长到了三岁,又早早报名了一家双语幼儿园。这家幼儿园不仅收费高,还离家很远,每天得车接车送。问他们为何不去附近幼儿园?回答说普通幼儿园教育质量达不到标准,他们的孩子必须从小接受最优质的教育,又是所谓“赢在起跑线上”。
还有一对夫妇中年得女,自然掌上明珠,现在流行一种说法“女孩要富着养”,但这个女孩是怎样被富着养呢?先
是上最好的幼儿园,之后是最好的学校,每天父母与孩子一样起早贪黑。一天很晚了,我在外面散步,一家人“放学”回来,孩子显然已筋疲力尽。他们看到我停下来聊一阵,我自然关心一下孩子情况。女孩上小学四年级,除了完成正常的学业外,还要上各种名目的“辅导班”,比如钢琴、美术、英语、数学,所有的周末都被这些“班”占满,如此之“富”!——同样是没有游戏的时间,更谈不上体育锻炼。我问女孩:喜欢哪些辅导班?女孩摇头:哪个都不喜欢。我问父母:既然孩子不喜欢,为什么不让孩子少上一点“班”?做父母的同时摇头:那怎么行?别的孩子也都在上这些“班”,有的比我们还抓得紧,如果我们不学,孩子就会输在起跑线上。
还是“起跑线”
最近又有一位家长向我征询意见,现在的入学年龄是6岁,他的孩子出生在10月,照规定必须是9月1日前出生的适龄儿童才能入学。他因此而纠结,觉得无论如何也不能让孩子再耽误一年。我问他为何如此着急,家长说早一天上学,就早一天学到知识,这可是人生的起跑线呀。我立刻摇头:孩子小,上体育课样样落后感觉很自卑。孩子晚进校几天,不会耽误什么。最重要的是让孩子身心健康,如果孩子一生身康体健,不仅什么都不会落下,还可能得到更多成功。
据一份官方发布的数字统计,目前北京小学生视力不良检出率为43.5%。随着年龄的增长,初中、高中和大学各阶
段分别达到71.89%,81.89%和90.29%,而中学生超重率已达11.69%,肥胖率达到14%。不知道那些家长们怎样看待孩子脸上的小眼镜,怎样看待那些体重超常的小胖墩儿。权威机构的调查还显示,全国少年儿童心理和行为问题发生率高达13.9%,小学生存在不同程度心理障碍的比例为20-30%,中学生为40-60%。这些数字背后是一个个鲜活小生命,他们正值人生的重要成长阶段,智力培养固然重要,但强健的身心对于他们则有更重要的意义。要给孩子们游戏锻炼的时间。身体是生命的载体,健康的身心才是人生真正的起跑线!
第三篇:高考易犯低级错误大盘点
高考易犯“低级错误”大盘点
导读:往年高考中,考生在哪些地方疏忽导致无谓失分?如何科学答题才能拿到理想分数?参加过高考阅卷的语文、数学、英语名师,介绍往年阅卷时发现的考生诸多“低级错误”,给考生们提个醒。文言翻译考生失分最多
勤奋刻苦的复习备考当然是最重要的,但考试中的一些答题技巧和细节也不能忽视。结合参加高考阅卷的体会,从考试内容和答题形式,给同学们几点忠告。
文言翻译
文言翻译是近几年考生失分最多的题之一,主要原因是译不准“得分点”。译不准的原因,除了能力不足之外,对“得分点”认识不清、重视不够是另一个重要原因。
对于古诗词鉴赏题,可以采用“三问解答法”———这首诗写了什么,用什么手法写的,写的怎样(表达效果)。名句默写:写准确,做最有把握的题,关于名句默写,最重要的是书写准确,不要写错别字。
阅读理解
做好阅读理解题主要靠长期形成的阅读能力,但是改进方法也有明显的效果。一定要通读全文,边读边圈点勾画,整体把握文章的思想内容和艺术特点,然后再做题。
语言表达
语言表达题是一个考查范围很广、灵活性很强的题型,要做到不丢分很不容易,特别是有些难度较大的题,如对联、仿句和概括文意等,很难一挥而就,因此,要先拟写草稿,修改后再写到试卷上。
作文
写作是语文试卷的重头戏。
文章的中心必须尽可能地鲜明、集中;文体要鲜明。写作议论文就是议论文,散文就是散文,小说就是小说;不要大段行文,高考作文一般分为5~8段为好;语言顺畅,不能过于含蓄更不能晦涩难懂,老师不可能用较多的时间去琢磨你的文章;书写清楚。
答题说明
高考语文考卷开头都有一个“答题说明”,用来说明答题的注意事项和要求,尤其是现在很多省份进行“网上阅卷”,需要注意的更多,要求也更严格,因此,必须认真阅读。
涂卡修改
客观题的阅卷特点是机器只认符号不认人,因此,必须涂写规范,合乎要求。涂答题卡,一定要涂写清楚、规范;如果修改,必须擦干净,否则,可能会吃亏。
先易后难技巧是不变真理
先易后难,这一技巧是不变的真理,屡用屡成功,希望同学们切记。先做简单的题,使自己的思维动起来,稍微难一点的题也就做出来了,另外还可以增强自己的自信心,保证基本分。如何保证准确率
对于每一个同学来说,只要把自己会做的题做对了,自己的考试就算成功了,不会留下遗憾。怎样才能保证准确率呢?首先要做到答题的规范性,规范性不仅仅包括书写的规范性,还包括审题的准确性,分析题目的严密性,计算的准确性,表达的准确性。所以从审题开始,就要做到零失误,把错误扼杀在萌芽状态,这是关键之关键,否则一分没有,时间也浪费掉了。
分析题目时,一定要分析到位,不要为了多做题,在分析题目上节省时间,导致分析不到位,理解题意不准确,出现错误。计算上该有的验算步骤一步也不能省,只要平时口算爱出错的同学,一定在验算本上书写验算步骤,保证计算的准确性。演算纸也不能乱写乱画,也要标上题号,按照从左到右,从上到下书写,以便于检查,这样书写也节省了检查的时间,不用重新写一遍,易于找到出错的地方。在书写的时候,要表达准确,从高考阅卷反馈信息来看,对于简单的题目,步骤要求比较严格,在此类题目中,要求自己不漏写一个得分点,那什么是得分点呢?比如一个公式,一个定义等等。对于较难的题目,只要有一个得分点就给你一个得分点的分,所以尽量多写得分点,即使这个题做不出来,能多写一个就多写一个,尽量得最高的分。
怎样做难题
从高考试卷分析来看,较简单的题目,基本上是知识点的简单综合,直接利用定义公式就能解决。较难的题,基本上就是方法上的问题,当你题目做不出来时,想一想是不是方法不得当,从方
法上搞突破。选择题,填空题有它们自己的特点,比如选择题,常用的方法是淘汰法,特殊值法,特例法,数形结合,直接法。填空题常用的方法是数形结合,特例法,直接法。解答题考查的主要是数学思想方法,及创新能力。
常考的数学思想有分类讨论、数形结合、等价转化的思想。当你做不出来时,先想一想此题的意图是什么,思想方法是否正确。在寻找解题思路上,可以利用从特殊到一般,类比的推理方法去寻找,有可能找到解决问题的思路,这也是创新思维的一种考查。
哪些粗心导致失分
娄老师表示,在高考阅卷时,发现学生在数学学科的失分点都大同小异,因粗心导致的失分令人可惜。
答题“跳步”。一些考生数学估分比实际得分高,多是由于答题时省略了必要的步骤,导致得分不全,如解题时证明过程不规范等。
还有一些考生在考试时使用了不能直接应用的公式,也会造成失分。做选择题填空题粗心。数学选择题、填空题中都有基础题,但往往基础题失分较严重,主要是做题时认为简单而不认真。考生做选择题要讲究技巧,可用排除法、特值法、逻辑分析法解答。
有些难题就不要花时间纠结,直接跳过做后面的试题。数学符号书写不规范。有些考生不注意数学符号的表示,有些考生图表画得不清晰。做“选考题”时要先涂黑题号,再按相应的题号要求来答题。
作文字数一定要写够
2012年6月12日到20日,烟台一中张宁老师参加了山东省高考英语书面表达的阅卷工作,张老师将在阅卷中,出现的一些问题提醒考生,希望能够给予今年参加高考的学生帮助。书面表达
1.作文写书信格式不做扣分处理,在内容中没有提到英语演讲比赛背景的也不做扣分处理。
2.作文分数档的设置:一档 26-29分。要求:涵盖所有要点,语言流畅,句式多变,小的语言错误不超过六处。二档 22-25分。要求:涵盖所有要点,语言比较流畅,可以有少量语法错误但不影响理解。三档 18-21 分。要求:基本涵盖所有要点,半数句子以上正确。这也是作文的及格档。四档 13-17分。要求:要点不全,语言错误较多,但多数句子的结构基本正确。五档 7-12分。要求:要点不全,语言错误较多,只能写出与要点相关的少数正确的句子。六档 0-6 分。要求:没有有效信息,只能写出个别相关词汇或抄写其他文章。
3.字数不足应扣2分。
注意问题
1.学生的书写很重要,书写的好与差可能会使得分数相差一档或几档。
2.学生要学会认真审题,将题中所列要点写全。若缺少一个要点,无论该作文的语言多么优美流畅,结构多么合理,都不会达到一档作文的分数,甚至有的作文都不会达到及格档的分数。
3.作文的字数一定要写够,字数不够要扣除2分,但是字数太多不做扣分处理。
4.作文不能全用简单句,也不能过多使用过于复杂的复合句。句型过于简单,即使要点全,语言无错,也只能达到二档的分数。句型过于复杂,会造成阅卷老师心理上的厌烦感。
英语作文
1、书写潦草,英文字母看不清。一些考生字迹潦草、卷面不整洁、答题时超出边界、或做完成句子时答题区间不对等情况,都影响分数。
2、听力没听清而纠结。有些考生在拿到卷子后,没有及时把听力部分浏览一遍,导致开始几题没听清而纠结,影响后面的答题。当听不清楚时,应快速勾出答案,不要纠结太久,赶紧进入答下一题的状态。
3、书面表达开头结尾差,有涂改痕迹。建议在时间比较充足的情况下先打草稿,最起码要打腹稿,特别注意书写清晰和卷面整洁。开头、结尾要写好,可多用一些有把握的高级句子,给阅卷老师留下好的印象
第四篇:家长易犯的十个错误
家长易犯的十个错误
1、过度照顾:
现在许多小孩一生下来,就被照顾的无微不至,其结果却可能剥夺了孩子学习、成长的机会。从小被喂食到了两三岁甚至更大,孩子的小手缺乏拿汤匙、筷子的练习,会导致手部肌肉的发展问题,上了小学可能连写字都会很困难。因为怕孩子噎到,所以一直给孩子喂食柔软的食物,会让孩子没办法发展咀嚼能力,甚至没办法正确发音。怕孩子冷、怕孩子热、怕孩子受伤、怕孩子在外面被欺负,处处保护的结果,反而是在伤害孩子。
2、过度安排:
相信在你的周围,一定有许多行程排得比你的孩子还满的孩子。但许多研究都发现,被过度安排的小孩,最后都容易丧失对生活的热情、也会缺乏自我管理的能力。美国儿童教育学者汤姆斯。阿姆斯特朗特别提醒父母,所有的孩子都需要一些无所事事、随性玩耍的时间,尤其是学龄前的孩子,唯有这样才能让他们的想象力充分的发挥。每天至少要给孩子空出一段时间,什么都不要安排,让生活有一些不可预期的乐趣。
3、说教太多、身教太少:
许多父母要求孩子去看书,自己却在看电视。要求小孩要有礼貌,自己却一天到晚对孩子破口大骂。当父母言行不一的时候,会失去孩子对父母的尊敬,甚至引起孩子对父母的反感。
如果希望培养孩子阅读的习惯,就该尽量陪着他读书,你可以看你自己喜欢的书,也可以与孩子共读。如果你希望孩子有礼貌,表现出你对孩子的尊重是最有效的方法。
4、只关心学业,忽视其它生活能力的培养:
现代父母的悲哀是把对孩子的投资全都放在功课成绩上,这是现代家长最大的观念误区。学校只能给孩子颁发毕业证书,却不能给孩子就业保证书,拿到高学历、好成绩,不是竞争的结束,离开学校才是竞争真正的开始。父母除了在乎外在的分数、学历、学校之外,对于孩子内在的智慧、美德、快乐和健康等等,更需要关心。
5、用“买”来满足孩子:
现代社会进入了一个消费社会,父母想要满足孩子,只要掏出口袋里的钱,就能买到各式各样的东西,从买玩具、买课程、买故事书到买一个个广告中许诺给孩子的美好未来,父母买给孩子的东西不断增加,却不见得能增加孩子的快乐。现代人只有消费,除了买,还是买,孩子除了得到那买来的东西之外,却失落了许多学习和成长。
6、完美主义:
有研究表明,许多需要进行心理治疗的孩子,往往都是父母造成的,他们被父母的要求与期望逼的喘不过气,最后只好宣布放弃。
父母应该给孩子一条活路,也给孩子一条退路,如果孩子没有办法考上第一志愿,他也还应该有一条退路,退一步海阔天空也不一定。
7、害怕输在起跑线上:
“别让孩子输在起跑线上”,是许多父母的信念。为了及早作好准备,很多孩子被迫提早结束无忧无虑的童年,这其实是一个很大的观念误区。孩子的成长有自然的规律,就像大自然的四季变化,当孩子的身心还没有发展到可以吸收某些知识或技能的阶段时,提早学习往往没有效果,甚至伤害孩子的心智。
父母与其整天挂念着孩子未来有没有竞争力,不如从自我成长、自我突破的角度来引导孩子,这比强调要孩子赢过别人、打败别人更重要。
8、负面的言语太多:
如果你有机会把你和孩子对话录音下来,你可以分析一下,你会不会在言谈中不断地出现负面的语汇,例如︰“你不要…”、“你不可以…”、“为什么你总不听我的话…”、“你今天在学校有没有闯祸…”等等。负面的词语太多,很容易激起孩子的防卫机制,你每次看到孩子就纠正他的缺点,他的大脑会渐渐形成一种反应,一看到你就紧张、害怕、甚至产生敌意。在心理学上有所谓的“痲痹化作用”与“明朗化作用”,负面言语加强“痲痹化的作用”压抑了孩子的天赋,正向的言语却能启动“明朗化作用”,因为有人欣赏鼓励,孩子会表现的更好。
9、通过孩子活出自己:
许多亲子间的紧张关系,来自于父母把孩子当作实现自己愿望的载体,每天把全副心血都投注在孩子身上,把孩子当作自己的事业来“经营”,希望通过孩子来活出自己。但是,孩子是一个独立的个体,别把他当作是自己的“事业”来经营,父母自己也应该活出自己独立的生活,否则一旦子女不领情,父母就会产生很多怨憎。
10、忘了享受做父母的乐趣:
孩子快不快乐,其实是评量父母最好的指标。孩子快乐,才是最重要的,做父母除了要尽责,也别忘了享受孩子带给你点点滴滴的幸福与满足,要是能享受亲子间的快乐时光,做父母其实很快乐。
第五篇:数据挖掘中易犯的十大错误
0.缺乏数据(Lack Data)
1.太关注训练(Focus on Training)
2.只依赖一项技术(Rely on One Technique)
3.提错了问题(Ask the Wrong Question)
4.只靠数据来说话(Listen(only)to the Data)
5.使用了未来的信息(Accept Leaks from the Future)
6.抛弃了不该忽略的案例(Discount Pesky Cases)
7.轻信预测(Extrapolate)
8.试图回答所有问题(Answer Every Inquiry)
9.随便地进行抽样(Sample Casually)
10.太相信最佳模型(Believe the Best Model)
咦,11项错误了喔!呵呵!详情如下:
0.缺乏数据(Lack Data)
对于分类问题或预估问题来说,常常缺乏准确标注的案例。
例如:
-欺诈侦测(Fraud Detection):在上百万的交易中,可能只有屈指可数的欺诈交易,还有很多的欺诈交易没有被正确标注出来,这就需要在建模前花费大量人力来修正。
-信用评分(Credit Scoring):需要对潜在的高风险客户进行长期跟踪(比如两年),从而积累足够的评分样本。
1.太关注训练(Focus on Training)
IDMer:就象体育训练中越来越注重实战训练,因为单纯的封闭式训练常常会训练时状态神勇,比赛时一塌糊涂。
实际上,只有样本外数据上的模型评分结果才真正有用!(否则的话,直接用参照表好了!)
例如:
-癌症检测(Cancer detection):MD Anderson的医生和研究人员(1993)使用神经网络来进行癌症检测,惊奇地发现,训练时间越长(从几天延长至数周),对训练集的性能改善非常轻微,但在测试集上的性能却明显下降。
-机器学习或计算机科学研究者常常试图让模型在已知数据上表现最优,这样做的结果通常会导致过度拟合(overfit)。
解决方法:
解决这个问题的典型方法是重抽样(Re-Sampling)。重抽样技术包括:bootstrap、cross-validation、jackknife、leave-one-out...等等。
2.只依赖一项技术(Rely on One Technique)
IDMer:这个错误和第10种错误有相通之处,请同时参照其解决方法。没有对比也就没有所谓的好坏,辩证法的思想在此体现无遗。
“当小孩子手拿一把锤子时,整个世界看起来就是一枚钉子。”要想让工作尽善尽美,就需要一套完整的工具箱。
不要简单地信赖你用单个方法分析的结果,至少要和传统方法(比如线性回归或线性判别分析)做个比较。
研究结果:按照《神经网络》期刊的统计,在过去3年来,只有1/6的文章中做到了上述两点。也就是说,在独立于训练样本之外的测试集上进行了开集测试,并与其它广泛采用的方法进行了对比。
解决方法:
使用一系列好的工具和方法。(每种工具或方法可能最多带来5%~10%的改进)。
3.提错了问题(Ask the Wrong Question)
IDMer:一般在分类算法中都会给出分类精度作为衡量模型好坏的标准,但在实际项目中我们却几乎不看这个指标。为什么?因为那不是我们关注的目标。a)项目的目标:一定要锁定正确的目标
例如:
欺诈侦测(关注的是正例!)(Shannon实验室在国际长途电话上的分析):不要试图在一般的通话中把欺诈和非欺诈行为分类出来,重点应放在如何描述正常通话的特征,然后据此发现异常通话行为。
b)模型的目标:让计算机去做你希望它做的事
大多数研究人员会沉迷于模型的收敛性来尽量降低误差,这样让他们可以获得数学上的美感。但更应该让计算机做的事情应该是如何改善业务,而不是仅仅侧重模型计算上的精度。
4.只靠数据来说话(Listen(only)to the Data)
IDMer:“让数据说话”没有错,关键是还要记得另一句话:兼听则明,偏听则暗!如果数据+工具就可以解决问题的话,还要人做什么呢?
4a.投机取巧的数据:数据本身只能帮助分析人员找到什么是显著的结果,但它并不能告诉你结果是对还是错。
4b.经过设计的实验:某些实验设计中掺杂了人为的成分,这样的实验结果也常常不可信。
5.使用了未来的信息(Accept Leaks from the Future)
IDMer:看似不可能,却是实际中很容易犯的错误,特别是你面对成千上万个变量的时候。认真、仔细、有条理是数据挖掘人员的基本要求。
预报(Forecast)示例:预报芝加哥银行在某天的利率,使用神经网络建模,模型的准确率达到95%。但在模型中却使用了该天的利率作为输入变量。金融业中的预报示例:使用3日的移动平均来预报,但却把移动平均的中点设在今天。
解决方法:
要仔细查看那些让结果表现得异常好的变量,这些变量有可能是不应该使用,或者不应该直接使用的。
给数据加上时间戳,避免被误用。
6.抛弃了不该忽略的案例(Discount Pesky Cases)
IDMer:到底是“宁为鸡头,不为凤尾”,还是“大隐隐于市,小隐隐于野”?不同的人生态度可以有同样精彩的人生,不同的数据也可能蕴含同样重要的价值。异常值可能会导致错误的结果(比如价格中的小数点标错了),但也可能是问题的答案(比如臭氧洞)。所以需要仔细检查这些异常。
研究中最让激动的话语不是“啊哈!”,而是“这就有点奇怪了„„”
数据中的不一致性有可能会是解决问题的线索,深挖下去也许可以解决一个大的业务问题。
例如:
在直邮营销中,在对家庭地址的合并和清洗过程中发现的数据不一致,反而可能是新的营销机会。
解决方法:
可视化可以帮助你分析大量的假设是否成立。
7.轻信预测(Extrapolate)
IDMer:依然是辩证法中的观点,事物都是不断发展变化的。
人们常常在经验不多的时候轻易得出一些结论。
即便发现了一些反例,人们也不太愿意放弃原先的想法。
维度咒语:在低维度上的直觉,放在高维度空间中,常常是毫无意义的。解决方法:
进化论。没有正确的结论,只有越来越准确的结论。
8.试图回答所有问题(Answer Every Inquiry)
IDMer:有点像我爬山时鼓励自己的一句话“我不知道什么时候能登上山峰,但我知道爬一步就离终点近一步。”
“不知道”是一种有意义的模型结果。
模型也许无法100%准确回答问题,但至少可以帮我们估计出现某种结果的可能性。
9.随便地进行抽样(Sample Casually)
9a 降低抽样水平。例如,MD直邮公司进行响应预测分析,但发现数据集中的不响应客户占比太高(总共一百万直邮客户,其中超过99%的人未对营销做出响应)。于是建模人员做了如下抽样:把所有响应者放入样本集,然后在所有不响应者中进行系统抽样,即每隔10人抽一个放入样本集,直到样本集达到10万人。但模型居然得出如下规则:凡是居住在Ketchikan、Wrangell和Ward Cove Alaska的人都会响应营销。这显然是有问题的结论。(问题就出在这种抽样方法上,因为原始数据集已经按照邮政编码排序,上面这三个地区中不响应者未能被抽取到样本集中,故此得出了这种结论)。
解决方法:“喝前摇一摇!”先打乱原始数据集中的顺序,从而保证抽样的随机性。
9b 提高抽样水平。例如,在信用评分中,因为违约客户的占比一般都非常低,所以在建模时常常会人为调高违约客户的占比(比如把这些违约客户的权重提高5倍)。建模中发现,随着模型越来越复杂,判别违约客户的准确率也越来越高,但对正常客户的误判率也随之升高。(问题出在数据集的划分上。在把原始数据集划分为训练集和测试集时,原始数据集中违约客户的权重已经被提高过了)解决方法:先进行数据集划分,然后再提高训练集中违约客户的权重。
10.太相信最佳模型(Believe the Best Model)
IDMer:还是那句老话-“没有最好,只有更好!”
可解释性并不一定总是必要的。看起来并不完全正确或者可以解释的模型,有时也会有用。
“最佳”模型中使用的一些变量,会分散人们太多的注意力。(不可解释性有时也是一个优点)
一般来说,很多变量看起来彼此都很相似,而最佳模型的结构看上去也千差万别,无迹可循。但需注意的是,结构上相似并不意味着功能上也相似。
解决方法:把多个模型集装起来可能会带来更好更稳定的结果。
原文标题为“Top 10 Data Mining Mistakes”,作者是John F.Elder IV, Ph.D.编译:IDMer(数据挖掘者)