第一篇:教育评价论文+
教育评价的理论与实践
浅谈教育评价的理论与实践
自20世纪30年代教育评价作为一种专业活动产生以来,随着教育在经济社会发展中的地位不断提高,政府,社会和公众对教育的期望日益增长。提高教育质量的普遍要求,成为促进教育评价研究和实践发展的强大动力,教育评价的功能不断从教学和课程领域向外扩展,逐渐成为教育管理的重要手段。当今世界教育领域中,教育评价是与教育基础理论、教育发展并驾齐驱的三大研究课题。教育评价研究对于教育改革和发展,教育管理和决策,具有重大意义。一,教育评价的理论
教育评价的概念:教育评价理论领域的新进展首先体现在其概念的历史演进中。从泰勒最早提出“教育评价”这一概念,到当前得到大多数学者认可的对教育评价的综合性界定,充分体现出教育评价研究者对概念的把握逐渐接近其本质的原貌,有利于他们运用新的理论促进实践领域的新发展。
我国教育界一般把教育评价定义为:在系统地、科学地和全面地搜集、整理、处理和分析教育信息的基础上,对教育的价值作出判断的过程,目的在于促进教育改革,提高教育质量。
教育评价的特征:所谓教育评价的特征,是指教育评价区别于其他活动的本质属性的外在表现。教育评价是一项极其复杂的社会活动,具有多方面的属性。具体我把它总结为: 1.在评价的目的上,强调促进教育的发展。2.在评价的过程上,注重自评方法的应用。3.在评价的方法上,重视定性与定量的结合.4.在评价的内容上,重视立体评价和全面评价。5.在对待评价结果上,重视全面的解释和慎重的处理。6.在评价的手段上,强调科技与智能化。7.在评价的目标上,实行多元化与整合化。8在评价的取向上,注重个性与差异性。
教育评价的意义:开展教育评价,在我国还是起步阶段;对它意义的认识也有待深化,下面,只是从几个方面阐述它的意义。
1.有利于加强对学校的宏观指导与管理。学校的好坏,不能凭领导的印象,也不能靠少数几个人的表态,而必须按照科学的评价指标体系,认真地在自我评价的基础上,积极开展同行评价、群众评价,领导评价以及社会评价,才能得到比较符合实际的评价结论。
2.有利于提高教育质量。现代教育评价的目的,除鉴定、认可之外,更主要的是对教育过程进行诊断、评价,以调节促进教育、教学、科研、管理诸方面的工作,使学校更具活力,不断提高培养人才的质量和科学研究水平,更好的为社会主义建设服务。
3.有利于深化教育改革。对教育改革方向的引导,可以通过教育行政部门召开会议、布置工作、检查指导等方式来实现,但是,有意识地发挥教育评价的导向作用,将会取得更好的效果。只有通过科学的评价活动,才能肯定改革的成绩、明确该各种的问题,即对改革做出比较客观的评价;也只有根据评价获取的可靠信息,才能使高等学校各项改革的方案不断优化。事实上,只有对每项改革的实验报告,做出科学的评价结论,改革的成效才有说服力,才能使教育改革沿着正确的轨道不断深入。
4.有利于促进学校之间的竞争。开展教育评价,就是把竞争机制引入学校的一个重要措施。例如在开展学校办学水平的评价时,就可以对校际间办学水平进行比较,就会提供校际间差距的各种信息,这样,自然就把学校纳入横向比较的校际间竞争的轨道。
教育评价的目的:1.目的,所谓教育评价的目的,就是人们在开展教育评价之前摄像或规定的教育评价活动所欲达到的效果或结果。教育评价的目的,指导和支配着整个教育评价过程,决定了教育评价的发展方向。
而教育评价的最终目的是提高教育质量与效益,促进教育有效地满足社会与个体的需要,增进教育的社会价值或个体价值。教育的最终目的,是由教育评价的本质属性决定的。
在实际工作中,教育评价首先要为教育目的或教育目标的制定、完善与实现提供保障。当然,教育评价要实现保障的目的,就要为教育教学、教育管理和教育科研等各项具体教育活动服务。
除上述增值、保障、服务等一般意义上的目的外,还特别强调以下三个方面的具体目的。1)鉴定对象的目标达成度,或根据某种准则和标准鉴定教育活动结果合格与否、优劣程度,或根据某种准则和标准鉴定教育活动结果合格与否、优劣程度或水平高低,以及进行排名货比较、分层或分等、筛选或选拔等。2)提供关于评议对象优缺点的反馈,即获取评价对象的各类信息,发现教育活动的成功之处或其中的问题,寻找出问题存在的原因,通过分析,提出解决问题的对策。3)改进,即及时反馈信息,调控行为,促使评价对象不断完善与优化。
总而言之,“目的作为行动的直接动机指引和调整着各种行为,并作为支配人的意志的内在规律贯穿在人的实践中。”
教育评价的作用:1.导向与激励作用。所谓导向作用,是指教育评价可以引导评价对象趋于理想的目标;所谓教育评价的激励作用,是指教育评价的正确运用,能够激发评价对象的内在动力,调动他们的潜能,增进他们工作的积极性与创造性。
2.反馈与交流作用,所谓反馈,是指评价者将有目的地的系统采集的有关评价对象的信息及其意义,传递给评价对象,或评价者将特定的评价信息传导给评价对象,然后搜集评价对象的返回信息,以此来实现评价信息的循环,借此不断修正评价对象或评价者的行为。3.检查与监控作用。是指评价者对评价对象的实际状况与评价标准或预定目标的符合程度的衡量与判断。另外,监控作用是指教育评价可以通过一句预期目标而制定的评价指标系统和评价标准,监视评价对象的变化情况,对于便宜目标的行为及时进行调整,实现对评价对象的控制。
4.鉴定与选拔作用。所谓教育评价的鉴定与选拔作用,是指评价者通过评价,给评价对象排出名次,最终评选出先进,或甄别、筛选出优劣。而教育评价的鉴定和选拔作用对于教育和其他社会生活领域有着身份重要的影响。
教育评价的类型:以评价的对象为依据,可以将教育评价划分为四种基本类型,即学生评价,教师评价,课程与教学评价和学校评价。
综合以上内容,我想对教育评价的重要性做一个总结,教学目标、教学活动和教学评价是教学过程的三个重要因素.这三者之间既互相促进也互相制约。教学评价过程既可以了解教学活动各环节的信息以及判断目标的正确性、可行性、达到程度,也可以通过反馈,对教学活动进行控制,对教学目标进行调整.因此泰勒认为评价不是教学过程的附属物,而是教学过程的中心.可以毫不夸张地说,如果离开了评价,教学活动是无法有效地进行的.教育评价经过几十年的发展已初步形成了学科体系,尽管概念、体系有待完善,但已为下一步的研究打下了坚实的基础。教育评价要把属于教育精神文化、制度文化类的抽象的,教育评价无力评价的范围还给教育评论学,让教育评论学更快地发展,同时,要把教育评估与教育评价的关系处理好,可将两者合二为一,形成统一的学科。要处理好理论与实践的关系,加强理论研究,使其适应实践的要求,要积极总结实践经验并升华为新的理论,丰富和发展教育评价学科体系。
二,教育评价的实践需要注重的问题
对于这个问题,我想我们应该重新看教育评价的本质要求。从哲学层面而言,评价是一种价值判断,与价值和标准有关。讨论教育评价,同样要涉及到价值与标准。但困难就在于,教育存在多元的价值,且并不存在明确的标准;教育本身是一种极其丰富、复杂而又多元的是事业与活动,这就使教育评价产生了难度。因此,对教育评价的认识,不能只停留在一般意义上。
1.教育评价必须基于测量、统计和研究的基础上
从学科发展的角度来看,教育测量和教育统计是产生教育评价学科的基础。从实践的角度来看,教育测量与教育统计更是教育评价的工具和手段。对任何教育对象、教育活动、教育机构、教育者和受教育者等的评价,都需要收集和整理数据资料。评价活动首先需要就评价对象的相关信息进行有效测量和科学统计。只有当测量具有一定的效度和信度时,收集到的信息才是正确的;也只有当数据的统计分析是合理的、有显著性的时候,评价才能采用这些数据结果。因此,研究和使用教育评价,不能离开教育测量和教育统计这两门基础学科。
在我看来,测量和统计并不能直接产生评价的结果和结论,教育评价必须与教育研究结合在一起。教育评价中,我们需要研究和分析评价对象的整个脉络,包括背景,投入,过程和产出等,需要借助社会学与系统论等理论和方法,审视评价对象及其发展机制等诸多因素,而不能只停留在表面数据信息结果的获得上。有效的教育评价,需要深入到教育活动的“暗箱”之中。例如,评价学校的教学质量,我们不仅要收集学校教学质量的直接资料,还要分析学校产生这些质量数据的历史,考察产生这些结果的实际过程等。除了学校的硬件设备之外,教师队伍,学生来源等都是影响教学质量结果的重要因素。换言之,对每所学校教学质量的评价,都应该是一种个案研究。目前市场上按照学校升学率高低而排列出来的学校的名次,在严格意义上来说,不是一中学校评价,最多只是一种不完整的统计分析。2.明确教育评价的发展目标
教育评价是教育管理的手段之一,但我们不能把教育评价的功能局限在评判等级、江城界定和考核评比等方面。教育评价的核心目标应该定位在促进教育发展上,包括促进教育系统、教育机构、和教育人员等各个方面的发展。目前,发展性教育评价已经成为国际教育界的共识。“以评促建、以评促改、以凭促管、评建结合、重在建设”已成为我国教育评价的政策方向。
在教育评价活动中,我们必须高度重视鉴别问题、分析困难、寻找原因和提出对策等,而不仅仅满足于获得数据、产生结果和做出判断。只有这样,教育评价才能够实现它的目的和意义。要做好教育评价:
(1)教师评价:教师评价应是一个充满人文关怀的评语,既要充分肯定学生在学业上的进步,尽量发现其长处,也要指出他在成长过程中的的不足,并指明努力的方向。肯定进步要实事求是,恰如其分。指出不足,应用激励性语言表述,把存在问题和努力方向融合起来。教师对学生学习情况的评价具有权威性,一定要做到公平、公正、客观、准确。
(2)学生评价。自评要强调容观性,实事求是,既不能缩小,更要防止夸大其词,言过其实。鼓励学生在自评过程中自我反思,吸取教训,总结经验。互评要在自评的基础上进行,充分尊重自我评价,要把别人的不足当作检查自己的镜子,把别人的长处看做自己努力的目标。这样,互评是大家互相学习,取长补短,共同提高的过程。(3)家长评价:家长评价重在学习的自觉性和主动性,主要看自学情况,看完成家庭作业的情况,看运用所学解决实际问题的情况。评价的时机选择上要恰当,遵循及时性和经常性原则。我们不能吝啬自己对学生的评价,同时也要重视自己对学生的评价,你不经意的一句话、一个举动、一个眼神都可能影响到学生的发展。
评价是教学的艺术,它不同于随便的表扬,更不是严厉的批评,这一环节不仅考验了一位教师对学生的耐心、细心和爱心,同时也体现出一位教师的道德修养。
“学高为师、德高为范”,虽然作为教师的我们不是圣人,但可以也必须不断地完善自己。除了自身的努力,我们还应以同事之间相互交流,共同提高,努力为提高教育质量而奋斗!
第二篇:教育评价论文
教育评价:矛盾与分析
【内容摘要】新课程改革过程中需要正确处理几对矛盾,即教育评价的理论模式与操作程序的矛盾,量化评价与质性评价的矛盾,以及评价方法的“西化”与本土化的矛盾。独断地宣称一种评价方法的合理性和不合理性,无益于评价改革;简单地复制西方国家的评价方法,特别是某些国外已淘汰的方法,对评价理论的创新不利;以特定情境为基础的、冷静的教育评价研究,具有长久的、普遍的意义。
【关键词】教育评价;量化评价;质化评价
一、理论模式与操作程序的矛盾
理论模式与操作程序是科学研究的一对普遍矛盾,在人文社会科学领域中更是如此,教育评价也不例外。当前,在我国基础教育新课程改革中流行的一些理论模式都是比较先进的,例如,根据加德纳的多元智力理论,教育评价应该评价学生的多元智力,而传统的评价主要评价了言语智力以及数理逻辑智力,对多元智力的其他成分则评价甚少。又如,根据建构主义教学理论进行评价,必须评价师生的相互作用。后现代理论强调评价学生学习的主体性,等等。但所有这些,操作起来都非常困难。这些困难,集中表现在评价主体的多元性之难和评价内容的全面性之难两个方面。
(一)评价主体多元性之难
评价主体单一化的局限性是不言而喻的。现代教育评价强调评价主体的多元性:首先,评价者与被评价者的人格平等;其次,评价者应该是多方面人员组成的集合,不能只是少数的所谓权威;第三,重视被评价者的自我评价。这三点都是合理的主张。第一点诉求的人格平等,反对者不多,但它的陷阱,也有不少人堕入──人格平等与知识平等和评价权力平等不是一回事;第二点谋求的评价集合的形成,反映了权威的失落和从去中心到无中心的转向追求。实际上,这种追求无处不遭遇抵制和遏制,因为评价制度和评价传统恰恰是建立在一定的权威预设和中心维系的基础上。最后一点,自我评价在现代教育评价中的地位之所以得到提高,是因为它在自我激励和自我提高中的重要意义,自我评价体现了一定程度的主体自觉。因此,若把现代教育评价的若干假定具体化为操作程序,必面临很多困难。
首先,到底什么人能够和应该成为评价者?其次,各方面的评价者在总评价中占什么地位、发挥什么作用?也就是说,各方面评价者的评分在总分中占多大权重才是合理的(如果不得不计算总分的话)?再次,怎样保证(各方面评价者)评价的信度?信度若没有得到保证,强行使用信度低的评价结果,不只是犯什么错误的问题,它甚至产生更消极、更恶劣的社会效应和滞后影响。第四,如何进行评价者的心理调控?评价主体的多元性必然带来评价主体间的相互作用。这样,评价者就容易受各种心理效应的干扰,使评价结果产生严重偏差,评价将不再为评价。
(二)评价内容全面性之难
传统的评价在评价内容方面存在的片面性是明显的。在认知因素与情感因素之间,重认知,轻情感;而在认知因素内部,又是重知识,轻能力;在学科知识因素之间,重核心学科知识,轻非核心学科知识。新课程评价强调评价内容的全面性,这个立意,无可厚非,但问题是造成评价内容的片面性的原因是复杂的,从中也显现谋求评价内容全面性之难。第一,认知与知识因素比较容易测评。在测评理论中,越是稳定的因素越易测评。认知与知识因素相对稳定,学生也不会隐藏其智能的真实水平。其次,测评都受时间限制,测评内容只能从教学内容的总体中抽取样本进行。这就产生了无法回避的,甚至是自评价制度建立以来一直存在而未能很好地解决的问题:评价内容的代表性如何?即评价的效度问题。关于哪些学科应成为核心学科的问题,长期以来,我们以不断变换的方式尝试了解决问题的种种可能,但事实上,不但始终没有找到一种充分合理、相对最好的学科组合模式,而且尝试的效应和后果为全社会的评价者和被评价者承担。
因此,需要在教育测评的核心学科的争议中寻求最大共识,需要发掘片面测评的若干合理因素;需要研讨评价内容的代表性的尺度和标准问题,即加强对评价效度问题的研究。
学术界对课程评价的很多新理论都是很熟悉的,但在教学过程中却沿用传统评价模式。这不只是传统模式的惯性在发挥作用的问题,还必须承认,片面的、有局限性的评价模式,有操作简便之长。不好的习惯可以慢慢得到纠正,而执行复杂的操作程序的难度,可能比我们想象的要大。从技术上、资源上和心理上看,短期内实行高度复杂评价程序的可能性并不大。因此,人们有理由怀疑,号称很好的评价方法却无法实行,它是不是很好的评价方法?
一些更功利、更现实的考虑,不是不合理的。采用新的评价模式不一定能提高学生的考试分数,而学生的考试分数几乎是当前评价教师的唯一标准。试想,如果一位教师,辛辛苦苦采用了很多很好的评价方法,但学生的高考成绩反而没有别的学生好,他还会继续进行这种改革吗?即使他想坚持,也注定得不到支持。
二、量化评价与质性评价的矛盾
所谓量化教育评价,就是“力图把复杂的教育现象简化为数量,进而从数量的分析与比较中推断某一评价对象的成效”。[1]这种评价方法在20世纪60年代之前占据主导地位。随后,人们认识到评价不是一个单纯的技术问题,纯粹价值中立的描述是不存在的,价值问题在评价中凸显出来,质性评价应运而生。量化评价与质性评价是课程评价中的两种基本方法,这两种方法在理论基础、评价目的、评价过程、评价的具体方法、评价的角色、评价的特点以及使用范围等方面都有显著的不同。
美国的大学招生,除了看SAT和ACT成绩①以外,还看很多方面。比如,中学教师的推荐信。最近,国内某大学附中的一名学生被哈佛大学录取,有两位美国历史教师给她写了哈佛大学历史上最好的推荐信,这信对她的录取起了很大的作用。值得指出的是,随着高校招生自主权越来越大,我们需要克服教育腐败现象。假定任何不同方法之间都存在不可调和的对立关系和取代关系,这是不是现代教育评价的新思维?
其实,西方国家对质性评价的重视,建立在量化评价的发展(有人用“泛滥”)基础上。尚无充分根据显示,在我国,量化评价大肆泛滥并完全地、彻底地主宰了评价模式。如果这个认识是成立的,则说明我们对量化评价的研究和使用,需要研究借鉴其他国家的成熟做法。一些号称的量化评价,未必不是感觉经验的数字化。甚至可以假定,比较准确地理解和领会了最基本的量化概念(比如χ2检验之类)的教育学教授,包括那些专事责难量化方法的教授,不占其总量的十分之一。承认这一点,就需要我们一方面同时加强对量化评价和质性评价的研究; 另一方面立足于我们自己的评价对象和评价背景上,摸索分化、整合的可能性。后者即评价方法的“西化”与本土化的矛盾问题。
三、评价方法的“西化”与本土化的矛盾
目前,我国的教育评价方法主要是借用西方国家特别是美英等国的。这些方法,往往先通过译介而引进,后生搬硬套地推广和运用。比如,越来越为人们熟悉的档案袋评价(有人翻译为成长记录袋)、表现性评价(有人翻译成遂行评价)、[2]真实性评价、苏格拉底式评价、发展性评价、质性评价等等,都来自国外。
可以假定,西方国家的评价方法是长期的实践智慧和科学研究的结晶。在实践智慧和科学研究二者之间,前者是高度情境化的,后者是高度抽象化的。情境化的,就是本土化的,比如,学生群体、班级规模、考试模式、选拔传统、流动机制等等。这些,既不能够引进,也不应该忽视。②抽象化的,就是普遍化的、标准化的、不受情境制约的。③能够为我们学习和引进的,只能是所谓“普遍化的、标准化的、不受情境制约的”后者,不能是前者。假定前者并非确实是“普遍化的、标准化的、不受情境制约的”,而是个人性的、地方性的、情境性的,则有助于解释为什么会出现“橘生淮北则成枳”的现象。
西方国家教育评价方法的二重性特点,是其价值和局限共处的空间。即使其“抽象”的一端放之四海而皆准,“情境”的一端也绝非如此。从这个意义上说,国外的评价方法不一定适合我国的情况,有时甚至可能适得其反。
当前,课程改革中的很多流行理论,例如,从多元智能理论、建构主义教学理论到后现代或后后现代理论,都是西方国家的情境化产物。以它们为支撑的有些评价方法,有的在西方国家已经废止,在我国却方兴未艾。比如,发展性教师评价制度于1998年在英国废止,[3]现在我们却开始热衷这种评价方法,好像每个人都透彻掌握并真心赞成这种评价方法,把过去的评价一概打成奖惩性评价,就像我们在推行素质教育的时候把过去的都打成“应试教育”一样。
对这类现象,很难说出多少新话,多是一些老话:教育评价需要实事求是静心徐察的勇气,需要具体问题具体分析的耐心。因为任何评价方法都有它产生的土壤和条件,也有它的使用前提和适用对象,绝非任何地区或国家都能够使用同一种评价方法且产生同样效果。“橘生淮北则成枳”的道理恐怕谁都明白,为什么在实施中却“橘枳”不分呢?④可以猜想一下:某些研究者图简单、省事,将 国外的先进方法直接引进,不但完成了“科学研究”的任务,而且一下子就达到了“国际领先水平”。它,误导并操纵了教育评价行动,好像再现了“西海潮流猛秦火,东风复助为妖祸”的历史景观。以目前在我国推行的“档案袋评价”方法来说,笔者了解到的情况是,使用过这种方法的教师,很少赞成普遍推广它。它的主要局限有以下六点。
●档案袋评价的工作量大,需要占用教师很多的时间精力,在教师教学任务繁重的情况下带来过重的负担。
●档案袋内容太多,标准化程度低,不好整理分析,用于大范围的评价时难以控制。
●档案袋评价存在着主观性太强的特点,评价过程中很难保证公平、公正。尤其是学生互评过程中很多主观因素影响着评分。
●难以保证信度、效度,很能达到客观、真实。
●如果各科都建立学生档案袋,肯定会导致学生的厌烦情绪。●教师在不同的时间对学生的评分是不一致的。⑤
更重要的是,到底有谁来看这些档案袋,有多大用途?如果高考还是原来的高考,这些既费时又费力的档案袋可能没有很大的作用。反过来,如果档案袋在选拔中占了一定的比例、起了一定的作用,哪怕是一点点作用,谁又能保证档案袋内容的高信度?现时,能否信心十足地说,家长不会弄虚作假,教师不会弄虚作假,学生不会弄虚作假?
评价方法“全盘照搬”行不通,要在挑选之后“拿来”。在“拿来”的时候,对拿者的素质也有较高的要求。正如鲁迅说的那样,“首先要这人沉着,勇猛,有辨别,不自私”。只对拿者的个性和素质提要求,还是不够的。更重要的是,改造知识情境和评价情境。
在评价的实施过程中,还存在其他一些不易化解但可能被人忽视的矛盾,诸如,评价过程的全程性与评价结果的终结性的矛盾;课程标准的理想导向与评价结果的功利导向的矛盾;评价理论的模糊性与评价实施的清晰性之间的矛盾;评价的理论研究不足与实践作用的过分夸大的矛盾;等等。凡此种种,都需要进一步的研究。
① SAT是Scholastic Aptitude Test的缩写,译为“学术性向测验”;ACT 是American College Test的缩写,译为“美国大学测验”,在美国中西部被广泛采用。美国绝大多数高校两种考试都认可。
② 例如,“班级规模”就是一个极重要的尺度,它综合地反映了教育资源的总量、分布、分配、占有和支配模式。可惜,在过去二十多年的专业研究和政府文告中,它不是一个常为人充分注意的概念。因此,它对教育评价的规定和对教育改革的诉求,也没有充分展示和揭示。夸张地说,仅采取班级规模合理化这一种手段,就可以减少现行教学及其评价的若干积弊。参见Peter Blatchford et al.(1998),Research on Class Size Effects:A Critique of Methods and a Way Forward,International Journal of Educational Research,29.③ 科学知识具有普遍化、标准化和不受情境制约的特性之说,从20世纪50年代到80年代,先后被波兰尼(1958)、吉尔兹(1983)和劳斯(1987)等人否定。(《个人知识──迈向后批判哲学》,许泽民译,贵州人民出版社,2000;《地方性知识──阐释人类学论文集》,王海龙等译,中央编译出版社,2004;《知识与权力──走向科学的政治哲学》,盛晓明等译,北京大学出版社,2004)他们或者发现了科学知识的个人性,或者揭示了其地方性、情境性。法兰克福学派、特别是哈贝马斯,则着力批判科学技术的操纵功能。自伏尔泰到波普,都强调科学知识与人文知识和社会理论之别,强调科学知识的数据化力量、与日常生活的断裂性特征。波兰尼等人的劳作等于向这类论断发起了挑战。
④ 吕达2005年5月13日在华南师大教科院所作的学术报告《当前课程改革的若干问题》中,也持此见。
⑤ 华南师范大学2002级教育硕士教育管理方向黄艳同学的硕士论文,2004年12月第43页。
参考文献:
1.张扬.论课程评价中的量化评价与质性评价[J].宁波大学学报(教育科学版),2004,(3):37—39 2.董华,等.遂行评价──韩国小学新型课程评价体制[J].现代中小学教育,2004,(2):57—59 3.王小飞.英国教师评价制度的新进展[J].比较教育研究,2002,(3):43—47
第三篇:美国教育评价拓展论文
摘要:美国教育评价研究的发展经历了三个阶段:20世纪初期至50年代的屏蔽价值关注“目标达成”的阶段、20世纪50年代至70年代的价值渗透关注过程的“方案评价”阶段、20世纪70年代至今的关注价值评定“综合”阶段。研究视域围绕着对教育目标的批评和实施过程的批评得到拓展,其中缠绕着各类教育参与者的价值的融合。
关键词:教育评价;课程评价;价值;目标
20世纪的学者围绕着“如何合理地衡量‘预期目标’和‘实际结果’的存在的差异”的问题展开研究,30年代来自泰勒“目标达成评价”奠定了美国教育评价的基础。随着联邦政府对教育的投入,教育评价取得了繁荣和昌盛,对“目标达成评价”的批评来自两个方面:一是针对教育目标本身的攻击。反对该次课程改革的人们开始质疑课程改革本身是否能满足社会需要,也就是质疑教育目标自身的合理性问题,这就使得原本“中立”的目标评价对自身的价值产生了反思。二是针对教育目标实施过程的关注。这时人们关注的并不仅仅是目标的达成,而是在过程之中所具有的繁复情境,关注在各种情境下的参与者特有的价值立场。教育研究者对教育改革实施过程的关注使得参与者的价值立场凸现出来。这些批评带来了教育评价革命性的发展。与此同时,评价研究配合联邦政府的教育渗透政策,展开新的评价视阈的开拓。
一、屏蔽价值:目标达成的“科学”评价
20世纪30年代,美国俄亥俄州立大学教授泰勒(Ralph W.Tyler)站在课程研制的管理者立场,将评价拓展到教育方案质量的评价。不过,这种拓展受到当时科学管理思想的影响,所谓的方案质量的评价指:将课程视为目标的存在。泰勒宣称评价是“测定教育目标在课程与教学的方案中究竟被实现多少的历程”,而评价的核心就是长存于历史当中的“学习经验(learning experience)的发展”。为此,课程评价的重点工作就是确立客观可信的标准和测量的工具,而工具应该能够囊括“教育目标所期望的行为的任何有效证据”,如纸笔测验(paper-and-pencil tests)、观察(observation)、交谈(interview)、问卷(question-naires)、收集实际作品(actual products)等。30年代早期,泰勒的评价方法在俄亥俄州得以实践。
经济大萧条时期(The Great Depression),学校和其他公众组织遭受资源短缺的困扰。此时,罗斯福总统(Roosevelt)开始进行政治上的新改革(New Deal Program)。在这个背景下,进步主义运动沸沸扬扬,泰勒参与了进步主义的运动,1932年开始领导著名的“八年研究”,并在卡内基机构(Carnegie Corporation)资助下,尝试比较不同学校教育的有效性。泰勒的教育评价(education evaluation)开始将评价拓展到教育方案质量的评价,“八年研究向全美的教育学者们介绍了更加广泛的教育评价,而不只是局限在学生的有效性和测验的范围”。而且,评价确定了预定的目标规范,关注预期目标的实现。泰勒以其研究的结果告诉我们,在预期目标和实际结果之间存在着巨大差异。早期的评价倾向于关注结果的测量,而把作为课程实施的重要环节——课堂和学校屏蔽起来,这种过程“黑箱”很快就引起了学者的反思。20世纪40年代以后,泰勒也对自己的工作进行了反思,其论著在以后的25年中产生了持续的影响。
20世纪40年代到50年代中期,美国城乡里弥漫着贫穷和失望,充满种族偏见和隔离,是一个资源浪费而人们熟视无睹的时代,是工业发展而危害环境的时代。但在经济的带动下,新的学校形式出现,学区的教育形成各种服务系统。社会和教育对教育的需求无限膨胀,但是人们很少关注教育的效率和有效性。不过,评价技术却得到了很大的发展,1947年成立的教育测验服务机构(Educational testing service)。20世纪50年代,联邦资金鼓励并支持专业研究活动,标准化测验已经得到广泛传播,专业组织建立了一系列规范测验指标。1954年,美国心理学家协会(American psychological association)提供《心理测量和诊断技术的具体建议》(Technical Recommendations for psychological tests and diagnostic techniques,简称APA)的报告。1955年,美国教育研究协会(American education research association,简称AERA)和国家教育测量委员会(National council on measurement used in education,简称NCME)发布了《成就测验的技术建议》(Technical Recommendations for Achievement Tests)。1966年,前面三个机构联合发布了“教育和心理测量的标准手册”(Standards for Education and Psychological Tests and Manuals)并于 1974年进行了修订。
此时,标准化测量风靡一时,专家根据可接受的目标或目的建构测验,预先设定不同年龄或年级的常模或标准,用以管理、评级和解释分数的意义。包括性向测验(Aptitude tests)、成就测验(Aptitude tests)以及兴趣、个性和态度测验(Interest,Personality and attitude inventories)。这些标准测验方法看起来满足了科学化的要求,但在实际上却与泰勒规则相矛盾,因为泰勒认可并鼓励目标的差异性。不过,这些技术性的发展为未来评价的拓展奠定了技术的基础。
二、价值渗透:关注过程的“方案”评价
进入20世纪50年代,评估已经拓展到学生学习、课程设计的有效性之外,进入到教育系统、国家发展计划甚至是政策系统。评价者并没有遵照课程评价领域的前辈们的已有研究范围,而是将自己的研究领域拓展到公众领域的政策问题范围。50年代后期,教育领域资源的重组,随之产生了各类课程发展与教育的问题,评价的价值及其伦理问题已经成为评价领域的重要问题。
1957年苏联卫星发射成功的事件之后,联邦政府制定了《国防教育法》(National Defense Education Act,1958)。整个时期,联邦政府开始关注到教育的质量问题,开始资助大规模的评价计划,评价开始从“作为行业(industry)的评价到依靠税收的职业(profession)”。学科专家组织了科学和数学的课程发展计划(curriculum development project),不过很快人们就发现这些课程没有发挥其真正的力量,而且评价者的论著既无助于课程研制,也不对有效性的检测负责。1963年,心理测量专家克龙巴赫(Lee J.Cronbach)针对人们的抱怨,批评评价缺乏相关性和应用性,主张《通过评价提升课程》(Course improvement through evaluation),认为测验项目的分析和汇报有利于教师的教学,并建议课程评价必须聚焦于课程研制过程中课程专家的决策。但是,这并未引起美国教育评价领域学者的关注。
几年之后,情况变得不同了。1965年,肯尼迪总统智囊团的主席休伯特·汉弗莱议员(Senator Hubert Humphrey)和约翰逊总统(President Lyndon Johnson)对贫穷问题展开争论,人们开始将目光转移到社会福利的改革。20世纪早期积累的财富促使联邦政府开始资助这些福利计划。《初等和中等教育法案》(1964)(The Elementary and secondary education Act of 1964,简称ESEA)首次拨出特定联邦资金用于地区教育系统,教育被视为州的责任。随着联邦资金对地区教育的投入,国家开始干涉资金的运用效果。很多资金投入并未如地方宣称的那么理想,因此这些都要求教育者将教育评价转移到实践等支持性研究,学校开始接受ESEA的定期检测。由于评价可以终止或辅助课程项目,因此课程评价研究变得如此重要。费黛奥塔·卡朋(Phi Delta Kappa)联合会建立了“国家评价研究委员会”(National Study Committee on Evaluation),针对评价存在的问题进行调查。1960年后期,大部分美国教育学者都在着手于教育评价的研究,各类人员从不同的领域开始进入到教育评价领域,重新审视教育评价的本质概念。教育评价研究开始进入概念化(conceptualization)过程,这意味着对评价目标、评价对象、实施建议、服务过程,以及测量预定和非预定的结果等问题展开讨论。
1967年,美国教育研究协会(American Education Research Association,简称AERA)的罗伯特·斯蒂克(Robert Stake)对课程评价的研究引发了公众的关注。此时,评价者大多为心理测验学和实验设计人员,因此被人批评为缺乏教育问题的鉴赏力。其实,在1962年AERA会议之后,随着AERA的专论的出版,评价是教育测验的假设已经逐渐被摧毁。争论由此扩大化,就连泰勒(Ralph Tyler)、斯克里文(Michael Scriven)和斯蒂克(Robert Stake)也开始批评心理测验手段是否可以用于满足评价的目的。1967年,斯克里文区分了形成性评价和终结性评价,“形成性评价”不仅仅是作为一种评价形式而被提出,它开启对过程与未来目标的重视。评价不再是单纯的心理测量技术,它需要容纳伦理的、政治的各种价值。到了20世纪70年代,就连专门从事测量的学者伯汉姆(Popham)也在提醒学生要关注伦理维度的新问题。接着,课程实施的过程开始容纳进入课程评价的眼帘。斯克里文的《应答性评价》(Responsive Evaluation,1974)、麦克唐纳(McDonald)的《民主的教育》(Democratic Education,1974)、里庇(Rippey)的《交互式评价》(Transactional education,1973)论著发表,这些论著鼓励参与者通过各种表达形式参与到课程改革中来,将课程改革拓展到更广泛的参与层面。
三、重构价值:关注评定的“综合”时代
1973年,评价领域开始成为一个专业研究和测验的领域。教育评价者的计划在20世纪70年代开始凸显,例如专业杂志《教育评价和政策分析》(Educational Evaluation and Policy Analysis)、《评价研究》(Studies in Evaluation)、《评价和方案计划》(Evaluation and Program Planning)、《评价新闻》(Evaluation News)等陆续产生。专业机构如“五月十二日”(The May 12th Group)、H区域(Division H of AERA)、评价网络(the Evaluation Network)以及评价研究社会(The Evaluation Research Society)专攻评价研究。许多大学也开始设计评价方法的课程(不同于研究方法),例如伊利诺斯州立大学(University of Illinois)、斯坦福大学(Stanford University)、波士顿学院(Boston College)、加利福尼亚大学洛杉矶分校(UCLA)、明尼苏达州立大学(the University of Minnesota)、西密歇根大学(Western Michigan University)。各种形式的专业研究机构开始组建,如UCLA的评价研究中心(Center for the study of evaluation at UCLA)、西北地区教育实验室(Northwest Regional Educational Laboratory)、斯坦福评价联盟(the Stanford Evaluation Consortium)、伊利诺斯州教学研究和课程评价中心(the Center for Instructional Research and Curriculum Evaluation at The University of Illinois)、西密西根大学的评价中心(the Evaluation Center at Western Michigan University)、测验研究中心(the Center for the Study of Testing)、波士顿大学评价和教育政策机构(Evaluation and Educational Policy at Boston College)等。交流会导致各种嘈杂的声音,专业机构之间的合作虽然增多,新的专业组织加强了交流,并降低了评价领域的碎片化。这些机构对评价进行研究,甚至出现了对评价质量进行研究的元研究(meta-evaluation)。学者们在不断寻求适当的方法,增加交流和理解,评价的技术得到发展。
在这个时代,评价者意识到评价技术必满足各种各样的需求,委托人的需求、中心的价值、真实的情况、探究的需要、精确的要求,评价的方法得到了发展,例如,目标游离评价(goal-free evaluation, Scriven,1974,Evers,1980)、支持一对手小组(Adver-sary-advocate teams,Stake & Gjerde,1974)、支持小组(Advocate teams,Reinhard,1972)、元分析(Meta analysis,Glass,1976;Krol,1978)、应答性评价(responsive evaluation,Stake,1975)、自然主义评价(naturalistic evaluation,Guba & Lincoln,1981)等等。此时,更受人青睐的是案例研究(case study),案例分析可以避免破坏其他参与者对潜在事件的透视,它不仅仅作为汇报的方式,更是提供了丰富信息。1980年,12个关心教育评价问题的组织构成了联合委员会,共同发布了文件《教育方案、计划和资料的评价标准》(The standards for evaluation of educational programs,projects and materials),1981由麦格罗·希尔(McGraw-Hill)出版公司出版。
随着联邦政府对教育领域的渗透,评价开始作为政治的行动,评价者以智囊团的方式存在,努力地为相关的政治社区提供信息。克龙巴赫也将评价纳入了政策的领域,认为评价主要是提供信息、思考和决策的材料。20世纪的最后十年,教育评价已经成为一个成熟的专业领域。不过,专业机构之间的合作虽能很好地用于提升行为和提高评价的质量,实际的评价却很少发生变化;而且,人们需要教导评价者如何获得、尝试、反馈和发展新的评价技术。
四、研究发展的两条路径:反思范式的递进
教育投资体系的变革对评价研究的发展提供了物质基础,评价研究问题领域的成熟带来了评价理论的演进。第一,评价对象不断得到拓展,从单纯学生成就评定到教学过程的评定,以课程领域为例,从课程目标的评价到整个课程改革方案(如CIPP模式,即context,input,process,product)的评价。第二,评价目标从单一到多样,从衡量预期目标的达成,到关注实施过程中的即时目标达成。第三,评价标准多元化,随着对实施过程的重视,实践过程的各种参与者的立场开始被评价者关注,这种参与者的价值渗入影响了评价研究的发展。第四,评价方法的宽容,随着评价对象的拓展、评价目标的多样、评价标准的多元,评价方法也发生了相应的转换,从单一的测量方法,到关注实践历程的人类学方法。
对教育目标的攻击、对教育方案实施过程的反思促动了教育评价的发展路向:首先,针对教育目标本身的攻击去除了所谓的客观价值的假象,教育评价的作用从“证明(prove)”走向了“改进(ireprove)”。如1972年,斯克里文提出的目的游离评价(goal-free evaluation,简称GFE)模式,将评价的重点从“课程计划预期的结果”转向“课程计划实际的结果”。他认为一般评价是为了检测“是否能够达成预先存在的目标”,从而忽略了那些积极的非预期的结果。在他看来,评价的原则应该是“有效的结果”而非“目标”,为此评价者必须意识到所有的结果,还要创建一个被评价对象的档案袋。“空白课程”的提出者艾斯特在《教育的想象》一书中提出要以“表现性目标(the expressive objectives)”为标准,进行“启示性评价(illuminative evaluation)”。
其次,为了促进方案的改进,教育评价的对象发生了变化:以课程领域为例,必须针对课程研制的全面过程采取考察。就将课程实施的背景(context)、过程(process)、成果(product)全部纳入评价的范畴,如20世纪60年代的CIPP方案评价模式、60年代后期应用广泛的评价学习中心(Center for the Study of Evaluation,简称CSE)评价模式等。当我们发现课程评价已经转向“教程的决策”、“关于个体的决策”和“行政的调控”的时候,就不得不意识到课程本身所具有的计划性、目的性与组织性。因此,人类学的方法开始作为评价方法的基础,如“应答式评价(responsive)”、“启示性评价(illuminative)”或“案例研究”等。
再次,由于容纳了相当多的评价对象,也就是说将各种时空的人的价值都纳入其中,为此课程的评价标准也发生了变化,从“有效”的功利价值到包含了“生命”原则的伦理价值。故此,人们开始关注课程评价的价值主体、价值主体的需求问题。既然如此,在评价的过程中就需要关注到评价者、被评价者各自的价值立场,注意到评价标准和评价对象之间的匹配,关注到评价手段与评价对象的匹配。现代课程评价研究力图在制定评价标准、收集评价资料、采取评价方法上能够兼顾到更多价值取向。
藉着对评价历史的回顾,我们可以看到直到今天为止,这些变革造就了三个具有差异的评价范式(见图1),每个范式都具有自己的目的、偏好的技术、关注的焦点等等。由此,我们便获得了对研究发展的一种沉思:现代化促使我国的教育研究面临着巨大的危机,我们的学者不得不一边追赶,一边进行着反思,步伐在国际化与本土化之间交替,踉踉跄跄地前进。研究主题的变化代表了一种景况的转变,以及对研究者自身角色和地位的反思。
图1课程评价范式图解
参考文献:
[1][美]泰勒。课程与教学的基本原理[M].中国台北:桂冠图书有限公司,1981.119.[2][美]泰勒。怎样评价学习经验的效用[A].施良方译。瞿葆奎。教育评价[C].北京:人民教育出版社,1989.265.[3]施良方。课程理论——课程的基础、理论与问题[M].北京:教育科学出版社,2000.156.[4][美]斯塔弗尔比姆。方案评价的CIPP模式[A].陈玉琨译。瞿葆奎。教育评价[C].北京:人民教育出版社,1989.298.[5]黄甫全。当代课程评价的价值准则:文化哲学的观点 [A].“课程领导与课程评价的理论与实践”学术研讨会暨第五届两岸三地课程学术研讨会提交论文[C].2002-10-13.[6]王文科。课程论[M].中国台北:五南图书出版有限公司,1988.294.
第四篇:论文评价
关于《经济衰退时期企业的营销策略探讨》
论文的评价
院系 专业名称 班级学号 学生姓名 指导教师
经贸学院 市场营销
2013年4月20日
一、格式评价
格式符合论文写作规范。具体而言,摘要、标题格式正确,小标题的使用使得层次分明、错落有致,字号、字体、页边距、首行缩进等都符合论文的格式要求,但是关键词的格式不正确,原文的关键词是这样的:“关键词:经济衰退;客户组合;产品组合。”词与词之间应该用空格分开,不应该用分号。文章整体给人的感觉还是不错的,整齐得体、层次分明,留下了较好的印象。
二、结构评价
本文的结构安排为:总题目——摘要——关键词——大标题——小标题——参考文献。
可以看出,结构严谨、安排恰当,符合论文写作的规范。这样的结构安排不仅能让作者沿着自己的思路更好的行文,而且还给读者清晰通顺的阅读思路、更方便了解论文的主旨。
三、内容评价
1.摘要
摘要中,首先点明企业与环境的关系,即企业的营销活动受到周围环境的制约。然后又引用了正文中的一句话,道出了经济衰退时期企业所面临的挑战。 优点:摘要主要说明了事情的严重性,给读者一种事态严重的意识,吸引读者阅读。
缺点:摘要仅仅起到引人入胜的作用,并未提及论文的主要内容,读完摘要并不知道论文的大概内容。2.关键词
本文的关键词共3个,分别是经济衰退、客户组合、产品组合,阅读全文可以发现,这三个词分别表示了正文的第一第二部分和第三部分中的两个小部分的主要内容,这些也是作者所想表达的重点,说明作者关键词的选择还是比较合理到位的。3.正文第一部分
这一部分主要介绍了经济衰退的性质与特点,作者依次阐述了经济衰退产生的原因、经济衰退的定义、经济衰退对社会和企业的影响、经济衰退的一些现状、经济衰退的两种极端情况、不同类型不同时期经济衰退的特点及差异、近期美国经济衰退的情况和影响、三个划分经济衰退等级的特征、金融风暴对中国经济的影响。这一部分内容安排合理、行为思路清晰,论证有力、叙事严谨、分析得当、重点突出。4.正文第二部分
这一部分主要介绍了经济衰退对购买者的影响,作者依次阐述了经济衰退对消费者购买行为影响的一般表现、不同收入消费者不同的购买行为变化、经济衰退对工业用户购买行为的影响、经济衰退对企业采购的影响。总的来说,本部分作者通过介绍经济衰退对不同层次、不同领域、不同收入的消费者购买行为的影响,来突出经济衰退的严重性。内容安排方面,感觉有点累赘,很多内容可以略去,重点不够突出。
“因此,由于卖方(供应商)总想尽力与现有主顾保持业务关系,他们不得不认真考虑价格与价值的定位问题。当然,这对他们来说,也是充满新机会的时期。那些能够革新产品、为企业节省费用的卖主,将会受到买主们的欢迎。”这是引用于其他论文的一段,和本段的主旨没有太多联系,更像是一种拓展,没有太大的价值。5.正文第三部分
这一部分是文章的重点部分,作者主要介绍了经济衰退期间企业的营销策略,并进行了客户组合、产品组合与产品设计、定价、分销、广告与促销、销售队伍与顾客服务这六个方面的深入探究。具体而言,作者首先阐述了企业面对经济衰退的一般处理方式、企业面对经济衰退时的反应速度的两种极端情况,然后具体阐述了企业应该采取的营销组合。
客户组合方面,作者主要讲述了企业应该寻找新客户、开拓新市场来扩大市场份额、度过经济衰退难关;产品组合与产品设计方面,作者主要讲述了企业应该开发更具性价比、更能满足市场需求的产品;定价方面,作者主要讲述了企业选择强调价格和强调价值两种不同的策略的利弊、给予顾客回扣等方式;分销方面,作者主要讲述了受经济衰退的影响消费者对购买渠道的重新选择;广告与促销方面,作者主要讲述了企业考虑广告支出预算、广告内容和广告媒体及各种促销措施;销售队伍与顾客服务方面,作者主要讲述了企业对销售队伍的鼓励和培训、对顾客服务项目的取舍。
总的来说,这一部分阐述比较完整,内容比较丰富,分析也比较有代表性,但整体的行为模式不统一,导致读者阅读时感觉比较混乱。例如分销部分:“消费者收入的减少会使他们形成新的购买习惯,到更便宜的零售商店去购买物品。高档百货店的生意就流往那些大众化经销商和折扣商店。经济衰退促使在诸如食品、书籍、运动器械甚至计算机等行业里出现更多新的折扣商店。低收入的消费者也更加热衷于去旧货商店、厂方门市部进行的现场销售。所有这些,都对那些不能摆脱高昂分销成本的企业带来严重的问题,他们看着销售量下降而还不肯马上去寻找售价较低的零售渠道,因为那样会降低利润,影响产品品牌的形象,疏远与销价较高的零售商的关系。企业只企望眼前的经济衰退仅仅是短暂的,马上就会过去,免得改换使用售价较低的零售渠道的麻烦。但是,这个企业忘记了一点,低价零售将会持久存在下去,即使在经济恢复繁荣之后,低价零售也会继续发展的。”只是大概分析了消费者购买渠道的一些变化,并未多角度分析企业应该采取的措施及影响,而且本段行文过去口语化,说理不强。
四、科学性、先进行、独特性评价
科学性:格式符合论文写作规范,结构安排严谨合理,应用参考真实可信;
先进性:多角度面探讨经济衰退的起因、发展、特征及影响,并多层面探讨企业面临经济衰退的营销组合模式;
独特性:研究方向特别,分析深入透彻,文中很多阐述极具参考价值。
第五篇:论文评价
题目:《农村“留守儿童”教育面临的问题及对策》
作者:范先佐
我认为这是一篇方法型教学论文,可以从这篇论文的题目看出来。首先,作者先介绍背景,对当前农村的教育现状的实际情况和客观存在进行详尽的描述与分析,并大量运用数据说明现实问题,引出“留守儿童”的教育面临的一些问题:
1、安全问题;
2、学习问题;
3、品行问题;
4、心理问题。在阐述了出现的问题之后,作者又说明了产生这些问题的原因如下:
1、家庭教育的缺失;2学校管理的失控与教育的失误;
3、城乡长期“二元分割”的结果。在文章的最后部分,作者提出了解决农村“留守儿童”教育面临的问题的对策,分条列述,非常详细具体清晰,并运用小标题,对方法的介绍非常有层次性,让读者可以一目了然。从总体来再看这篇文章,条理清晰,方法阐述明确,非常值得我们来学习。