第一篇:增值性评价与学校效能
增值性评价对学校效能的影响分析
吉林省实验中学
吴龙军
增值评价方法是应改进政府大规模评价学校效能或教师效能的社会需求而产生的,已成为当前教育评价研究的热点之一。增值评价法的主要特征表现为以学生的学业成就的发展水平为评价依据,通过相关的统计分析技术,将学校对学生发展的影响从生源、规模、经费、办学条件、师资水平等诸多相关因素中分解出来,进而将可能比较精确地测量一定时间内学生的进步幅度,计算出学校的效能,即对学生的“净影响”,以此试图发现一些学校的学生是否比其他学校的学生能获得相对较大的发展。
一直以来,人们认为学校作为制度化教育机构,对受教育者的身心发展、社会进步有着重要的影响。然而,1966 年美国社会学者科尔曼的一纸报告《关于教育机会平等性的报告》却凡乎使人们对这一信念产生动摇,从而拉开了有效学校和学校效能研究的序幕。自此,如何客观、准确评价学校效能成为学校效能评价致力于解决的核心问题。伴随着研究方法和统计技术的改进,学校效能的增值评价以其客观、精确地评价理念与技术日益成为学校效能评价的主流。
在国外,学校效能增值评价的研究结果已经成为政府制定教育政策和学校质量评估标准的依据、学校提高教育质量的重要依据和可靠手段。比如1992 年美国田纳西州政府率先采用增值评价系统作为州教育促进法案的一部分。随着达拉斯、北卡罗莱那等州将增值性评价应用于其教育问责制主体框架之中,增值评价正逐渐成为美国教育评价的主流方式。英国政府于20 世纪90 年代接受增值评价法,2006 年学校效能的增值评价模式全面推行,并将增值评价指标作为一项重要的创新性指标加入到已有的评价指标体系中。
目前,我们评价学校效能最为广泛应用的方法是,以原始分数或升学率、优秀率为主要的评价指标确定学校的工作是否有效。社会对这种方法的批评之声同样不绝于耳。以原始分数为关键指标的评价方式,导致人们过于关注一次考试的结果,对那些生源不好的学校不公平。同时,又会导致学校抢好生源,损害教育资源的均衡,导致学校过于关注少数尖子生的培养,忽视大多数学生的发展,损害教育过程中的公平。为了更客观、科学地评价学校效能,许多地方教育行政部门开始在实践中探索新的评价方法。例如,有的地方采取了名次比较的方式,即根据学生人学时的成绩给学校计算一个名次,当学生毕业时,根据学生毕业成绩计算一次名次,根据两次学校排名考察学校的效能。有的地方采取了平均数比较的办法。学校每次考试的平均数除以全区平均数,对学校前后两次的除数进行比较,判断学校是否取得了进步。有的地方将学校效能评价分成若干指标,分项打分,比较前后两次评价的分值之差来衡量各学校的进步幅度。这些方法显然比仅根据学生成绩或者升学率来考察学校效能进步了很多,含有增值思想的萌芽。但是上述方法存在众多的缺陷,仍旧不能从根本上解决学校效能评价中生源差异的问题,学校进步幅度,即增值的计算存在几个根本性问题:
第一,没有基于学生个体的增值进行计算。学校增值的计算是将所有学生笼统地作为一个整体参与计算,而不是在学生个体增值的计算基础上进行的,也没有将起点不同的学生进行分类计算。因此,仍旧是高分学生对学校排名贡献大,从而获得教师更多的关注。
第二,没有学校间的比较。在学校增值计算的过程中只有学校自身的纵向比较,没有与其他学校的横向比较,更没有与其他学校类似起点的学生进行比较.学校间的比较是在增值计算完成后进行的。
第三,难于将所有学校放在一个标准上进行评价。以发展性评价为例,增值是在分项打分的基础上计算的,评价指标体系的设立必须考虑占大多数的普通学校和薄弱学校。评价标准对于优质资源学校常常比较低,因此评价指标需要不断更新以满足优质资源学校发展的需求。但是评价指标的变化又破坏了连续的年度纵向比较的基础,有的地区将优质资源学校的评价体系与其他学校分开,但是不同的评价标淮造成了学校间进步幅度无法进行横向比较。
在教育评价领域中,增值性评价是指通过追踪研究设计,收集学生在一段时间内不同时间点上的标准化测验成绩;基于学生自身测验成绩的纵向比较,并考虑其他不受学校或教师控制的因素对学生成绩的影响(如学生的原有成绩水平、人口学因素、家庭背景信息以及学校周围地区的经济发展水平等);使用多水平模型对数据进行统计分析,可以将上述因素对学生成绩的影响与学校或教师对学生成绩的效应分离开来,追踪学生在一段时间内学业上的变化,考察学校或教师对学生学业成绩影响的净效应,进而实现对学校或教师效能较为科学、客观的评价。
进行增值评价的优点是显而易见的。它以每个学生的原始成绩作为基准,测量学生在学校里的进步幅度来计算学校的增值。这样一来,既可以屏蔽掉生源质量的差异,从而公正、客观地反映学校效能,又可以使得不同起点的学校在同一标准下比较,找出那些最有效能的学校。因此,学业发展水平测量与增值评价的方法对于创新学校评价体系具有重要的参考价值。
与以往基于平均测验分数的横断性评价相比,增值性评价具有如下显著特点:
第一,增值性评价实现了关注点的变化。教育评价中,最常用的评价方式是使用学生成绩原始分数的平均分或升学率作为评价指标,确定学校或教师的工作是否有效。有研究发现,使用原始分数作为学校或教师效能的指标是不准确的,甚至会有误导作用。此外,这种评价方式导致人们过于关注一次考试的结果,过分关注少数尖子生的培养,忽视了大多数学生的发展,损害了教育过程中的公平性。而增值性评价则是基于每个学生的进步来计算学校或教师对学生学业增长的影响,这样就使学校和教师的关注点从个别学生身上转移到更加实质性的问题——每个学生的进步状况如何。
第二,增值性评价保证了更加公平的比较。增值性评价将每个学生的当前成绩与过去成绩进行比较,关注学生的进步和成长,而不是学生成绩的绝对水平,从而改变了以往将学生的学业成绩与平均值或任意制定的标准进行比较的做法。由此对学校或教师效能的评价都是基于学生的进步或增值,这一评价标准的确立,实现了教育评价过程中比较的公平性,有利于激发生源质量差的学校促进学生进步的动力。
第三,增值性评价与绩效责任紧密相连。问责制目前已成为各个国家进行学校效能研究的主要方面,它要求使用学生标准化测验的成绩作为评价对象,以使教育对学生的学习成果负责。评价是问责制的重要组成部分,评价的科学性直接关系到问责制实施的效果。增值性评价本身的特点,为问责制提供了一个良好的评价框架,能够提供对学校和教师更为公平的考察。
第四,增值性评价具有潜在的诊断性功能。单纯的增值性评价不能识别学生成绩差的原因,但是增值性评价是基于追踪设计的研究,因此它能够根据详尽的数据描述识别出学生的成功与失败之处,这将成为学校和教师发现问题作出决策的起点。此外,利用增值性评价的信息,可同时为教师提供形成性评价和终结性评价的信息,从而为教师的自我提升提供依据。
第五,增值性评价能够满足所有学生的需要。增值性评价的基本理念是学校和教师应该保证所有水平的学生都以相同的速率取得学习上的进步,即每个学生在一年内的学业增值幅度应当相同。这就要求学校和教师不能只关注成绩好的学生,而要兼顾所有学生的发展和进步。根据每个学生的需要,采取相应的教学措施,从而促进每个学生的进步,满足所有学生的需要。
增值性评价方法主要有描述性统计分析 —— 多元回归分析 —— 多水平回归分析模型。“增值评价在计量方法上是通过建立投入与产出变量间的回归方程, 量化研究影响学生学习成就的各项因素, 增值即为回归方程的残差值。在统计方法上起初是采用描述性的统计分析以及常用的多元回归分析, 随着对教育活动的多层次嵌套结构的深入认识, 即教育问题中存在着学生属于班级, 班级嵌套于年级, 年级嵌套于学校等现实结构, 而普通的多元回归分析只能对单一层次进行分析的局限, 例如只能在学生层次和学校层次中选择一个层次进行回归分析, 从而丢掉另一层次的详细信息。多水平回归分析模型在近20年中逐步发展成熟起来, 并已应用于增值评价分析,极大地推动了学校效能研究的发展。”
增值评价在学校内的应用以及在教学过程中潜在的诊断功能
线性标准分数 Z ——
是将原始分数与其平均数之差除以标准差所得的商数。
它是“以标准差为单位度量原始分数离开平均数的量数,它可以表示一个原始分数在团体中所处的位置。即告诉我们它在平均数上多少个标准差,或是在平均数之下多少个标准差”。标准分数T计算公式:T = 50 + 10 * Z。
利用 “正态分布常模” 实现个体内差异评价方法之一 —— 对“个体诸侧面的比较”(不同科目之间)而做出的评价。图中的“0”平面为全市平均水平。
在下述的 “团体个体内差异评价图” 中,可以分析出长春东师附属实验学校在高三理科三模考试中的优势学科(生物、语文),薄弱环节(化学、英语)。
在下述的 “学生个体内差异评价图” 中,可以分析出长春第九中张也同学在高三文科三模考试中的优势学科(政治、语文),薄弱环节(地理、英语)。
班级标准分变化趋势的描述(北京四中09班多个学科10次考试举例)详细记录和描述了该学校09班级入学以来10次考试正态化标准分Z的变化趋势。
对高二年级各班级8次考试化学成绩的变化趋势进行分析,形成每个团体学业发展进程的“一个连续的影像”。高二10班呈上升趋势
高二09班呈下降趋势
百分等级分数
—— 百分等级分数是一种相对地位量数,它把参加测验的全体人数作为一百分来计算,从而以某一原始分数换算出其在全体中所占的位置,说明分数比他少的人占人数的百分之几。如一学生的测验成绩为80分,经换算某百分等级分数是73分,即表示参加测验的73%的人低于他。百分等级分数不仅可以表示一个分数在团体中的地位,还可比较某学生多个学科测验或多次不同测验的成绩。
常模10条百分等级线变化趋势的描述(长春德惠实验学校举例)
长春二模、三模考试语文学科,校内常模的10条百分等级线上,(上图)描述了德惠实验学校全校学生变化趋势,(下图)描述了该校46班学生变化趋势。
长春二模和三模两次考试,在常模表中的10条百分等级线附近,描述出每个学校总分的变化趋势:A学校(上图)明显优于B学校(下图)。
长春xx学校二模、三模英语成绩均为全市第二名,看似持平?实际在多条百分等级线上呈退步趋势,净增值Z排名为44名,诊断出该校英语学科教学存在问题?
长春某学校二模、三模考试学科诊断:“常模—等值”法分析多层次学生发展变化。语文:多条百分等级线上呈退步趋势
数学:低等级退步人数增加,高等级进步人数增加
英语学科:多条百分等级线上呈退步趋势
政治:多条百分等级线上呈进步趋势
历史:多条百分等级线上呈进步趋势
地理:各条百分等级上略有小幅度进步
二模、三模备考阶段数据分析 —— 数学试卷难度增加(平均分60.73——47.70),从增值评价的角度,分析原排名前列几个学校的不同反应。
实验中学、十一高中:高水平学生适应难题的能力很强,高水平学校仍然可以有“高增值”。
A学校、B学校:多条百分等级线上呈大幅度退步趋势,各层次的学生适应难题的能力都很差。
我国教育评价领域中,对学校和教师的评价多是一种终结性评价,即以学生测验成绩的均值为标准进行评价。这种单一的评价方法反映的信息并不准确,已受到各方面的批评。为更加科学和准确地评价学校和教师的效能,教育评价领域迫切需要一种新的评价方法。近三十多年来,教育评价领域逐渐兴起一种新的评价方式——增值性评价(value-added Assessment)。
一、增值性评价的起源和发展
针对学校效能的增值性评价起源于詹姆斯·科尔曼1966年向美国国会提交的《关于教育机会平等性的报告》,简称“科尔曼报告”(Coleman Report),该报告虽然没有直接提出学校效能的增值性评价问题,但其研究结论却引发了世界范围内对学校效能的争论,催生了学校效能增值性评价的出现。自20世纪70年代以来,以“科尔曼报告”为起点,学校效能的 10 增值评价研究在世界范围内逐渐发展起来。20世纪80年代中期以前,增值性评价的应用一直受到统计技术发展水平的限制。80年代末,多水平模型技术的发展与完善,为增值性评价提供了精确可信的分析方法。由于英美两国统计技术的发展以及现实的强大需要,多水平模型和增值性评价方法率先在这两个国家得到了充分的应用。
1983年,《国家处于危机之中:教育改革势在必行》(A Nation at Risk:The importance fnr edueaional reform)报告的出台,美国全国上下对教育状况的关注水平空前提高。1989年,美国总统召开五十州州长教育峰会,思考教育问题,制定行动方案,并最终形成了六项国家教育目标。随后,为响应新的教育目标,美国各州掀起教育改革的热潮,并提出了学校问责制的概念。1992年,应此热潮,田纳西州政府率先采用增值评价系统作为州教育促进法案的一部分。达拉斯州也从增值的角度探讨了判断高效能学校的量化程序,并发展了适用于该州的增值性评价系统;此外,北卡罗莱那州、德克萨斯州等也将增值性评价应用于其教育问责制主体框架之中。随着联邦教育法《不让一个孩子掉队》(No Child Left Behind)的出台,增值评价受到越来越多教育工作者的认可和政策制定者的青睐,正逐渐成为美国教育评价的主流方式。
在英国,20世纪80年代末以来,政府每年都公布所有学校以原始分数表示的学生成绩排名表。由于原始分数没有考虑影响学生成绩而学校自身又难以控制的因素,如生源质量等,因而不能公正、客观地反映学校效能。为解决评价上的问题,研究者提出了“增值”概念。英国的增值性评价同美国类似,也是首先从地区水平上发展起来的。国家统一课程的建立及链接国家数据的新资源的出现,为增值性评价在整个国家内推行提供了可能。英国政府于20世纪90年代接受了增值评价法,2002年在全英格兰和威尔士推行学校效能的增值评价模式,2004年和2005年试点,2006年全面开展学校效能的“多元”增值评价,并将增值评价指标作为一项重要的创新性指标加入到现有的评价指标体系中。
此外,随着增值性评价理论的完善,统计技术和相应软件的发展,这一评价方法也逐步在其他国家和地区推广和实施。
三、增值性评价的模型
增值性评价方法发展初期受到统计方法发展水平的限制,但随着相关统计方法的发展,增值性评价方法的统计技术也随之得以完善。目前应用于增值性评价的主要统计模型如下:
(一)概要统计分析
概要统计分析是描述统计分析的一种,它使用一系列描述性统计量对数据的概貌进行描述,如最大值、最小值、平均值、中数、众数、方差、标准差、偏度和峰度等。增值性评价的分析使用学生原始成绩的平均数作为增值性指标,如美国北卡罗来纳州将某学校学生群体连续两年测验成绩的平均增长与本州学生测验成绩平均增长的差值,作为该校的增值指标。这种增值性分析方法使用学生两年内的平均成绩增长作为指标,较传统的依赖于一次测验成绩所进行的评价更加科学、全面,但是其中学校是统计分析的最小单位,因此学生层面和学校层面的其他影响因素没有得到应有的关注,仍是对数据的简单利用。
(二)多元线性回归分析
多元线性回归分析是分析一个因变量与多个自变量之间线性关系最常用的统计方法,这 11 一方法是估计观测值与期望值之间残差值的标准统计技术。以学生水平的数据分析为例,残差值可以解释为某位学生的成绩是高于期望值还是低于期望值,这里期望值是基于样本中所有学生的基线成绩与其学习成绩间的统计关系基础上的。通过多元回归分析得到的残差值,即学生在一段时间内学习进步的“增值”。与概要统计分析相比,这一方法的优点是可以将学生或学校层面的各种影响因素纳入到统计模型中加以分析,如学生的基线成绩、学生的家庭背景信息或学校层面的变量等,从而提供一个更为灵敏的增值指标。但是这一方法的缺点是,统计分析只能从学生层面(估计学生层面的残差)或学校层面(估计学校层面的残差)中两者择其一。因此,如果选择前者为分析单位,那么就无法利用学校群体特性的信息;而如果选择后者为分析单位,则会丧失学生层面的详细信息。
(三)多水平分析模型
多水平模型是针对传统的多元回归分析的不足发展起来的。教育和组织管理等领域的研究中,存在着大量的分层数据结构,如学生嵌套于班级,班级又嵌套于学校等;为了充分利用各个层面的数据信息,迫切需要一种新的统计方法,多水平模型就这样应运而生了。以教育评价领域的研究为例,多水平模型通常将学生水平的数据作为第一层,将学校水平的数据作为第二层加以分析。
McCaffrey等人总结了三类用于增值性评价的多水平模型,包括协变量校正模型、增长的重复横断模型、交叉分类模型。在上述模型的基础上,McCaffrey等人提出了一个学生纵向成绩的广义模型,上述模型均可作为该广义模型的特例。其中,前两个模型可以使用标准的多水平模型软件进行分析(如HLM),并且得到了广泛的应用;而其他的模型则需要专门的软件,由于其计算的复杂性,还没有得到广泛的应用。多水平模型的学校或教师的增值指标是模型中的学校或教师水平对应的残差值,使用的估计方法是限制极大似然估计法,这一方法是基于广义最小二乘法和最佳线性无偏预测实现的。用于分析多水平模型的增值指标的统计软件主要有HLM、MLwin、Lisrel、M-plus、R统计软件以及SAS等。
增值性评价的多水平分析模型充分利用了学生层面和学校或教师层面的数据信息,能将影响学生成绩的外部因素(如学生的前测成绩、家庭背景、学校或教师层面的外部信息等)与学校或教师的效应分离开来,得到学校或教师的“净效应”,实现对学校或教师效能的科学评价。但是,这一方法的估计程序较为复杂,对于那些没有专业背景的家长、教师和学生来说不易理解;此外,估计的过程中可能存在不收敛的情况,这样估计就无法进行,也无法实现对学校或教师效能的评价。
四、增值性评价目前仍需解决的问题及发展趋势
增值性评价作为一种新的教育评价思路,近年来得到越来越广泛的关注,并引发了大量的相关研究。它为传统的教育测验分数的分析提供了新的视角,能够实现对学校和教师效能的客观评价。但是作为一种新的正在发展中的方法,它自身仍然存在一些问题。
第一,目前增值性评价存在几类多水平统计分析模型,这些统计模型对学生数据的处理方式不尽相同,那么到底哪种模型是最佳模型,能够实现对学生成绩的科学分析与分解,需要进一步的研究。此外,虽然复杂的统计方法能够实现良好的统计控制,但是不容忽视的是,统计方法自身存在对现实世界的解释力问题,这在一定程度上削弱了这种新的评价方法的应用与推广。因此,如何借助教育统计的相关研究,既能够深入理解教育问题,又能够产生对现实问题的合理解释,成为增值性评价研究的一个核心问题。
第二,增值性评价采用追踪测验的研究范式,必然产生庞大的数据库系统,因此数据处理的技术支持以及各个数据库之间的有效链接和整合也成为应用者必须要思考的问题。此 12 外,在追踪数据的分析中,不同年份测验的等值是增值性评价的基础。在前述的几种增值性评价模式中,有的采用简单常模参照式处理方式,即将多年的测验分数都转换到同一常模量尺上,有的则忽视了这一问题。这两种处理方式显然都存在严重的问题。这一问题的最终解决也同样需要借助教育与心理测量研究的发展。近年来引起广泛关注的垂直等值,即多年追踪数据的等值方法,有望成为该问题解决的突破口。
第三,增值性评价解决不了所有考试领域都面临的一个难题:很难区分学生真正的学习和为了考试而学习的问题。为了提高测验的成绩,学校和教师会将精力集中在如何应付考试的答案,而不是教授学生知识和技能,这样学生只是在简单的记忆答案,而没有真正的学习。因此,在标准化测验中,保持对考试试题的更新非常重要。
第四,增值性评价的分析过程是一种统计分析,在一定程度上有不准确之处,尤其在平均数周围的数据分析不准确,但在两个极端部分却较为准确。这一点在评价教师时要尤为注意,不能将增值性分析的结果作为人员任命的唯一标准,还要考虑其他的方面,尤其是那些在平均数附近的教师。因此,在应用增值性评价进行教育评估时,需要谨慎解释和使用相应的结果。
第五,目前,增值性评价主要以标准化测验的成绩为基础,而学校为学生提供的是一系列的教育服务,这使得包括增值性评价在内的大部分教育评价仅局限于一小部分的信息,忽视了对诸如音乐、艺术、社会研究和体育教育等不参与测试的科目的教育,这不利于学生的全面发展。
尽管存在上述仍需解决的一些问题,增值性评价作为一种新的教育评价方法,其自身有很多不可替代的优越之处,是这一方法得以广泛应用的有力保证。这一评价方法与仅以一次测验成绩的结果为标准的评估相比,在评价的科学性和客观性上已达到了较高的水平。随着统计技术和方法的不断完善以及教育和心理测量领域相关理论和实践应用的发展,增值性评价面临的一些问题都会迎刃而解。这一方法也必将以其独特的优势在教育评价领域发挥越来越重要的作用,也为教育评价领域方法的创新带来了新的希望。
当前,我国正处于教育改革不断深化的关键阶段,如何评价当前的教育质量,如何借助教育评价促使教育质量进一步提高,增值性评价为我们提供了新的思路。增值性评价的目的在于有效地引导学校从重投入到重过程、从重生源到重培养、从单纯注重结果到关注教育全过程,也正是这些优势推动了这一方法在实践中的应用。我国的教育评价研究文献中最早介绍“增值”概念是在20世纪90年代中后期,但当时并未引起研究者的重视。随着国外绩效责任制的实施和增值性方法广泛应用,对这一方法的介绍和说明也逐渐增多,促进了该方法在我国的发展和应用。
增值性评价每年对学生成绩的追踪思想,为我国教育评价提供了新的思路,借助这一理念,可以建立一个长期追踪学生成绩的系统,同时也包括学生在音乐、美术和体育等方面的发展情况,形成全新的评价理念和方式,从而实现对学校或教师效能的科学评价。
增值性评价结果的应用
多元模型是基于统计学中的回归方法及在回归方法基础上的多水平分层技术建构的。多元模型通过估计观察值与期望值之间的残差值来表示学校自身对学生进步的影响。观察值指的是学生的实际成绩水平,期望值指的是以该学生先前成绩为分析的基线所预测出的学生成绩水平。残差值可以解释为,某位学生在一段时间内学习进步的“增值”。经由多元模型而获得的残差值,为我们提供了一种有关学生所取得的相对进步情况的统计测量方法。这种方法的一个优点是可以将多种影响因素纳入到统计模型中加以分析,如学生学习成绩的基线、13 学生的家庭背景信息等,从而提供了一个比单一考试成绩更为有效的评价指标体系。此外,多元模型能够准确地分析连续几年的时间序列数据,并预测学校增值分数的变化趋势。最后,多元模型不但可以将学生嵌套于学校的特性纳入数据分析中,还可以同时考虑学生和学校两个层次内部的变量之间的关系以及跨层变量间的关系,分析影响教育结果的不同因素的重要程度及其交互作用。其缺点是对统计学知识要求较高,且计算复杂,对教师和家长来说,理解起来有一定难度。
增值性评价中变量的选择要评估学生在一段时间之内的学业进步情况,不仅需要有学生在该段时间起点的学习成绩,也就是学生的前测成绩,还需要有学生在该段时间结束点的学习成绩,即后测成绩。另外,还要收集学生个体变量和家庭背景变量,这些变量虽然不能被学校所控制,但是却会对学生的学习成绩、学生学习的相对进步有影响,会导致对学校教育质量的评估结果产生偏差。因此,需要将其作为统计分析中的控制变量。在运用多元模型对学校教育的结果进行增值性评价时,英国学者通常考虑的变量包括学生的前测成绩、后测成绩、学生的背景变量、学校的背景变量等。
学生的前测成绩和后测成绩是指同一学生群体前后两次的考试成绩。学生的后测成绩可作为结果变量,前测成绩因为代表着学生的起始能力水平,属于不受学校控制的因素,但其影响着学校教育的结果。因此,可将前测成绩作为影响学校教育结果的控制变量。根据先前的研究,影响学生成绩的学生背景变量主要包括学生的贫困情况、学生所在地区的贫困情况、学习的辅助要求、特殊教育需求、流动性、性别、年龄、种族等。因此,在统计分析时,这些影响学生成绩的学生背景变量应成为评估学校教育质量的控制变量。同样,根据前人的研究结论,在影响学生成绩的控制变量中,在学校水平上我们选择了学校先前的成绩水平和学校先前成绩的差异水平2个变量。因此,增值性评价模型中的控制变量包括0个学生水平变量和2个学校水平变量,通过建立多元模型评估来自学校的因素对学生学习进步的影响。
增值性评价结果的应用英国政府通过提供每一年学校的增值分数,为家长和公众提供更广泛的信息。学校也可以利用政府提供的增值数据进行自我评估。例如,检查教学工作和学生工作的成效、找出影响增值的可能原因、制订和推行改善计划、订立具有挑战性和可行性的目标等。学校还可与家长分享自评结果,促进家校合作。对于教育管理者来说,可以通过学校的增值分数来证明资金分配的正确性。此外,增值分数还可以被用来筛查需要特殊关注的学校。例如,对增值分数低于全国平均水平的学校应给予格外的咨询支持,而增值分数高的学校应与其他学校分享成功经验。
增值性评价的结果也可以用来考察政策改革或创新本身的有效性。比如,正在进行政策创新的学校,其在政策实施过程中的增值分数会相对偏低,与某一年的增值分数相比,增值分数的变化可以更有效地说明政策本身的适用性,即这种年与年之间的增值分数的变化表明了接受政策创新的学校和未接受政策创新的学校相比所取得的相对进步情况,同时也表明了接受政策创新的学校在政策创新前后所取得的相对进步情况。此外,通过在政策创新上使用增值性评价的统计模型,使得教育政策的制定和教育资源的配置更有针对性和科学性。以增值指标来评价学校的教育质量在英国已经实施多年。
第二篇:学校效能的增值评价—对河北省保定市普通高中学校的实证研究
学校效能的增值评价——对河北省保定市普通高中学校的实证研究
【标题注释】本文系中英“学校评价创新和改善学校教育质量的策略”合作研究成果,中方合作机构为中央教育科学研究所,英方合作机构为英国布里斯托大学。在此向英国文化委员会对该合作项目的资助、河北省保定市教育局对数据采集工作的大力支持表示感谢。
【内容提要】学校评价在教育评价体系中处于核心地位,它直接影响着对教师评价和学生评价的原则以及学校的发展方向。运用增值评价学校效能是当前学校评价研究的重要内容。对河北省保定市普通高中学校效能进行实证研究结果表明:60%~80%的高考成绩校际差距都不是学校本身所导致的,在提高学生进步幅度方面,不同学校间存在明显差异。增值评价结果与高考分数评价结果存在较大差异;学校效能在不同学科间没有显著差异;学校对不同学生群体的效能无差异。学校效能的增值评价对于创新学校评价体系具有重要的参考价值。
【摘 要 题】教育评价
【关 键 词】学校评价/学校效能/增值评价/多水平模型
【正 文】
一、学校效能的增值评价理论综述
学校效能评价被认为是评价学校在控制生源和学校背景等外部因素的条件下,与其他条件类似学校相比,其达到目标的程度,是对学校工作绩效“净”影响的评价。对学校效能的研究存在多种模式,序润斯根据发展阶段将其总结为五个基本模型:关于教育机会平等的研究模型、教育生产函数模型、补偿教育项目的评价模型、有效学校研究模型和有效教学研究模型,在各研究模型中又有不同的效能测量方法和计量模型。①
增值评价属于教育生产函数模型,与一般的教育投入—产出分析模型不同,增值评价的主要特征表现为以学生的学业成就为评价依据,通过相关的统计分析技术,将学校对学生发展的影响从生源、性别、民族等诸多相关因素中分解出来,进而测量一定时间内学生的进步幅度,以此试图发现一些学校的学生是否比其他学校的学生能获得相对较大的发展。②学校效能增值评估研究有以下基本特征:
(1)量化研究为主;(2)综合性;(3)应用性;(4)国际性。
二、研究数据和方法
依据项目实施方案,所有数据均从河北省保定市直接采集,其中包括90所普通高中学校2005年的高考和2003年的中考数据,另包括其中27所学校的学生问卷和学校背景问卷。学校情况调查的数据包括:学校所在地、大小、类型、级别、经费、办学条件、师资水平和校长情况等共19项指标。有关学生的数据包括以下几方面:
1.2005年学生高考成绩
根据分析需要共分为六类成绩指标:文科总成绩(语文、英语、文科数学和文科综合)、理科总成绩(语文、英语、理科数学和理科综合)、所有学生的语文成绩、所有学生的英语成绩、文科数学和理科数学。所有的分数均采用标准化处理(平均分为0,标准差为1)。
2.2003年学生中考成绩
依据高考学生信息,从保定市学生中考成绩库中提取相对应的学生中考信息。根据保定市中考要求,2003年学生中考共包含五门课程:语文、数学、英语、文科综合和理科综合。与高考成绩的处理相类似,所有的中考成绩也进行标准化处理。
3.学生背景情况
为进一步分析学生背景因素对学生学业成就的影响,在对27所学校的学生抽样调查中,采集了学生的背景因素,其中包括学生的性别、年龄、所学专业、课外辅导情况、父母亲受教育程度和家庭收入等共16项指标。
在分析中生成两个变量:一个是学生的学习能力指标,它是基于学生的中考成绩总分,取其最高的25%,中间的50%和最低的25%为三个等级,以此考察不同学习能力和水平的学生对高考成绩的影响;另外一个是学校的学生成就水平,它是基于学校学生中考的平均成绩,分为较高的25%,中间的50%和较低的25%三个等级,以此考察不同学校生源的差异对高考成绩的影响。
基于采集到的数据情况,为验证学校对学生学业成就的影响,建立了包含学校和学生的两种水平分析模型。与一般的多重回归相比,本文中的两水平模型考虑到了学校与学生之间的嵌套问题,它可以将学生和学校这两个分析单位同时纳入模型中去从而更加准确地分离出学校对学生的影响。同时,在本文的分析中,只考虑回归方程中截距项的分层变化,而不考虑回归系数变化情况。其基本形式如下:
在模型计算中,逐一引入相关变量建立以下六个模型,以考察和比较各相关变量的影响。
模型1:方程右边只有截距项,其目的在于它可以作为参照模型,为下述模型的比较提供依据;
模型2:方程右边加入中考成绩,考察中考总成绩和各科成绩对高考成绩的影响效果;
模型3:方程右边加入学生背景变量,90所学校数据中只有学生性别一项学生背景变量,27所学校中有16项学生背景因素变量数据;
模型4:方程右边加入学校背景变量,90所学校模型中有生成的学校等级变量,27所学校中有19项学校背景因素变量数据;
模型5:方程右边加入中考成绩和学生背景变量,考察中考成绩和学生背景两个因素对学生学业成就的影响;
模型6:方程右边包括所有因素,将所有变量加入模型中作为自变量,考察和比较自变量回归系数的大小及变化情况。
通过对各模型的比较,确定最终分析模型。所有模型的估计中均采用MLwin 2.02软件进行计算,所采用的回归估计的方法是迭代广义最小二乘法(Iterative Generalised Least Squares, IGLS)估计。③
三、实证分析结果
采用分析软件对数据进行统计处理,分析结果如下。
1.学校的教育教学差异并不是造成高考成绩校际差距的主要原因
与单纯地依据原始分数评价不同,多水平模型下的增值评价能够直接反映学校教育管理、校园文化等因素对学生学业成就的影响,而将学校自身不能控制的因素排除在外。将河北省保定市普通高中学校按照其学生中考时的平均成绩分为三类,生源较好的25%的学校为第一类,中间的50%为第二类,较差的25%为第三类。分析结果表明:生源较差的学校其高考成绩明显低于生源中等和生源较好的学校;而生源较好的学校其高考成绩明显好于其他学校。研究发现:不同学校高考成绩的校际差距,60%左右可归因于所招收学生在中考成绩上的差异;如果再将学生详细的家庭背景与学校背景因素考虑在内,则可解释80%左右的高考成绩校际差距。
可见,学校间教育教学质量的差距并非完全是由于学校自身工作不力造成的,与学校的生源、经费、办学条件等外部因素亦密切相关,而这些因素上的差距是历史和社会综合原因形成的,责任不应该完全由现在的学校来承担。
2.在提高学生进步幅度方面,学校间存在明显差异
采用多水平模型软件Mlwin对模型6进行计算,将学生中考成绩、家庭背景、学校情况等相关因素对高考成绩的影响都考虑进去,可以得出学校的效能排名。针对保定市高考的具体科目,可以计算出文科总成绩、理科总成绩、所有学生的语文成绩、所有学生的英语成绩、文科数学和理科数学等六个方面的各学校排名。以文科总成绩和理科总成绩的学校效能分析为例,保定市90所普通高中学校的文科成绩中,有28所学校的效能低于平均水平,有24所学校其效能高于平均水平;在理科成绩中,有25所学校的效能低于平均水平,有17所学校其效能高于平均水平。
3.增值评价结果与高考分数评价结果存在较大差异
模型1中没有考虑其他因素对高考成绩的影响,其计算结果只考虑高考成绩的学校排名,为比较增值评价结果与高考分数评价结果,将模型1计算出来的学校排序结果与模型6计算的学校排序结果进行比较。
从中可以看出,90所学校按照增值从低到高依次排列,而按照高考分数的排名与增值对本研究中90所学校的评价而言,虽然两种评价方法产生出来的学校排名相关性检验中,其斯皮尔曼系数仍然显著,但无论是考察学校的文科学生还是理科学生,有1/3的学校存在此种情况:采用原始分数评价时的学校排名与采用增值评价时的学校排名间的差距在20名以上。在高考分数排名中较高的学校,其学校效能并不一定也相应较高,反之亦然。
4.不同学科间的学校效能显著相关
从总体上看,学校效能在不同学科间没有显著差异,但部分学校在具体学科和专业上具有较强的效能优势。计算并检验90所学校在各学科间效能的相关系数,可以看出学校效能在不同学科间显著正相关。但在90所学校中,编号为8、85和47的学校在所有的学科中,其学校效能都是相对稳定的;而学校20的文科效能明显高于理科,学校52在理科效能上是最好的,但在文科上却一般。
5.学校在提高男生、女生以及不同学习能力的学生学业进步幅度上不存在分化和区别对待现象
从整体上看,学校在促进男生、女生以及不同学习能力的学生的学习提高上较为一致。按照性别和学习能力对学生分组,进一步考察学校对不同学生群体的效能差异。计算并检验保定市90所普通高中学校中各学生群体间学校效能的相关系数,结果表明,学校在提高男生、女生以及不同学习能力的学生学业进步幅度上显著相关。
四、讨论和建议
学校评价在教育评价体系中处于核心地位,它直接影响对教师评价和学生评价的原则以及学校的发展方向。本研究给我们以下启示。
1.以增值评价为手段,促进学校均衡发展
与传统的仅用学生的某次考试成绩、学校的升学率作为评价指标相比,增值评估用于学校评价将科学反映学校教育教学工作绩效,有助于公平合理、科学全面地评价学校,促进学校特色建设,从而促进学校均衡发展。本研究表明,60%~80%的校际差距不是可以由学校控制的原因造成的,这些因素包括学生家庭的社会经济背景和学校资源的先天差距等。如果对学校的评价单纯以学生“出口”差距而不考虑学生的“入口”差距,对相当大一部分学校而言是不公平的。特别是在对普通高中学校的评价实践中,还主要是实行以学生高考成绩为导向的学校评估,以学校考上名牌大学的学生数作为考核学校工作的指标。这种过于简单化的评估手段必然导致学校走上以片面追求升学率为目标,以抢夺优质生源为工作重点,以换取资源倾斜投入为动力的非均衡发展道路,其最终结果是好学校越来越强。差校越来越差的“马太效应”愈演愈烈。
而实行以学校提高学生进步和发展幅度为目标的附加值评价,将有效地引导学生从重投入到重过程,从重生源到重培养,从单纯注重结果到关注教育全过程。特别是对于那些各方面基础条件较差,长期得不到重视而仍然付出了大量工作的学校,增值评价能够充分反映出他们的努力程度,从而科学合理地反映每一所学校的工作绩效。
2.建立增值评价指标,完善学校评估指标体系
本研究表明,虽然增值评价结果与原始分数评价结果有较大差距,但对学校效能的增值评价并非全面否定现有的评价体系,而是对现有评价指标体系的补充和深化。事实上,真正是高效能的学校其在传统评价体系中也是好学校,在传统评价中最差的几所学校其在效能增值评价中也仍然是较差的。
在国外,增值评价指标也被作为一项重要的创新性指标加入到现有的评价指标体系中。在英国,由政府正式发布的学校评估指标体系中有三个主要指标:学生缺课率、毕业考试的通过率和学校的增值指标。④这三个指标各教育主管部门可根据评价的需要各取所需。由经济合作与发展组织(OECD)研制的教育系统国际指标体系(INES)也正考虑将增值指标纳入,以增强国际间学校效能比较的效度。⑤对照我们现在的学校评估指标体系,其主要问题之一就是评估指标单一化,缺少对教育教学过程和学生成长的有效评价。因此,建立学校增值评价指标,对完善我国学校评估体系具有很好的参考价值。
3.以增值评价为导向,促进学校的特色发展
增值评价不仅是对学校的总体效能进行评价,还可以评价学校内部不同学科、不同人群的效能。本文的分析结果也表明,部分学校在不同的学科上有突出的效能,如果我们进一步拓展效能的评价范围,还可以对学校内德育、学校管理等各方面实施效能评价,从而更有效引导学校多元发展。因此,增值评价方法不同于传统的鉴定性评价,而是强调学校自身的进步幅度以及其独特的效能表现。例如有的学校可能整体效能不高,但可能对学习基础不好的学生有较好的效果,这就可以形成增值评价体系下的学校特色。
此外,增值评价将关注教育的重点从资源投入转到学校内部的教育教学管理,从学校硬件建设转到学生的进步幅度。这种转变一方面反映了当前世界范围内社会发展对加强教育内部绩效评价的必然要求,另一方面也有利于切实帮助学校提高效能,强化责任,实现科学发展。
本文的研究是基于河北省保定市数据进行的。虽然研究中有90所学校的学生考试数据,但仅有27所学校的学生背景因素和学校背景因素问卷,因此本文中并没有深入讨论学生学业成就的影响因素。而且增值方法的局限性也是显而易见的:如学校的功能和价值不仅仅在于提高学生的认知水平和学业成就,而是包括情感、态度、价值观等多维目标,所以,用单一的学生成绩指标来测定学校效能是远远不够的。有一些学者已经在开始尝试使用多种指标,诸如学生辍学率、转学率、学生的情感态度测量值等来丰富和完善学校效能评价体系。⑥
更精细的分析还可以考虑随机系数模型,即考虑各学校效能影响因素在不同学校间的变化情况。此外,学校效能增值评价的稳定性也是一个需要重视的问题,需要进行较长时间的跟踪分析才能得出更为合理的结论。
注释:
①Jaap.Scheerens, Improving school effectiveness, United Nations Educational, Scientific and Cultural Organization, 2000.②⑤Jaap scheerens, Cees Glas and sally M.Thomas.Educational evaluation,assessment, and monitoring, a systemic approach.Swets & zeitlinger publishers.2003.③Harvey Goldstein, Pan Huiqi, Terry Rath and Nigel Hill, the use of vale added information in judging school performance, institute of education university of London, 2000.④Lesley Saunders, A Brief History of Educational “Value Added”: How did we get to where we are? School effectiveness and school improvement, 1999, Vol.10, No 2.⑥Russell W.Rumberger, Test Scores, Dropout Rates, and Transfer Rates as
Alternative Indicators of High School-Per-formance, American Educational Research Journal, 2005, Vol.42, No.1.【参考文献】
[1] James s.Coleman, et al.Equality of education opportu nity, US department of health, education and welfare, 1966.[2] Sally Thomas.Evaluation of RSSI Using Value Added Measures of School Performance.Final Project Report, 2001.[3] Lesley Saunders, ACCOUNTABILITY MECHANISMS AND PROCESSES:
'Value Added': Telling the Truth about Schools' Performance?.worldbank.org/education/est/resources/topic%20papers/Valueadded, doc.[4] Ren Chunrong.A Pilot Assessment on Secondary School Effectiveness in Beijing with Vale Added Models.Project Report, 2001.[5] Yang Xijie, The Effect of Schools on College Entrance Examination Achievement, Project Report, 2003.
第三篇:学校增值评价工作阶段性总结
《增值评价起点报告》使用情况阶段性总结.增值评价,作为一种目前在国际上广泛使用的学校评估模式,能在某种程度上克服以单一升学率为导向的学校评估模式所带来的诸多弊端,对推进我国教育的均衡发展,对于实现教育教学公平起到积极的促进作用。自从我省开展中小学教育水平增值评价体系工作以来,我校组织全体教师认真学习了关于“增值评价”体系的相关理论,明确了在中小学开展增值评价工作的目的和意义,提高了全体教师对此项工作的认识和重视,并在此基础上,按照上级有关部门的安排和部署,科学有序地开展了增值评价起点测试工作和对测试起点报告的分析与使用工作,现做阶段性总结如下:
一、加强学习,提高对增值评价工作的认识
学校利用业务学习时间,集中组织全体教师对增值评价体系相关理论进行学习和讨论,提高了广大教师对此项工作的认识和重视,并且在全校形成了以下共识:
1、强调发展性评价标准
增值评价以学校教育活动对学生预期成绩的增值为教育评价标准,用来判定教师、学校对学生学业成长的积极影响,通过对学生最终的成绩与最初成绩所作出的预测值进行比较,对学生进行纵向的发展性衡量,从而看出学校与教师给学生带来的学业进步。
2、重视起点关注过程
教育增值评价注重学生的进步,关注学校对学生的增值效能。除了关注学生起点水平和毕业时的最终发展水平外,还充分重视学生这一学校“产品”在学校几年发展过程中各种因素的影响,认为学校的产出是“输入”和“过程”共同作用的产物。
3、分清责任、促进改进
增值评价采用量化分析技术,给学校和教师提供了一种较公平的责任尺度,也是对学校更客观公正的评价。
二、基线测试起点报告结果情况分析
基线测试起点报告从学生基本情况、学习动机与风格、学生学习背景、影响学生学习成绩的相关因素、学生认识水平、各学科不同水平上的人数比例、学生各科得分分布、学生各科成绩与认知成绩之间的关系等诸多情况进行了科学、系统的统计与分析,门类齐全,数据详实,分析细致,科学系统地反映了本地区学生的学习水平和基本学习状态,并且直观地反映出我校学生与本地区学生在各方面的差距与不足,使学校、教师能一目了然地看清自己在全区、全校、全班所处的水平和位置,明确今后的努力方向和目标,从而更有效地制定出符合本校本人校情教情的、更切实可行的工作措施和方法。
可以说,基线测试起点报告具系统性、科学性、全面性、直观性、比较性与一体,是一份不可多得的指导性文献,对学校和教师本人的发展,对提高学生的综合素质和学业发展水平将起到不可估量的作用。
三、我校对基线测试起点报告使用情况
增值评价起点报告下发以来,我校大量翻印,从不同层面进行了研究、学习和分析,明确形势,找准位置,看到差距,深挖根源,研究出路,制定措施。
首先,学校组织校教学质量领导小组成员研究学习,明确我校在全区的位置,分析我校自身的优势与不足,找出与全区兄弟学校的差距,研讨今后工作的出路与方法,找准切入点,制定下一步工作的方法与步骤。踏踏实实,一步一个台阶,不求一步赶上,但求步步提高。
第二步,教学质量小组成员深入学科,包干到组。引导学科组对照起点报告学习分析,明确我校学科教学在全区所处的位置,联系我校多年来的教情、学情、地区家庭教育情况等,分析目前情况的形成原因,探究改变现状的措施和方法,制定阶段性工作目标和近期工作步骤和方法。
第三步,集体备课小组利用集体备课时间,明确学科组阶段性工作目标,将目标分解落实到单元教学与课时教学之中,力求人人有目标,日日有进步,节节有收获。
四、在线免费使用增值评价系统情况
由于我校的网络资源条件限制,对于增值评价软件系统的使用还不是很到位,但现在学校正在加强对此项工作的重视和安排,要求看得懂,说得清,用得好。
五、对质量监测工作存在问题及下一步的工作建议 初中生入学水平基线测试项目与地区和学校组织的教学质量检测有所不同,首先,要保证监测标准与国家要求的一致性。学生的学习质量标准需严格依据国家课程标准的要求制订,避免了不同地区采用不同监测尺度。二要保证监测内容的全面性,监测内容不仅包括学校、学生情况,也应该涉及到学生的家庭情况或其它因素。如:父母文化程度、课外图书阅读量、对不同学科的学习兴趣。这些背景信息的收集,将为学校教育教学提供诊断分析与对策指导。三要保证监测的周期性,在分析学校当年学生学习状况的同时,更关注跨的发展比较。初中生入学水平基线测试项目的开展是变革传统评价制度的新尝试,是教育行政管理部门准确掌握学校教学情况并科学制订教育政策的有力抓手。要着眼项目的长期效益,坚持稳步推进,逐步完善的原则,积极促进评价、管理、教学三者的良性互动,有效推进义务教育教学质量的稳步提高。
第四篇:企业效能监察方法“四性测试与评价模型”
企业效能监察方法“四性测试与评价模型”
作者:樊光中
“四性测试与评价模型” 是以流程为监察对象的效能监察关键方法技术。以企业的业务流程的运行效能为基本分析单元,建立企业管理效能“四性测试与评价模型”即以企业管理效能的充分性、符合性、有效性和适宜性四个维度为基本框架的测试与评价结构是现代企业效能监察方法的核心内容、主要理论与主要技术特征。
“四性测试与评价模型”解释如下。
1、制度建设充分性。按照企业内部控制理论、风险管理理论、业务流程理论等现代企业管理理论,建立企业生产经营核心业务流程的控制制度体系框架要素指标,对照这些框架要素指标形成测试与评价指标,测试与评价业务流程现有控制制度体系内容的框架要素与过程结构是否齐全、完备即测试与评价制度建设情况的充分性。充分性是针对业务流程控制制度体系的系统风险中制度盲区、制度空缺风险而言,即业务流程控制制度体系建设覆盖业务行为全过程的充分、完备程度。充分性测试与分析一般采用审阅与询问相结合的监察方法,目的在于评估目前企业业务流程控制制度体系覆盖业务行为过程的充分性情况,并且发现制度盲区和制度空缺。
2、业务过程符合性。按照企业针对业务流程建立的现有有效控制制度体系的内容,建立检验业务行为过程是否符合制度要求的测试与评价指标,对业务人员的经办业务的过程符合企业业务流程现有的控制制度体系的情况进行测试与判断。符合性是针对业务执行过程偏
离、执行偏差风险而言。制度体系的建设最终目的在于贯彻执行后对企业业务过程发挥控制与规范作用,实现业务的预期控制目标。符合性测试与评价过程是对业务行为过程执行企业现有业务控制制度体系的情况进行符合性测试与判断,一般采用穿行控制性测试、审阅、观察与询问等监察方法,其中的穿行控制性测试方法是符合性监察的主要方法。
3、执行结果有效性。按照企业管理层确定的各业务绩效考核目标,建立业务执行结果有效性测试与评价指标,对业务执行的实际结果是否达到预设的管理与经济绩效指标进行对比测试与评价。有效性是针对业务执行行为结果失效风险而言。所有的制度要求和业务管理都必须以实现企业预期的业务管理目标与经济绩效为标准,业务执行有效性测试与评价过程是对业务流程运行、业务执行结果的有效性进行测试与认证,一般采用指标对比、审阅、观察与询问等监察方法,其中的指标对比方法是有效性监察的主要方法。
4、制度设计适宜性。按照企业业务流程理论、PDCA循环原理等理论建立业务流程的过程程序控制指标,并形成检验业务流程现有的过程程序控制制度是否科学合理、经济有效的制度设计适宜性测试与评价指标。对业务流程控制制度体系设计本身内容的科学合理、经济有效情况即适宜性进行测试与评价。适宜性是针对业务流程控制制度体系的系统风险之制度体系控制功能丧失风险而言。有制度并不一定就能够具有控制业务过程、管理风险的作用,制度设计必须科学合理、经济有效即适宜。制度设计适宜性测试与评价过程是对业务流程的控
制制度体系本身进行适宜性测试与分析,一般采用穿行实质性测试、审阅与询问相结合的监察方法。
制度建设充分性、业务执行符合性、业务执行有效性和制度设计适宜性四个方面是测试与评价企业业务流程管理效能的有机统一体,不可分割,四个方面是一个完整的PDCA循环测试与评价过程。充分性和适宜性是监察制度建设的两个维度,符合性和有效性是监察制度执行的两个维度。效能监察实质是对制度建设与制度执行两个方面的监督管理。
“四性测试与评价模型”的有效运用,可以360度、深度发现我们企业管理中的问题,找出管理改进的方向,真实实现效能监察“再监督、再管理”作用。
第五篇:学校学生终结性评价
安阳乡五一中心小学 2014—2016学生综合评价体系
为全面落实《中共中央国务院关于深化教育改革全面推进素质教育的决定》的精神,依据《基础教育课程改革纲要》,结合我校实际情况,制定以下方案。
一、指导思想
坚持形成性评价与终结性评价相结合,以日常评价和学生的成长记录为基础,力求内容全面、客观,程序科学、规范,关注学生的全面协调发展,关注学生的特长和潜能,发挥评价促进学生发展的功能,建立科学的小学生发展性评价体系。通过评价,使学生不断认识自我、发现自我、完善自我,实现教学预定目标,促进学生综合素质不断提高。
二、基本原则
(一)发展性原则。评价坚持学生的全面发展,注重学生发展过程,提高学生综合素质,培养学生创新精神。
(二)过程性原则。评价要关注学生成长历程,把日常评价、成长记录与学科模块测试结合起来,把纸笔测试与平时作业、课堂表现、情景测验、行为观察、实验操作等结合起来,实现评价方式多样化。
(三)激励性原则。评价要最大程度调动学生的积极性,肯定成绩、表彰先进、树立榜样,使学生发扬优点、改正缺点,从而使评价成为一种激励学生不断发展的动力。
(四)科学性原则。评价要遵循教育规律与学生身心发展规律,建立科学的评价体系,运用科学的评价方法,努力获取学生的全面信息,关注学生的个性差异及特长发展,扩大评价的涵盖面。
(五)互动性原则。评价要突出学生的主体地位,通过交流互动,实现学生自评、学生互评、家长参评和教师评价相结合,实现评价主体的多元化。
三、评价内容与评价标准
(一)评价内容
小学生综合素质评价主要包括基础性发展目标和学科学习目标两项内容。
1.基础性发展目标主要有:道德品质与公民素养、学习愿望和能力、交流与合作、个性与情感、创新意识和实践能力、运动与健康、审美与表现。
(1)道德品质与公民素养:培养爱国主义感情、社会主义道德品质(爱祖国、爱人民、爱劳动、爱家乡、爱科学、爱社会主义,遵纪守法、诚实守信、维护公德、关心集体、保护环境等),积极参加社会公益活动,主动维护民族团结,具有一定的社会责任感。逐步形成积极的人生态度和正确的价值观,提高文化品位和审美情趣,养成自信、自尊、自强、自律、勤奋行为习惯。
(2)学习愿望和能力:具有主动学习的愿望与兴趣,能够明确学习目的,端正学习态度,养成良好的学习习惯,能够结合所学的知识,运用已有的经验和技能,独立分析并解决问题,具有初步的研究与创新能力。
(3)交流与合作:能够使用普通话主动与他人交流与合作,积极参加各项文体及社会实践活动,勇于发表自己的意见。能认真听取他人的意见和建议,评价和约束自己的行为,并学会尊重和理解对方。
(4)个性与情感:能够注重情感体验,逐步形成自己的精神世界,对生活、学习有积极的情感体验,能积极乐观地对待困难,逐步养成勤奋、自律、宽容、自强的个性品质。
(5)创新意识和实践能力:具有初步的创新能力(包括;创新精神、创造性思维和实践能力三个方面)和一定的收集、处理信息的能力。能主动参与教学环境,养成学习的独立性和自主性,具有乐于动手、勤于实践的意识。学会质疑、调查和探究,在实践中学习,在实践中成长,使学习成为在教师指导下主动的、富有个性的过程。
(6)运动与健康:热爱体育运动,积极参加体育锻炼,掌握一定的运动技能,拥有健康的体魄。具有一定的安全、自我保护意识。养成良好的心理品质,形成健康的生活方式。
(7)审美与表现:拥有健康的审美世界,学会欣赏美,感受美,表现美。积极参加各项艺术活动,能用适当方式进行艺术表现或有一项艺术特长。
2.学科学习目标
学科学习目标即各学科课程标准中列出的学习目标和各个学段学生应该达到的目标。
(二)奖项内容和评价标准: 三好学生
“三好”的评价内容主要包括“在学校做个好学生”、“在家里做个好孩子”、“在社会做个好小公民”三个方面。
1.“在学校做个好学生” 主要评价指标有:遵守校规校纪,尊敬师长,认真做好值日工作,爱护校园环境,善思爱学,按时独立完成作业,学习成绩良好;
2.“在家里做个好孩子” 主要评价指标有:礼貌待人,尊老爱幼,关心父母、长辈健康,每天帮助父母做一些力所能及的事,自己的事自己做;在家有良好的学习、生活习惯;
3.“在社会做个好小公民” 主要评价指标有:遵守交通规则,遵守公共秩序,尊老爱幼,不出入不适应青少年成长场所,见到邻居有礼貌,不随便乱扔垃圾,爱护环境卫生。
二、优秀学生干部 评价标准
1.思想上积极要求进步,作风正派,遵纪守法,顾全大局,团结同学,无受处分的违纪行为。
2.学习目的明确,态度端正,成绩优良。
3.热心学生会工作,全心全意为学校、师生服务,工作积极主动,认真负责,公正无私,任劳任怨,对本职工作完成好,并做出一定的成绩。
4.坚持原则,敢于同不良现象作斗争,具有一定的组织领导能力,5.学生会干部在参加各项例会及活动时,必须按时出席。在一学期内无故缺席两次以上,迟到四次以上,工作上有失误的,取消“优秀学生会干部”的评选资格。
6.学习能力、交流与合作、个性与情感、创新意识和实践能力、运动与健康、审美与表现等方面的评定等级分A、B、C、D四级。凡符合标准并有突出表现,且有详细、明确证据的(以附件形式提供),经学校综合素质评价工作领导小组审定确认,可评定为A;凡符合基本标准者,可评定为B或C;不符合基本要求者,评定为D。凡评定为A等级的学生,必须有突出表现的有效记载,否则,视为无效。
有下列情况之一者,可在学习能力方面评定为A:学习主动、积极,各科成绩一贯优秀;小创造、小发明经过专业评价机构认证或者在省、市组织的相关活动中获奖;在市级以上报刊杂志发表论文、文学艺术作品;在市级以上教育行政部门批准的竞赛活动中获得等级奖等。
有下列情况之一者,可在运动与健康、审美与表现方面评定为A:在校内外大型体育、文艺活动中有突出表现;身体素质依照《国家学生体质
健康标准》达到优秀等级;省教育行政部门组织或相关部门组织被认可的体育比赛的前十名获奖者,能坚持讲好普通话、写好规范字,参加普通话演讲、古诗文诵读、硬笔书法比赛、音乐、美术等比 赛获三等奖以上(含集体项目);市教育行政部门组织的体育比赛的前六名获奖者和各项音乐、美术等比赛中获二等奖以上获得者(含集体项目)。
四、评价方式与方法
(一)评价采用形成性评价和总结性评价两种方式 1.形成性评价,包括课堂教学即时评价和单元测试评价
(1)课堂教学即时评价:教师在课堂教学中针对学生在学习目标或学习习惯、学习方法、情感态度和合作学习等方面的具体表现,给以及时的肯定、表扬、鼓励或纠正。
(2)单元测试评价:以各学科课程标准为依据,结合单元学习内容,采用书面、口试或实践活动等方式来检测学生对每单元基础知识和基本技能的学习情况。
2.终结性评价,是对学生一学期学习的综合性评价,包括形成性评价成绩、期末学科测试成绩、总结性评价成绩三者相加,最后形成终结性评价并以等级形式呈现。
(二)评价方法
1.重视日常评价。班主任、学科教师要在教育活动的全过程中,坚持定性分析与定量分析相结合,采用多样的、开放式的评价方法,了解每位学生的学习兴趣与习惯、学习状
况与发展、学习特点与潜能等情况,对学生达到的学科和学段目标进行随机评价,以促进学生全面发展。
2.建立学生成长记录。成长记录中要收集能够反映学生学习过程和结果的资料,包括学生的自我评价、最佳作品、社会实践记录、体育与文艺活动记录,教师、同学的观察和评价,来自家长的信息,期末考试和单元测试的信息等。成长记录要典型、客观、真实。
五、评价结果
(一)对学生的综合素质给予客观、公正的整体描述。评语应在教师对搜集到的学生资料进行分析并与同学、家长、交流和沟通的基础上产生。评语应采用激励性的语言,注意积极鼓励,正面肯定成绩为主。
评价等级分为A、B、C三级,依次对应优秀、良好、一般,描述小学生综合素质不同方面的发展状况。对学生某一方面表现评价为“不合格”时,应极其慎重。
(二)小学生毕业标准由小学生毕业考试成绩和综合素质评价结果两部分组成。学生学业考试成绩及格以上和综合素质评价一般以上,准予毕业。小学生升入初中时,综合素质评价的结果作为重要依据之一。小学毕业生综合素质评价报告单和成长手册应一并装入学生个人档案带到初中。