第一篇:引言评价学生学习状况的目的是激励优秀学生努力学习取得更好的成绩
引言评价学生学习状况的目的是激励优秀学生努力学习取得更好的成绩,同时鼓励基础相对薄弱的学生树立信心,不断进步。教育论文发表网分享。
然而,现行的评价方式单纯的根据“绝对分数”评价学生的学习状况,忽略了基础条件的差异;只对基础条件较好的学生起到促进作用,对基础条件相对薄弱的学生很难起到鼓励作用。
附件给出了612 名学生连续四个学期的综合成绩。
请根据附件数据,对这些学生的整体情况进行分析说明;请根据附件数据,采用两种及以上方法,全面、客观、合理的评价这些学生的学习状况;试根据不同的评价方法,预测这些学生后两个学期的学习情况。
.学生成绩总体分析学生成绩统计分布分析对各学生的原始成绩进行描述统计分析[1,2,3],获取学生总体数据分布信息,如表1 所示。
从分析结果可知学生共有612 人,四个学期的成绩数据均没有缺失。四个学期的平均成绩均在73.5 分左右,中位数(成绩排名处于第306 位学生的成绩)均在75 分左右,且最高分没有明显变化,均约90 分。而最小值在第2、4 学期出现了0 分,导致第2、4 学期的极差变大为90 分。标准差表示学生成绩分布频率下降到一半时的成绩宽度,均在10 分左右,说明四个学期的成绩分布集中在68.5~78.5 分。从百分比可以看出50%以上的学生成绩在约75 分以上。偏度值均为负值说明该分布为非正态分布并且偏度绝对值越来越大,说明偏离正态分布越严重,一方面表明评价体系难度减弱,另一方面还可能由于学生的整体水平的上升而导致的。峰度值均为正值,同时随着学期的增长越来越大,说明其尾部越来越粗,表明学生在高成绩部分分布数量增多。同时为了直观的说明成绩的偏态分布,对成绩分布进行频次分析,如图1 中直方图所示。其中实线表示正态分布曲线。中四个学期的成绩频次直方图均明显偏离正态分布曲线。
分别采用One-Sample K –S 检验法和箱式检验法检验成绩分布是否为正态分布[4,5]。表2 中列出了One-Sample K –S 的检验结果。该表输出了指定检验变量的正态参数,包括平均数与标准差、极端差的最大绝对值、正值及负值、K-SZ 值、双侧检验的显着性水平。由于渐进方法所检验的显着性水平小于0.05,所以变量学期1~学期4 的成绩并非来自正态分布的总体。箱式图中方框内的区域表示变量中间50%的观测值,方框的上下边线分别为上四分位数和下四分位数。方框中的横线(粗黑横线)为中位数,方框之外的上下两条细横线称为须线,是除了离群值和极值之外的最大值和最小值。从图2 看出方框不居中而是偏上,进一步说明学期1~4 的成绩符合负偏态分布。而且离群值的位于下须线之下,说明每学期都有部分学生成绩偏离总体水平。为此成绩偏低尤其是多个学期成绩偏低的学生应当引起更多的关注,例如其中学号为141 的学生在学期1、2 中成绩均偏低,学号为222 的学生在第2、3 学期中成绩偏低。
学生成绩负偏态分布的合理性学生学习成绩正态分布被普遍认为是成绩测量和评定的一条原则。如果一个班或一组学生的成绩呈正态分布,往往被管理者和教师本人认可[6]。相反,如果呈现正偏态分布(低分的人相对很多)或者负偏态分布(高分的人数相对很多),管理者和教师本人往往会认为其中有问题。成绩正态分布绝对化观点排斥成绩负偏态分布的合理性,对提高教学质量是不利的。
因为教学是一种有计划有目的的人为活动,在教学互动过程中师生的能动作用可以改变学生个体之间的差异状态。例如,在一个班级中,原本落后的学生通过教学活动可能缩短与优秀学生的差距,也可能赶上中间的学生甚至优秀的学生。不能机械地要求考试一定要获得一个正态分布的结果[7]。美国教学论专家布卢姆(B.S.Bloom)认为,能力倾向的个体差异与成绩的差异没有必然的联系,能力差异只说明学生所需的学习时间量的差异[8]。布卢姆认为,学习时间能够补偿能力倾向的不足,这与我国俗语“勤能补拙”是一个意思。学生能力的正态分布并不必然导致成绩的正态分布,道理就在于教师和学生的人为的能动作用改变了成绩分布模型。
成绩负偏态分布的合理性在于两个前提条件:一是教学目标具有合理的难度;二是考核体系具有合理的难度。根据合理的教学目标设计的合理的考核体系是成绩负偏态的合理前提。
成绩评价模型统计评价模型为了激励优秀学生努力学习取得更好的成绩,同时鼓励基础相对薄弱的学生树立信心,不断进步,有必要将负偏态分布的学生成绩通过数学手段变换为正态分布,这样使得学生之间成绩的差距分布更为合理,原来成绩偏低的学生经过变换后将处于中等位置,这些人会得到适当的鼓励,改变了负偏态分布中大部分学生的成绩集中分布在高分段的现象[9]。变换成正态分布后,还会对后续的聚类分析模型和标准化成绩模型中的数据处理带来极大的方便。
由于每个学期的评价体系存在一定的波动,例如考核中不可避免的难易程度的变化等因素会使各学期之间的同一学生成绩缺少一定的比较性。例如某学生第一学期的成绩为82 分,排名103 位。而第二学期为85 分,但是考虑到总体情况,第二学期考核偏易,排名112 位,导致该学生排名比第一学期下滑。为了消除这些学期之间的差异,为此将正态分布再经过变换为标准正态分布,使得同一学生在不同学期的成绩具有更可靠的可比性。后续的聚类评价和成绩标准化评价模型中均采用标准正态分布变换后的学生成绩即“有效成绩”进行处理。为原始成绩变换后得到的的成绩(由于篇幅有限成绩列表均只列出部分成绩)。为描述统计分析结果。可以看出变换数据量没有损失,但是偏度仍为负值,然而其绝对值很小。从频次直方中可以看出基本符合正态分布。为了进一步验证成绩分布是否为正态分布,采用正态分布Q-Q 检验图和无趋势正态分布Q-Q 检验图进行分析。
所示为四个学期的正态Q-Q 检验图。从图中可以看出实际观测值与期望值为坐标的点几乎全部落在趋势线上。在无趋势正态分布Q-Q,在中央横线的一段,坐标点落在中央横线附近,在中央横线的两端则有一定的偏离,但绝大部分偏离值均小于0.05。仅有个别点偏离较大。可见,学期1~4 的成绩呈现正态分布。
聚类评价子模型聚类分析将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。目的在于使类间对象的同质性最大化和类与类间对象的异质性最大化。聚类分析是将统计方法引入到分类学中产生的一个重要分枝。按成绩对学生群体进行评估分类,是对学生因材施教、奖优汰劣的重要依据也是在就业市场中衡量学生的砝码[10 ,11]。用聚类分析法对学生成绩进行评估,使分类结果更加客观、全面。
由标准成绩的定义可知,标准成绩是以全体学生的每学期的平均成绩为比较基准,以标准差为基本单位。标准成绩的取值可正可负,若为正,这说明该学生该项的水平在总体水平之上,若为负,说明该学生该项的水平在总体水平之下。
标准分数是自由度为n ?1的t分布的随机变量取i T 的下侧概率值(为了与通常的百分制相比较,在定义时把下侧的概率值扩大100 倍)。这样可以直观地反映一个学生在整体中成绩的地位。例如,一个学生的得分为75,则说明有75%的学生的成绩在他之下。若有名学生,这说明该学生在总体中的水平大约在612×25%?1=152名,所以标准成绩是以该生在总体中的名次来制定。
根据上述模型得到的学生标准分成绩如表9 所示。此时标准分能反映出该学生的排名分布,排名只能表明该生在群体中所处的相对位置,但是不能表明该生实际的水平。例如,排名12,有效成绩1.9,B 排名13 有效成绩1.6。虽然排名相近但实际水平相差却比较大。
对于每个学期的成绩并且在表中计算出了四个学期的平均标准成绩。平均标准成绩能够反映出学生4 个学期的总体情况,却不表现出成绩的动态变化情况。当某生仅某一学期年成绩偏低或偏高时对平均成绩影响较大。为了进一步反映学生成绩的动态变化建立了动态分析模型。3.2 动态成绩评价模型为了全面、客观的评价学生的学习状况,激励优秀的学生努力取得更好的成绩,同时鼓励基础较薄弱的考生树立信心,不断进步,那么需要在考生每次考试的“绝对分数”基础上,还要考虑基础条件的差异[13 ,14]。也就是说不仅要考虑该考生这次的“绝对分数”,还要看他和上次相比,是进步了还是退步。两方面都要考虑,最后的分数应该是两者的加权和。比如两个人如果都考了80 分,而第一个人上次考了85 分,第二个人上次考了75 分,那么应鼓励第二个人,所以后者的最终分数要比前者高。具体方法可如下:
第i 个学生当学期(第j 学期)的综合成绩为上一学期成绩为,则本学期的动态成绩为ω ω× + ? × ? ×其中ω 为加权因子。此外还有种极端情况是上学期成绩为0,即除数为0,此时只考虑绝对分数。如果本学期成绩为0,那么也只考虑绝对分数,不能出现负分数。加权因子越大,成绩的变化对动态成绩的影响越大。
与第一种方法类似,和以前的成绩比较时,不是单纯的考虑上一次的成绩,而是前几次成绩的平均值,表示。
将4个学期原始成绩经过A模型运算得到,而采用B模型得到。其中ω = 0.9。
当因子过大时成绩的变化引起的动态成绩的变化会增大,因子过小又体现不出成绩的动态变化的影响,因此加权因子的选取要合理。对综合成绩进行频次分析可知,每个学生的成绩采用方法A,B 评价得到的动态成绩会有所不同,但是并不影响总体学生成绩的分布状态。
成绩预测模型线性回归预测模型通过 Speaman 等级相关系数显着性检验分析得到表12,相关系数均大于0.5,说明不同学期之间的成绩具有高相关度。表明可以进行线性回归预测。
即采用前3 个学期的成绩线性加权求和得到第4个学期成绩的预测值,通过最小二乘拟合求解系数a,b, c, d。取j = 5,可以预测出第5 学期的成绩,同理进而可预测出第6 学期的成绩。表13 给出了最小二乘法求解得到的a,b, c, d 值及标准差。系数值依次递减,说明第4 学期的成绩受第3学期影响最大,随时间差的增大,影响力减小。而图8 中给出了采用前三学期原始成绩预测的第四学期成绩的残差,可见大部分预测值与真实值之间的偏差小于10 分,对于成绩较差的学生预测的偏差较大。给出了根据上述模型预测的第5 和第6 学期的学生成绩,图9 给出了第5、学期的频次分布直方图,仍然满足负偏态分布。通过对这两个学期的描述统计分析如表所示,相对于前4 个学期平均成绩有所提高,并且标准差下降到8.4,表明更多的人集中在了平均分附近。偏度与第4 学期相近,是由于此学期对后两个学期预测值的影响最大。
成绩预测模型灰色模型法由于具有所需数据少、计算量小的优点而得到了广泛的应用。部分信息已知、部分信息未知的系统称为灰色系统,灰色系统理论是企业界较实用的一种预测方法[15]。灰色系统理论把一切随机过程看作是在一定范围内变化的、与时间有关的灰色过程,将离散的原始数据整理成具有规律性的生成数列,然后再进行研究。对灰色过程建立的模型称为灰色模型,即GM[16]。GM(1,1)是最常用、最简单的一种灰色模型,它是由一个只包含单变量的微分方程构成的模型,是GM(1,N)的一个特例。
对原始成绩经过检验满足一级精度,根据上述模型对第5,6 个学期进行预测并经过动态成绩评价模型评价得到表16 中的数据,对于大部分成绩的可靠性能够接受,相对于前四个学期,成绩分布仍比较稳定。而对于学号为8 的学生成绩出现了0 值,是因为其第3 学期成绩为55.9,而第4 学期成绩16.5,变化很大,而GM(1,1)法基于一阶微分方程预测因此得到0 值,而对611 号预测第6 学期的成绩经动态成绩评价B 模型分析为100.97,超过了满分,是因为在最小二乘法求解系数a,u 是用到了矩阵的逆运算,而对于近奇异的矩阵出现了解的不精确性。再经过动态评价模型处理可能会超过满分。
结论采用描述统计的方法对学生成绩的总体分布分析时,发现成绩分布为非正态分布,并且用One-Sample K –S 检验法和箱式图检验法对其分布进行验证,分析结果表明该分布满足负偏态分布的特点,确定为负偏态分布,并且对学生成绩呈现负偏态分布的合理性做了定性分析。
在建立评价模型过程中,分别建立了统计评价模型和动态成绩评价模型对学生成绩进行评价。在统计评价模型中,采用数学手段将负偏态分布变换为正态分布,并且用正态分布检验图和无趋势正态分布Q-Q 检验图对其进行了验证。为了消除每个学期评价考核体系的不稳定性因素的影响,提出了“有效成绩”的概念,即将正态分布归一化为标准正态分布,得到每个学生各学期的“有效成绩”。在此基础上建立了两种评价子模型:
1、聚类评价子模型,用此模型将612 名学生分成5 类。其中第一类19 人成绩均偏低为重点关注对象,基础较差,四个学期成绩没有大的进步甚至变差。对这些学生要鼓励为主,同时应积极引导可以采用个别辅导的办法帮助提升成绩。第二类学生95 人成绩一直保持优秀,对这些学生要适当的奖励。第3 类学生131 人集中在及格边缘,从各学期的成绩比较可知该类学生成绩有明显的进步,但是如不注意个人的努力成绩会下滑而不及格。第4 类学生和第5 类学生人,成绩比较稳定,原始成绩在70~80 之间,构成了有效成绩频次分布的中心部分。他们成绩的波动对总体成绩的分布有很大的影响,代表着该群体的整体水平。
2、成绩标准化子模型,得到每个学生各学期的标准分,此时标准分能反映出该学生的排名分布,排名只能表明该生在群体中所处的相对位置,但是不能表明该生实际的水平。而平均标准成绩能够反映出学生4 个学期的总体情况,却不表现出成绩的动态变化情况。为了进一步反映学生成绩的动态变化建立了动态分析模型。考虑到学生成绩随学期的增减情况建立动态成绩评价模型,并且针对每个学生分别采用两种不同的表述方法获得该生各学期的“动态成绩”。但是动态成绩依赖于权重因子,因子的赋予含有主观意愿。
通过相关分析验证了建立线性回归预测模型的可行性,通过线性回归模型预测了第和第6 学期每个学生的成绩,并对成绩的分布做了描述统计分析,结果表明与前四个学期具有类似的负偏态分布,各参数差异不大,证明了该模型的可靠性。此外还建立了成绩预测模型,并对预测的成绩进行了动态成绩评价与分析。总之,分析结果表明上述评价模型建立是合理的,可以考虑综合运用以上模型能够对学生成绩进行合理、客观、全面和有效的地分析与预测。