第一篇:心理测量考研问题(含答案)
1.等距量表的特点是(B)(2007年)A.无绝对零点,无相同单位 B.无绝对零点,有相同单位 C.有绝对零点,无相同单位 D.有绝对零点,有相同单位
2.下列量表中,具有绝对零点的是(D)(2008年)A.称名量表 B.顺序量表 C.等距量表 D.比率量表 3.简述测验标准化的含义及提高测验标准化程度的方法。
4.教师的职称和薪水这两个变量的数据类型分别是(D)(2009年)A.命名数据和等比数据 B.等距数据和等比数据 C.顺序数据和等距数据 D.顺序数据和等比数据
5.下列心理测验中,属于速度测验的有(AC)(2010年多选题)A.文书能力测验中的校对测验
B.梅尔艺术鉴赏测验中的审美知觉测验 C.一般能力倾向成套测验中的装配测验 D.西肖尔音乐能力测验中的音高辨别测验
6.在评价中心技术中,无领导小组、文件筐等测验属于(A)(2010年单选题)A.情境测验 B.评定量表 C.投射测验 D.自陈测验
7.1937年,施瑞奥克将我国三国时期刘邵关于人的能力研究的著作翻译成英文版。该著作是(A)(2010年单选题)
A.人物志 B.心书 C.吕氏春秋 D.学记 8.下列数据类型属于比率数据的是(A)(2011年单选题)A.智商分数 B.反应时 C.年级 D.数学成绩
9.某初中招收600名新生后,进行了一次分班考试。按照考试的功能,这次考试属于(C)(2011单选题)A.诊断性评估 B.形成性评估 C.安置性评估 D.终结性评估
10.1937年,施瑞奥克将我国三国时期刘邵关于人的能力研究的著作翻译成英文版。该著作是(A)(2010年单选题)
A.人物志 B.心书 C.吕氏春秋 D.学记
11.要求被试回答有关自己的感受和信念的测验属于(B)(2011年大选题)A.最高作为测验 B.典型作为测验 C.非文字测验 D.投射测验 12.在下列测验中,属于文字测验的是(A)(2012年单选题)A、16PF B、TAT C、罗夏墨迹测验 D、瑞文推理测验
13.从心理测量学角度看,中国古代的“七巧板”可视为(B)(2013年单选)A、兴趣测验 B、创造力测验 C、态度测验 D、投射测验
14.为了规范和维护心理测验工作的发展,中国心理学会于1992年颁布(B)(2014年单选题)
A《计算机化测验学解释指南》 B《心理学家的道德准则与行为规范》 C《心理测验管理》 D《教育和心理测验标准》 1.真分数模型X=T+E中,E表示的是(B)(2007年)A.系统误差 B.随机误差 C.抽样误差 D.标准误差
2下列关于测量结果受测量误差影响的叙述,正确的是(D)(2008年)A.系统误差影响稳定性,不影响准确性; B.系统误差影响准确性,也影响稳定性; C.随机误差影响稳定性,不影响准确性; D.随机误差影响稳定性,也影响准确性。
3.简述测量误差的含义、类别及控制测量误差的方法。(2009 在一切测量中,由于各种因素的影响,测量所得的观测值并不准确地等于被测之量的真值。二者之差称为测量误差。根据测量误差的性质来来源,测量误差可分为系统误差和随机误差。
常见的影响测验误差的因素主要有三方面:测验自身、施测过程、受测者。(1)测验自身
测验自身的误差主要来源于测验的编制过程,其中项目取样影响最大。测验所要测量的内容是什么,测验的项目能否代表这些内容,是至关重要的。当测验的项目较少而取样缺乏代表性时,被试的反应很难代表其真实水平。对于有些类型的项目,例如是非题、选择题,被试可能凭猜测作答,从而降低分数的可靠性。此外,题目用词模棱两可,或对要求叙述不清等,也都会带来误差。(2)施测过程
在测验的实施过程中可能引起误差的因素很多,如测试环境、时间、主试者、意外干扰、评分记分等。(3)被试因素
在测量工作中,最复杂的和最难控制的是由被试本身引起的各种误差。测验中被试的应试动机、被试的焦虑、测验经验、练习效应、反应倾向和生理变因等因素都会带来误差。
4.在经典测量模型X=T+E中,关于E的表述,错误的是(C)(2010单选)A.真分数和误差分数之间的相关为0 B.各平行测验上的误差分数之间相关为0 C.误差分数是随机误差与系统误差之和
D.误差分数是一个服从均值为0的正态分布的随机变量
5.在经典测量的真分数模型下,公式SX²=SI²+SV²+SE²中的SI²是(D)(2013单选)
A、测量误差的变异数 B、观察分数的变异数
C、与测量目的有关的变异数 D、稳定的但出自无关来源的变异数
1.将测验对等分半后,两半测验得分的相关系数为0.60,校正后该测验的分半信度是(B)(2007年)
A.0.70 B.0.75 C.0.80 D.0.85 2.什么是测验的信度?影响信度的主要因素有哪些?(2007年)78、什么是测量的信度?影响信度的因素有哪些?
答:信度指的是测量结果的稳定性程度。换句话说,若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。这是信度的描述性定义。
信度的操作性定义,主要包括三个方面:①、信度乃是一个被测团体的真分数的变异数与实得分数的变异数之比,即r =s /s。②、信度乃是一个被试团体的真分数与实得分数的相关系数的平方,即r =PT。③、信度乃是一个测验X(A 卷)与它的任意一个“平行测验”X '(B 卷)的相关系数,即r =P。测量信度是测量过程中随机误差大小的反映。随机误差大,信度就低,随机误差小,信度就高。在测量过程中影响随机误差的因素主要包括被试、主试、测试内容、施测情境等。
①被试方面,就单个被试而言,被试的身心健康状况、应试动机、注意力、耐心、求胜心、作答态度等会影响测量误差,就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度。
②主试者方面,就施测者而言,若他不按指导手册中的规定施测,或故意制造紧张气氛,或给考生一定的暗示、协助等,则测量信度会大大降低;就阅卷评分者而言,若评分标准掌握不一,或前紧后松,甚至是随心所欲,则也会降低测量信度。
③施测情境方面,在实施测验时,考场是否安静,光线和通风情况是否良好,所需设备是否齐备,桌面是否合乎要求,空间阔窄是否恰当等等都可能影响到测量的信度。
④测量工具方面,以测验为代表的心理与教育测量工具是否性能稳定是测量工作成败的关键。一般地,试题的取样、试题之间的同质性程度、试题的难度等是影响测验稳定性的主要因素。
⑤两次施测的间隔时间,在计算重测信度和稳定性与等值性系数(复本信度之一)时,两次测验相隔时间越短,其信度值越大;间隔时间越长,其他因素带来影响的机会就多,因而其信度值就可能越小。
3.衡量测验跨时间一致性的信度称为(A)(2008年)
A.重测信度 B.复本信度 C.同质性信度 D.评分者信度 4.反映测验结果的可靠性、稳定性的指标是(B)(2009年)
A.效度 B.信度 C.难度 D.区分度 5.重测信度的主要误差源是(B)(2009)
A.内容取样 B.时间取样 C.统计取样 D.评分者
6.某测验的信度为0.64,实得分数的标准差为5,该测验的标准误为(C)(2010单选题)
A.0.36 B.1.04 C.3.00 D.4.36 7.简述人格测验中影响信度的因素并举例分析(2011年简答题)
8.信度系数不仅可以解释测验总变异中的随机测量误差,还可以解释(C)(2012年)
A、样本标准差 B、组间误差 C、真分数变异 D、组内误差
9.由于幼儿的智力发展迅速,收集幼儿智力测验信度资料的最佳方法是(C)(2013单)
A、再测法 B、复本法 C、分半法 D、方差分析法
1.已知某量表的分半信度为0.63,请算出原长度的信度系数? 原r=2*分半r/(1+分半r)结果等于0.77
2、测验有20道测题,其信度仅为0.55,若把测题增加到60题,信度能达到多少?增加到120题呢? 0.79;0.88
3.已知韦氏智力测验的标准差为15,信度系数为0.95,对一名12岁的儿童实施该测验后,IQ为110,那么他的真分数在95%的可信度要求下,变动范围应是多大?
4、某儿童在韦氏儿童智力测验中,言语智商124,操作智商115,已知这两个分量表的信度分别是0.97和0.93,请问这两种智商在95%的置信水平下有无显著差别?
1.以学习成绩为效标,得到某一智力测验的效标关联效度为0.80。将此测验用于预测时,其测验结果可解释学习成绩变异的(C)(2007年)A.16% B.20% C.64% D.80% 2.某公司人力资源部运用某一能力倾向测验选拔了50名新员工。半年之后,发现其中有10人选拔不理想。那么,这个测验的预测效度是(D)(2008年)A.0.20 B.0.25 C.0.75 D.0.80 3.根据真分数理论,信度系数与效度系数的关系为(D)(2009年)A.二者恒等
B.效度系数大于信度系数 C.信度系数小于或等于效度系数 D.信度系数大于或等于效度系数
4.影响研究内部效度的主要因素有(ABCD)(2010年多选题)A.被试的成熟与发展 B.被试固有的和习得的差异 C.统计回归 D.仪器设备的选择与使用
5.在经典测量理论中,表示测验结果精确程度的指标有(CD)(2011多选题)A.测验信度 B, 测验效度 C.测验标准误 D.测验准确率 6.在量表编制过程中,因素分析的主要目的是(C)A.确定项目之间的相关 B.确定量表的信度 C.探索并降低测量维度 D.建立常模
7.如果某测验的效度系数是0.70,则该测验无法做出解释的变异比例为(C)(2012年)
A、30% B、49% C、51% D、70% 8.通过考察甲测验与测量同一特质的标准化乙测验之间的维度相似性,可以分析甲测验的效度类型是(D)
A、内容效度 B、区分效度 C、校标效度 D、构想效度
9.效标是衡量心理测验有效性的外在标准,下列选项中,通常被研究者选为效标的有(ABC)
A.工作绩效B.临床诊断C.学业成就D.心理特征的描述性评价 10.多质多法(MTMM)所考虑的测验效度类型是(B)(2014年单选)A内容效度 B构想效度 C同时效度 D预测效度
11.如果要评估一个人员选拔测验的预测效度,最恰当的效度是(C)(2014年单选)A薪水 B工龄 C绩效 D职务
1.某项测验中,绝大部分题目的难度值P较大,那么被试的分数(ABD)(2007年)
A.集中在高分端 B.平均数小于中数 C.中数大于众数 D.分布呈现负偏态
2.测验总分的分布呈负偏态,说明测验整体难度(B)(2008年)A.偏难 B.偏易 C.适中 D.无法判断
3.某学业成就测验由100道五选一的单项选择题组成,每题1分。如果要从统计上(99%的把握)排除猜测作答的情形,考生正确回答的题目数量至少应该是(C)(2009年)
A.24题 B.25题 C.26题 D.27题
4.下面是某选拔测验中四道选择题的项目分析数据,根据项目筛选的一般要求,最佳的项目是(C)(2011单选题)
A.P=0.21,D=0.45 B.P=0.88,D=-0.30 C.P=0.47 D=0.43 D.P=0.62,D=0.15 5.由五选一的选择题组成的测验,其通过率为0.60,消除猜测因素的影响后校正难度为为(B)(2014单选)
A.0.40 B.0.5 0 C.0.75 D.0.80 1.某考生在一项测验中得分60,经换算百分等级为70,这表明在所有考生中,得分低于该考生的人数占总人数的(D)(2007年)A.30% B.40% C.60% D.70% 2.将Z分数转换成T分数时,需要进行(C)(2007年)A.正态化转换 B.非正态化转换 C.线性转换 D.非线性转换
3.在某次考试中,小明的语文、数学成绩为80,英语成绩为75.已知全班三科平均成绩都为65,语文标准差为10,数学标准差为15,英语标准差为5。小明三科的成绩按照标准分由大到小进行排序的结果是(C)(2008年)A.语文、数学、英语 B.英语、数学、语文 C.英语、语文、数学 D.语文、英语、数学
4.要比较几个不同性质的测验分数,最恰当的是比较(C)(2009年)A.原始分数 B.众数 C.百分等级 D.平均数
5.根据测验中不同维度或分测验的导出分数,绘制形成的折线图或柱形图称为(C)(2009年)
A.结构图 B.碎石图 C.剖面图 D.茎叶图
6.在格赛尔发展量表中,测量婴儿行为发展水平使用的指标为(D)(2009年)A.教育商数 B.情绪商数 C.智力商数 D.发展商数
7.运用相对累加次数分布曲线,可以快速计算出与学生原始分数相对应的统计量是(A)(2010单选题)
A.百分等级 B.z分数 C.T分数 D.频次 8.用离差智商取代比率智商最主要的原因是(D)(2010单选)A.比率智商只能进行个体内比较 B.离差智商随年龄的增长而提高 C.智力年龄会随生理年龄的增长不断发展 D.比率智商不能满足对年龄单元等值性的要求
9.下列选项中,属于常模参照测验的是(B)(2011单选)A.教师自编测验 B.艾森克人格测验 C.句子完成测验 D.医师资格测验
10.下列是四位儿童的斯坦福-比内智力测验结果。心理年龄超过8岁的儿童是(B)(2011单选)
四位儿童的姓名 生理年龄与比率智如下:
小明 6 120 小丽 7 115 小刚8 95 小芳 9 90 A.小明、小丽 B.小丽、小芳 C.小刚、小芳 D.小刚、小明 11.有一名10岁儿童参加智力测验,他的心理年龄为12岁,其比率智商是(C)(2013年单选)A、83 B、110 C、120 D、125 12.某测验用百分等级表示测验结果,其受测者的测验结果低于平均分的一个标准差。他在该组被试中的百分等级是(B)(2013年单选)A、10 B、16 C、34 D、50 13.下列选项中,具有等距单位的常模参照分数是(C)(2014年单选)A.发展顺序量表 B.教育商数 C.T分数 D.百分等级
1.下列选项中,可以不写进测验使用手册的是(A)(2011年)A.测验题目 B.信度证据 C.效度证据 D.测试对象
2.解释受测者的心理测验分数时应注意哪些问题。(2012年)
答案要点:测验分数的解释涉及两个问题:第一,如何看待测验分数的意义;第二,如何将测验分数的意义告知给受测试者。
在解释测验分数的意义时,应遵循以下几个基本原则:
(1)主试应充分了解测验的性质和功能。
(2)对导致测验结果原因的解释应慎重,谨防片面极端。
(3)必须充分估计测验的常模和效度的局限性,一定要依据从最相近的团体、最相匹配的情境中获得资料。
(4)解释分数应参考其他有关资料。
(5)对测验分数的解释应以“一段分数”来解释,而不应以“特定的数值”来解释。
(6)对来自不同测验的分数不能直接加以比较。如需加以比较,必须将二者放在统一的尺度上。
3.简述心理测验编制的基本过程。(2013年)答案要点:(1)确定测验目的(2)制定编题计划(3)编辑测验项目(4)预测与项目分析(5)合成测验(6)项目标准化(7)鉴定测验(8)编写测验说明书
1.根据经典测量理论,常用的测验等值方法有(BC)(2008年)A.全距等值 B.等百分位等值 C.线性等值 D.方差等值
2.如果要建立两个测验的等值关系,这两个测验须满足的前提条件是(A)(2013年单选)
A、信度相等 B、长度相等 C、效度相等 D、测验总分的标准差相等
1.在日常教学活动中,教师用来的测评学生学习效果的单元小测验属于(C)(2013年单选)
A、标准化测验 B、常模参照测验 C、非标准化测验 D、自适应测验 1.世界上第一个智力量表是(A)(2007年)A.比纳-西蒙量表 B.斯坦福-比纳量表 C.韦克斯勒智力量表 D.瑞文推理测验
2.下列智力测验中,属于非言语类测验的是(D)(2008年)A.比纳-西蒙量表 B.斯坦福-比纳量表 C.韦克斯勒智力量表 D.瑞文推理测验 3.瑞文推理测验主要测量的是(D)(2009年)
A.言语能力 B.特殊能力 C.操作能力 D.一般能力 4.下列智力测验中,属于文化公平测验的是(D)(2009年)A.比纳-西蒙量表 B.斯坦福-比纳量表 C.韦克斯勒智力量表 D.联合瑞文推理测验
5.在下列测验中,以卡特尔的流体与晶体智力理论为基础编制的智力测验是(D)(2013单选)
A、认知评估系统(CAS)B、考夫曼儿童评定成套测验(K-ABC)C、区别能力量表(DAS)D、一般能力倾向成套测验(GATB)
6.第一次世界大战期间,为了快速选拔官兵和分派兵种而编制的测验属于(B)(2014年单选)
A个别测验 B特殊能力测验 C语词联想测验 D团体测验 1.下列心理测验中属于速度测验的有(AC)(2010单选题)A.文书能力测验中的校对测验
B.梅尔(Meier)艺术鉴赏测验中的审美知觉测验 C.一般能力倾向成套测验中的装配测验
D.西肖尔(Seashore)音乐能力测验中的高音辨别测验 1.根据莫瑞需要理论编制的人格测验是(D)(2007年)A.卡特尔16人格因素问卷(16PF)B.艾森克人格问卷(EPQ)
C.明尼苏达多项人格调查表(MMPI)D.爱德华个人偏好量表(EPPS)2.主题统觉测验属于(D)(2007年)
A.成就测验 B.自陈测验 C.情景测验 D.投射测验 3.罗夏墨迹测验属于(C)(2008年)
A.学业成就测验 B.能力倾向测验 C.人格测验 D.智力测验 4.爱德华个人偏好量表的设计采用了(C)(2008年)A.排序技术 B.多选技术 C.迫选技术 D.投射技术
5.临床观察到某人有抑郁倾向,能够帮助进一步诊断的测验是(A)(2008年)A.MMPI B.MBTI C.EPQ D.CPI 6.受测者在接受自陈式量表测试时,经常会出现(A)(2008年)A.社会赞许效应 B.自我中心效应 C.极端分数效应 D.晕轮扩散效应 7.20世纪90年代以来,在我国人事选拔领域引进并被广泛应用的综合性测评技术是(C)(2009年)
A.操作测验技术 B.投射测验技术 C.评价中心技术 D.纸笔测验技术 8.编制艾森克人格问卷(EPQ)的方法是(D)(2009年)A.综合法 B.经验效标法 C.理论推演法 D.因素分析法 9.以大五人格因素模型为基础编制的人格测验时(A)(2009年)A.NEO B.MBTI C.MMPI D.CPI 10.罗夏墨迹测验的计分要素主要包括(ABD)(2009年)
A.反应的部位 B.反应的速度 C.反应的正确率 D.反应的内容
11.在自陈式人格测验中,为了探察社会赞许效应,测验编制者经常会使用(B)(2010单选)A.疑问量表 B.说谎量表 C.诈病量表 D.态度量表
12.被试在回答心理测验题目时,不管测验内容如何,都采用同样方式回答,这种趋同应答的现象称为(A)(2010单选)
A.反应定式
B.反应风格
C. 猜测应答
D.默认应答 13.人格测验16PF常模表中的导出分数是(B)(2011单选)
A.标准九 B.标准十 C.标准二十 D.T分数
14.要求被试回答有关自己的感受和信念的测验属于(D)(2011单选)
A.最高作为测验 B.典型行为测验 C.非文字测验 D.投射测验 15.从测量内容来看,SCL-90属于(D)(2011单选)
A.智力测验 B.人格测验 C.兴趣测验 D.心理健康测验
16、人格测验最常用的方法是(D)(2012年单选)A、行为观察法 B、他评量表 C、访谈法 D、自陈量表
17.下列选项中,不属于MMPI效度量表是(D)(2012年单选)A、说谎量表 B、诈病量表 C、校正量表 D、疑病量表 18.下列选项中,不属于内隐测验的是(B)(2014年单选)
A句子完成测验B.MMPI人格调查表C语词联想测验D主题统觉测验 19.艾森克提出的人格基本维度有(ACD)(2014年多选)A外倾性 B开放性 C神经质 D精神质 1.瑟斯顿提出的态度测量方法是(B)(2008年)
A.核检表法 B.等距量表法 C.语义差异法 D.累加量表法
2.要求受测者必须从两个或两个以上的选项中,选出最能代表自己特征的描述语句。这种评(C)A.观察式量表 B.锚定式量表 C.迫选式量表 D.数字式量表 3.霍兰德根据其职业类型理论编制的兴趣量表有(AB)(2014年多选)A自我定向调查表(SDS)B职业偏好调查表(VPI)C职业指向调查表(OOI)D职业评定调查表(CAI 1.计算机化自适应测验设计的主要理论依据是(D)(2008年单选)A.概化理论 B.经典测验理论 C.层面理论 D.项目反应理论 2.在测量研究中,强调对测验情境关系进行考察的心理测量理论是(C)(2009年)
A.经典测量理论 B.项目反应理论 C.概化理论 D.测验等值理论 3.下列关于计算机自适应测验(CAT)的表述,正确的是(D)(2010年)A.被试可以自选测量模型 B.被试需要花费大量时间 C.被试可以自选试题 D.被试接受的试题会有所不同
4.在概化理论中,与经典测量理论中真分数的概念最接近的是(A)(2010年)A.全域分数 B.概化系数 C.可靠性指数 D.信噪比
5.在项目反应理论双参数模型中,能够直观地描述被试正确作答概率与被试特质水平关系的(C)A.区分度与难度 B.项目信息函数 C.项目特征曲线 D.测验信息函数 6.在概化理论中,公式(其中)为测量目标效应方差,为绝对误差方差)表示的是(B)
A.G系数 B.Φ系数 C.CV系数 D.W系数
7.在项目反应理论三参数logistic模型.数学表达式 中,表示项目区分度参数的符号是(B)A.a B.b C.c D.d 8.概化理论采用方差分析法分节测量数据的总体方差,通常把数据总方差分解为(ABC)
A目标主效应方差 B测量侧面效应方差C各种交互效应方差D相对误差与绝对误差的方差
第二篇:常用心理测量评定量表
常用心理测量评定量表
一、心理健康量表:
1、90项症状自评量表(SCL--90)
2、焦虑自评量表(SAS)
3、抑郁自评量表(SDS)
4、康奈尔医学指数(CPI)
5、社会功能缺陷评定量表(SDSS)
二、人格测试量表:
1、明尼苏达多相人格测试(MMPI)
2、艾森克人格问卷成人版(EPQ)
3、大学生人格问卷(UPI)
4、卡氏16种个性因素测试(16PF)
5、气质量表
6、中国人个性量表(CPAI)
7、青年人格问卷(CPI)
8、A型行为类型问卷(TABP)
9、爱德华个人偏好量表(EPPS)
三、智力测试量表:
1、瑞文智力测验
2、韦氏智力测验(成人)
3、韦氏智力测验(儿童)
4、比内-西蒙智力测验
四、心理状态测量量表:
1、成人人际关系量表
2、成人心理压力量表
3、社会适应能力量表
4、心理适应性量表
5、社会支持评定量表
6、心理年龄量表
7、生活事件量表
8、应对方式问卷
9、情商(EQ)测试
10、Olson婚姻质量测试
五、学习专用量表
1、学习价值怀疑量表(SVL)
2、学业成就责任问卷(IAR)
3、成就目标取向量表(ADG)
4、成就动机量表(AMS)
5、考试焦虑量表(TAS)
6、自我效能感综合量表(SEIS)17、学业求助量表(HSS)
8、自我妨碍量表(SHS)
六、人力资源管理量表
1、职业能力倾向测试
2、社会适应能力诊断量表
3、心理发展状态测验
4、行动潜力测验
5、个人风格测评问卷
6、人力资源管理能力测评
7、成功商数测试
8、霍兰德职业兴趣量表
9、员工健康状况测评
10、员工素质测评
11、工作环境测评量表
12、职业满意度量表
13、婚恋测试量表
14、婚姻质量测试
七、婚姻心理控制源量表:
1、艾森克性心理健康测验
2、恋爱方式测验
3、夫妻生活健康测验
4、婚姻安全界线检测问卷
八、儿童用心理测验与量表:
1、Achenbach儿童行为量表(CBCL)
2、RUTTER儿童行为问卷
3、父母养育方式评价量表
4、亲子关系与父母角色测量量表
5、亲子关系诊断测验
6、托马斯婴儿气质问卷
7、儿童韦氏智力测验
8、问题行为早期发现测验
9、幼儿智力测验量表
10、康纳尔父母量表(CONNERS)
11、孤独症行为评定量表(ABC量表;父母或教师用)
12、儿童期孤独症评定量表(CARS)
九、中国大学生心理健康相关评定量表:
1、中国大学生生活应激量表
2、中国大学生心理健康量表
3、中国大学生适应量表
4、中国大学生人格量表
第三篇:心理学考研之[北师大]心理测量听课笔记
北京师范大学心理测量学听课笔记
第 1 章 概论、中国古代心理测量简述:
(1)公元六世纪初,南朝人刘勰的著作《新论 · 专学》中提到了类似现代 “ 分心测验 ” 的思想。
(2)在中国古代,“ 七巧板 ” 是很常见的一种儿童玩具,其实它可以作为创造力测量的工具。
(3)中国古代心理测量的思想中包含着典型的东方文化特点:定性描述及带有道德判断色彩。、中国近代心理测量的出现:
(1)1916 年,樊炳清先生首先介绍了比内西蒙量表的诞生及心理测验的发展:
(1)1904 年比内为了鉴别弱智儿童,他与西蒙合作编制成了世界上第一个科学的智力测验--比内西蒙量表宣告诞生。
(2)比内比内量表 ” 这一量表首次使用了 “ 智力商数 ” 的概念,简称为 IQ,是心理年龄和实际年龄的比值。
(5)比较有名的几个测验。智力测验:推孟的研究生欧提斯编制的团体智力测验,2 后在次基础上发展出美国陆军用甲、乙两种测验。有基于因素分析理论编制的测量多项能力的韦克斯勒的儿童智力量表。还有桑代克编制的标准化教育测验。人格测验: 1917 年武德沃斯设计的 “ 个人资料调查表 ”。1912 年问世的罗夏克墨迹图测验(RIT)和于 1943 年首次出版,由哈撒韦和麦金利编制的目前影响最大的 MMPI-明尼苏达多相人格调查表。、测量是:就是根据一定的法则用数字对事物加以确定。测量就是确定一个事物的属性的量多少。因此,我们所指的测量,就是根据一定的法则,采用一定的操作程序,给事物确定出一种数量化的价值。、测量的要素是:参照点和单位。
参照点:它可以分为两种,一是绝对的零点;二是相对参照点。最理想的参照点是绝对零。心理测量中所用的参照点都是人为的,因而测量的结果常常不能以 “ 倍数 ” 来解释。如 IQ = 100 的人 IQ = 50 的人的智力的两倍。9、量表是:就是有参照点和单位的连续体。、量表的种类有:量表是由人来制订的,依单位和参照点的不同,量表的种类也不一样。根据测量精度高低,斯蒂文斯将量表分为四个水平,由低到高分别为:命名量表、顺序量表、等距量表和等比量表。
种类 定义 特点 备注
命名量表 只是用数字来代表事物或对事物进行分类。命名量表中的数字没有任何数值意义,不能作量化分析。无大小意义,只表明类别。无参照点和单位。无法比较大小或进行任何数学方法运算。
顺序量表 表明类别的大小或某种属性的多少。主要用于分等论级和分类。数字仅表示等级并不表示某种属性的真正量或绝对值。无参照点(没有绝对零度)和单位。无法进行数学方法运算。
等距量表 存在大小关系。无绝对零度,但存在相对零点。可以进行数学运算,有相等单位。
等比量表是最精确的测量。大多是物理量表。而心理量表只能达到等距量表水平。可以知道事物之间的某种特点上相差多少及它们之间的倍数关系。有相等单位和绝对零点。可以进行数学运算。、心理测量是:就是通过观察人的少数有代表性的行为,对反映在人的行为活动中的心理特征,依确定的原则进行推论和量化分析的一种科学手段。、著名的心理测验学家安娜斯泰西认为:心理测验实质上是行为样本的客观和标准化的测量 ”。
这一定义包含有至少三个基本要素:行为样本、客观测量和标准化。心理测验要测量的是心理特征,但它要通过测量人的行为来实现,从行为测量中来推知心理特征。这就要找有代表性的少数行为作为全部行为的样本。、关于心理测量中的标准化:心理测量要做到客观必须在测验编制、实施、评分、解释过程中减少主试和被试的随意性程度。标准化的测量是测量客观性的根本保证。14、心理测验的性质:间接性、相对性、客观性。15、心理测验的种类:
(1)按测验的内容分:能力测验(智力测验、反应能力测验);学绩测验,如成套的成就测验;人格测验如 EPQ、MMPI 等。
(2)按测验的对象特点分:个别测验和团体测验。
(3)按测验表现形式分:文字测验(纸笔测验)和非文字测验。(4)按测验的目的分:描述性测验、诊断性测验、预测性测验。(5)按测验的时间分:速度测验和难度测验。
(6)按测验要求分:有最高作为测验和典型行为测验。前者要求被试尽可能作出最好的回答,而且有正确的答案。能力测验、学绩测验均属此类。后者要求被试按照日常习惯回答,无正确答案,所有人格测验均可称为典型行为测验。16、心理测验的功能:
(1)从实际应用角度看:选拔人才、岗位安置、诊断、评价、辅助咨询。(2)从理论研究角度看:搜集资料、提出和验证假设、实验分组。17、正确的测验观:
(1)测验是重要的心理学研究方法之一,是决策的辅助工具。
(2)心理测验作为研究方法和测量工具尚不完善。心理测验的最大问题是理论基础不够坚实。
(3)科学地看待测验,防止乱编滥用。、错误的测验观:测验万能论、测验无用论、文化公平测验(只有相对的文化公平,没有绝对的文化公平)、心理测验即智力测验。第 2 章 心理测验的编制、心理测验的目的是指:我们编测验干什么用。2、测验目的种类:
(1)显示性测验是指:测验题目和要测量的特征相似的测验,比如成就测验。(2)预测性测验是:为了预测一些没被测量的行为的测验。、心理测验的目标是指:编制的测验是测什么的,即测什么样的心理特征或人格特点。4、目标分析依测验不同可分为:
(1)工作分析:对于预测或选拔用的测验,主要任务就是对所预测行为活动做具体分析,即任务分析或工作分析。(2)对特定概念下定义:(3)确定测验的具体内容。5、命题的基本原则:
(1)试题要符合测验的目的。(2)内容取样要有代表性。(3)题目格式要不被人误解。
(4)语句要简明扼要。既排除与答题无关的因素,又不能遗漏答题所依据的必要条件。避免使用生僻的字句或词汇。
(5)答案确定,不应引起争议。(创造力测验和人格测验除外)。(6)题目间内容相互独立、互不牵连,对不同题目的回答不致相互影响。(7)题目不能含有答题倾向的线索。
(8)题目内容不超出受测团体的知识水平和理解能力。
(9)比开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。(10)便于施测,评分简捷。、如测验涉及社会敏感性问题时的策略:
(1)命题时假定被试具有某种行为,使他不得不在确实没有该行为时才否定,可避免否定答案过多的倾向。(2)假定规范不一致。
(3)指出该行为是常见的,虽然是违规的。、测验题目的来源:已出版的标准测验、理论和专家的经验、临床观察和记录。8、心理测验题目的类型:根据对被试的要求不同来分,可有两大类:提供型和选择型的题目。前者求被试给出答案内容,如论文题、简答题、填充题;选择型题目要求被试在几个有限的答案中选择正确的答案,如是非题、匹配题(选择题,由题干和选项构成)、填充题等。9、测验题目在编排时所遵循的普遍原则是:测试同一因素的题目放在一起、同类型的测试题尽可能组合在一起、题目的难度排列宜逐步上升。10、测题的常见编排方式:并列西蒙智力量表中首先使用了智力年龄的概念。智力年龄实际上是一种年龄量表。也是用年龄来表示测验分数。以智力年龄为典型代表的年龄常模在做解释时确实非常简捷明了,但是智力年龄并不是单位恒定相等的,而是随年龄的增长而增大。另外,智力年龄的概念显然不适用于成人,成人到一定阶段后智力发展相对稳定,表现不出一年与一年之间的差别。
(3)年级当量:它实际上就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。、百分位常模是:把一个量表分成一百个位置,对不同的得分给予相应的等级评价,依据不同的等级对结果作出解释。、百分位常模可分两类:百分等级和百分点。
(1)百分等级:一个测验分数的百分等级式是指在常模样本中低于该分数人数的百分比。百分等级是应用最广的测验分数表示方法。
(2)百分点:又叫百分位数,百分点或百分位数于百分等级的计算方法正好相反。百分等级是计算低于某测验分数的人数百分化,而百分位数是计算处于某一百分比例的人对应的测验分数是多少。
(3)还有两种常见的变式:四分位数和十分位数。两者含义相似。、百分位常模的优点与缺点:易于计算、解释、实用;不受原始得分的分数分布形态的影响。缺点是:单位不相等,特别是分数的两端;百分位无法说明被试间差异的原始分数量大小。、标准分常模:标准分数最常见的是 z 分数。标准分数是等距量表,它可以做加、减、乘、除运算。
常见的标准分常模: z 分数、Z 分数、T 分数、标准九分数、离差智商(IQ)等。标准分由原始分转换而来,这种转换又可分成:线性转换、非线性转换。16、线性转换的标准分真分数理论。(1)重测信度:考虑的误差来源是时间取样。(2)复本信度:考虑的误差来源是内容取样。
(3)分半信度:它考虑的误差来源也是内容取样,它与复本信度的差别是:分半信度考查一个测验内容的两半题目测量的是否是同一个心理特点行为。(4)同质性信度(内部一致性系数):考虑的是测验内容是否异质。(5)评分者信度:考虑的误差来源是评分者间的差别。4、信度的表示方法:(1)信度系数和信度指数: 1 信度系数: rxx = rx2T = S2T / S2 2 信度指数: rXT = ST / SX(2)测量标准误: SE = SX 1 - rxx 5、信度的意义:
(1)信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差,也就是测验的总变异中真分数造成的变异占百分之几。它直接告诉我们测量的误差有多大。(2)测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内,并且可以预测实得分数再测时可能的变化情况。6、信度的作用:
(1)解释预测个人分数的意义。
(2)解释真实分数与实得分数间的关系,明确告诉我们测验误差大小。(3)新编的测验信度应高于原有的同类测验或相似测验。
(4)下结论说某测验比较可靠,必须是依据情境的,经多次证实的。(5)它是确定测验好坏的一个指标。一般的原则是: 当 rxx< 0.70 时,测验不能用于对个人作出评价或预测,而且不能做团体间比较。2 当 0.70≤rxx<0.85 时,可用于团体比较。当 rxx ≥0.85 时,才可以用来鉴别或预测个人成绩或作用 7、重测信度:有时也叫稳定性,主要针对时间变量。
(1)重测信度采集数据得方法是:对同一组被试间隔一定的时间重复测试一次。(4)重测信度的计算方法是积差相关法,因而 rxx 就是皮尔逊的积差相关系数。(7)重测信度的时间间隔选择依测验性质和目的而定,如果测验是用于长期预测,则测量间隔长一些。对儿童的智力测验一般是两周到四周为宜。对成年人,间隔可到半年,很少超过 6 个月。
(13)使用重测信度应注意:不是所有测验都可以计算重测信度。并且重测信度只是反映了随机误差的影响,而不是反映被试心理特点的长期变化。8、复本信度:又叫等值性系数。
(1)数据采集方法是:给被试施测两个内容等值但题目不同的测验,求两组数值的相关。计算方法常见的也是积差相关法。
(2)复本信度的高低反映了两个互为复本的测验等价的程度,而不是反映一个测验本身受随机误差影响的大小。复本信度的高低关键取决于复本测验的选择,因而施题目取样问题,或者说是测验的内容取样问题。
(3)复本信度优于重测信度的地方是:避免了重测带来的记忆效应和练习效应;可用于长期追踪研究前后测量;减少了作弊的可能性。
(4)复本信度的缺点:有些测验的复本很难找到;有些测验因正迁移效应使测验性质改变;如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应。
(5)重测复本信度,即再不同的时间里施测两个等值的测验(复本),得到的相关就是重测复本信度,也叫稳定等值系数。它比单一的重测信度或复本信度都要严格、全面一些。9、斯皮尔曼晶体智力: Cattell 确定了两大因素:流体智力、晶体智力。
(1)流体智力:基本上是非语言、相对不受文化因素影响的心理功能。它与个体通过遗传获得的学习和解决问题的能力有联系。
(2 晶体智力高度依赖于文化,是个体完成那些需要习得性或习惯性反应任务的能力。晶体智力是流体智力运用在不同文化环境中的产物。6、智力的理论-Piaget 的认知发展理论:主要观点:
(1)儿童的思维与成人的思维存在质的差别。守恒是指:在物体表面看来发生变化时,能意识到物体的实质没有变化。
(2 认知发展可分为四个阶段:感觉运动阶段、前运算阶段、具体运算阶段、形式运算阶段。
(3 图式是知识获得的基础。图式是经过组织的行为模式或定义明确的心理结构。7、Guilford 与智力结构模型: Guilford 在 1967 年提出了一个智力结构模型。这一模型为三维立方体,每一维代表一个变量。它包括:(1)自变量:代表思维的内容。(2)中间变量:代表思维的操作。(3)因变量:代表思维的产物。Sternberg 与智力的三主理论:该理论包括三方面:成分智力、经验智力、情境智力。9 韦克斯勒智力测验:
(1)韦克斯勒是从 1932 年开始他的测验编制的.目的是为了设计一个适合于测量精神病人的智力测验。第一个韦氏测验出版在 1938 年。他将量表分为言语、操作两大部分。这一区分使我们可以比较测验者使用词语和符号的能力和操作实物、感知视觉模式的能力。(2)韦氏验的一般特点: 几个重要的韦氏测验: 1939 年韦克斯勒比内智力量表: 1 1916 年量表:首先采用了智商这一概念。1937 年量表:年龄范围从 1916 年量表的 3 ~ 13 岁扩展为 2 ~ 18 岁,并且编制了测验复本,分别为 L 型和 M 型。3 1960 年量表:该量表采用离差智商。斯坦福哈里斯绘人测验)、非阅读性测验、婴儿智力测验、发展程序表。非阅读和非动作测验社会行为。这一量表主要用于临床筛查和诊断。
(2)丹佛发展筛查测验(DDST):主要用于筛查智力发展的大致范围,它评定了四个行为领域:个人布朗公式: rnn = nrtt / 1 +(n - 13、1)rtt,14、rnn 是校正以后的相关系数,15、rtt 是实得的相关系数,16、n 为 rnn 对应的测验长度与 rtt 对应的测验长度之比。分半时,17、n = N /(N / 2)= 2(N 为测验全长),18、所以分半法信度的校正公式是: rxx = 2 rnn / 1 + rhh 其中 rhh 为两半测验的相关系数。
(1)卢伦公式: rxx = 1 - Sd2 / Sx2 其中 Sd2 是两半测验分数之差的方差,Sx2 为总方差。
(2)从理论上分析,分半信度反映的实际上是两半测验能够测量相同内容或心理特点的程度。、内部一致性信度(同质性信度):同质性是指测验的所有题目间性质的一致性,即测的是同一种心理特质或行为。同质性是测量单一特质的必要条件。这里讲的同质性是指测验题目得分反映的心理特质一致,同质性的判别标准是:题目间呈高正相关,如果相关很低或是呈负相关,则题目为异质。
(1)库德和里查德森提出的 K-R20 公式只适合预测题目是二分法计分的。克伦巴赫 α 系数适合于非二分法计分的测验的内部一致性信度估计法。
(2)从同质性信度的含义我们不难看出,分半信度是求测验两半之间的一致性或同质性,而同质性是求所有题目间的一致性。因此分半信度实际上是同质性信度的一种,可以作为测验同质性评价的粗略估计指标。因为可以根据测验得分来推论或验证某种概念或理论构思,因此同质性信度也是一种构思效度,或叫结构效度,它实际上介于信度与效度之间。11、评分者信度:有些心理测验的得分不是根据客观的计分系统计分的,是由评分者来给被试打分,因此,这样的测验的可靠性如何取决于评分者评分的一致性和稳定性如何。评分者信度因评分者人数不同而估计方法不一样。如果是两个评分者,独立对被试的反应评分,则可以用积差相关来计算,或用斯皮尔曼等级相关法计算。如果评分者在三人以上,而且是等级评分,则可以用 “ 肯德尔和谐系数 ”(W)来求评分者信度。12、以测量标准误表示信度的好处是:
(1)信度的单位与测验分数的单位相同,因此解释个人分数时非常直接,能直接指出允许测验分数变化的范围。
(2)测验同质与否并不影响测量标准误的大小。测量标准误的不足之处时:无法比较不同测验间的信度高低。比较不同测验的信度用信度系数(rxx)解释个人分数时用测量标准误(SE)。、常见的影响信度的因素有:样本特征、测验的长度、测验的难度、测量的时间间隔等。14、我们做信度考验时,常常选取一个与常模样本性质相同的样本施测,根据被试得分求出信度系数。
(1)样本团体得分分布的影响:求信度的样本团体得分分布如果比较窄小的话信度就低。(2)样本团体异质性的影响:样本团体异质的话,测验分数的分布就比同质样本的要广,分数的离差就大,样本的方差就大,信度就高。实际上,高信度可能是假性高信度,是由样本团体的异质造成的。但如果常模总体要求各种各样的人,则异质的信度样本求得的信度就是真信度。这时,相反的情况就需要校正信度。(3)样本团体平均能力水平的影响。由于信度也会因样本间团体平均能力水平的不同而不同,因此在求信度时,一定要注意信度样本与常模总体间是否一致。、测验的长度:在其他条件均等的情况下,测验越长,信度越高。原因在于:(1)测验越长,即题目越多,测验的内容取样就越有可能有代表性。(2)测验越长,被试的猜测因素影响就越小。、测验的难度:难度对信度的影响之存在于某些测验中,如智力测验、成就测验、能力倾向测验、教育测验等。测验的难度对信度有间接影响,因为如果测验过难,被试的得分会集中在低分区。过于容易,分数则集中在高分区。两种情况都使信度样本的得分范围变窄,变异量降低,从而低估测验信度。、测验的时间间隔:这一因素之对重测信度和不同时测量时的复本信度有影响,对其余的信度来说不存在时间间隔问题。
六章 效度
一节 1 定义 P118-119 2 信度效度的关系 1,2,(简述要求)3 效度性质 1,2 二节 效度的种类 1 效标关联效度
效标及操作定义
阿斯丁 P122 一句
常用效标 1-7 同时效度,预测效度 2 构思效度
确定构思效度的基本步骤(简述)
确定构思效度的方法()测验内方法 测验间方法 * 因素分析法实验法和观察法证实 3 内容效度
定义 P132 头 两条件 P132(二段)
确定法 专家判断,经验判断 4 表面效度 P134 三节
P135 效度的指标是指。。
效度系数的实际意义。。P135-136 头 统计推断参数 t 参数等 效度的影响因素
测验本身因素(测验题目质量,测验长度,测验实施中的干扰,被试因素)样本性质(一、二、三)如何找出干涉变量(简述)效标的性质 P141 第 8 章 智力测验 1、关于智力的定义:
(1)斯皮尔曼(Spearman)认为:智力是一种普遍的能力,它主要涉及联系的引出和相关的引出。
(2 比内和西蒙(Binet & Simon)认为:智力是正确地进行理解、判断和推理的能力。(3 韦克斯勒(Wechsler)认为:智力是个体有目的地行动,理性地思考以及有效地应付环境的总体能力。、智力是:通过经验进行学习的能力;适应环境的能力。3、智力的理论-Spearman 和 g 因素:
(1)在对各种智力和感觉能力的相关模式进行广泛研究之后,提出智力由两种因素组成:一个一般因素 g、若干个特殊因素 S。
(2 它认为 g 因子是整个大脑皮层共有的能力或能量,而 S 因子只是代表了大脑中某些神经元的生理功能。、智力的理论-Thurstone 与基本心理能力: Thrustone 总结出了七种基本心理能力:语词理解、数字、空间、知觉速度、语词流畅性、联想记忆、归纳推理。、智力的理论-Cattell 与流体智力贝利弗测验; 1949 年韦克斯勒儿童智力量表(WISC); 1974 年韦克斯勒儿童智力量表修订版(WISC-R); 1991 年韦克斯勒儿童智力量表第三版(WISC-Ⅲ)。2 各个韦氏测验的特点:
A.10 ~ 12 个分测验:多个分测验使我们不 B.仅得到总 IQ,C.而 D.且可以分析个体智力上的强点和弱点。
E.言语量表和操作量表各由 5 ~ 6 各分测验组成。这体现了左右脑功能的整合。F.共同 G.的 IQ 计分系统。这使我们可以比较被试的分测验分数,H.了解其相对强弱。I.不 J.同 K.年龄组由相同 L.的分测验有助于测验间的相互比较。韦克斯勒测验的分测验:常识、数字广度、词汇、算术、领悟、相似性、填图、图片排列、积木图案、物体拼凑、译码或数字符号、迷津、句子、几何图形、动物房。
A.常识是:一般知识性知识问题,B.要求被试用几句话或几个数字回答,C.问题从易到难排列。缺点是容易受到文化背景和被试熟悉程度的影响。D.数字广度:由顺背和倒背两部分组成。
(4)韦氏成人智力量表修订版: WAIS-R 共有 11 个分测验,其中包括六个言语量表:常识、数字广度、词汇、算术、领悟、相似性;五个操作量表:填图、图片排列、积木图案、物体拼凑、数字符号。所有 11 个分测验分数合并成全量表分数,并可以分别求得三个智力商数:言语智商(VIQ)、操作智商(PIQ)、总智商(FIQ)。WAIS-R 的标准化,被试年龄从 16 ~ 74 岁。
(5 韦氏儿童智力测验修订版(WISC-R)适用于 6 ~ 16 岁儿童。它由五个言语分测验和五个操作分测验组成。此外还有 2 个补充分测验。
(6 韦氏学前和小学儿童智力测验修订版(WPPSI-R)该测验与 WPPSI 极为相似,只是年龄范围从原来的 4 ~ 6.5 岁儿童扩展到 3 ~ 7 岁 3 个月儿童。
(7 韦氏智力量表中国修订版:从 1979 年起中国韦氏测验的修订工作由 湖南 医学院龚耀先教授主持进行,于 1982 年出版了 WAIS 的中国修订版,WAIS-RC。10 个体智力测验:
(1)斯坦福比内第四版(SB : FE):该版的最大改变在于采用智力层次模型来划分和构建分测验。
SB : FE 的智力模型: SB : FE 的编制者用一个三层次的认知能力结构模型作为编制量表的框架。这一模型的最高层是一般智力 g 因子;第二层分成晶体智力和流体智力,此外又增加了短时记忆能力。短时记忆能力包括珠子记忆、句子记忆、数字记忆和物体记忆四个分测验。
(2)考夫曼儿童成套评估测验(K-ABC)是智力和成就的综合测量。K-ABC 是以神经心理学和认知心理学研究为基础,以 “ 个体问题解决和信息加工模式 ” 定义智力。K-ABC 提供四个方面的分数:系列加工、同时加工、综合心理加工、成就测验。(3)能力区分量表(DAS):适用于 2 岁 6 个月到 17 岁 11 个月的儿童。11 团体测验于个体测验的差异:
团体测验采用多项选择,而个体测验多采用开放式问题。
团体测验多采用客观的计算机评分,而个体测验一般为施测者评分。团体测验为团体施测,个体测验为个体施测。
团体测验多用于筛选,而个体测验多用于诊断及弥补工作。
团体测验标准化样本极大,而个体测验一般只用几千名精心挑选的被试。12 团体智力测验:
(1)文化公平智力测验(CFIT)是:一个非言语流体智力测量,最早由 R.B.Cattell 发表在《教育心理学》期刊上,它的目标是测量流体智力,避免文化因素的干扰。(2)瑞文渐进测验(RPM):该测验既可以个体施测,但更多作为团体施测。该测验实际上是三个不同的测验:瑞文儿童彩色渐进测验、瑞文标准渐进测验、瑞文高级渐进测验。
我国由 北京 师范大学张厚桀教授主持,从 1985 年起对瑞文测验进行修订。图书群体测验的类型:非言语测验(古德依纳芙皮波迪图画词汇测验修订本(PPVT-R)是:由 L.M.Dunn 编制,1981 年修订的测验。测验由 175 张图片组成,每张图片上有 4 个图形。PPVT-R 适用于 2 岁半到成人,测验需用时 10 ~ 20 分钟。由于不需要语言反应,所以常用于言语障碍、大脑麻痹、阅读困难和智力落后的被试及孤僻、注意不集中的儿童。15、婴儿智力量表:
(1)葛塞尔发展程序表:该量表是最早编制于 1925 年的第一个婴儿智力量表。测量包括五个领域:大运动、精细运动、语言发展、适应行为、个体社会行为、精细动作适应行为、语言、大运动。、遗传和环境对智力的影响:遗传对智力的影响在研究中一般用遗传指数来表示。遗传指数为 0 意味着遗传在某种特质上不起作用;遗传指数为 1 意味着遗传完全决定了特质。当然,遗传对大多数特质的影响介于 0 ~ 1 之间。第 9 章 能力倾向测验、能力倾向测验一般指:测量从事某种职业或活动的潜在能力的评估工具。、能力倾向测验可分成:一般能力倾向测验、特殊能力倾向测验和多因素能力倾向测验。其中一般能力倾向测验现在就是指 4、智力测验。而 5、狭义的能力倾向测验专指 6、后两者。、能力倾向测验与智力测验的关系:
(1)智力测验一般得到的是对个体总智能的评估分数,而能力倾向测验则测量的是某种特定的或多因素的组合。
(2)智力测验与能力倾向测验的另一个区别就是:克伦巴赫提出的带宽和精确度。带宽是指测验可预测的效标全距,测验能预测的效标总数越大,则这个测验的带宽越大,智力测验比能力倾向测验的带宽普遍要大。精确度是指测验可在多大程度上预测效标,一般而言能力倾向测验的精确读为更大一些。4、能力倾向测验发展主要的原因:
(1)智力测验的局限:早期智力测验的编制者,希望通过广泛地测量心理功能,从而估计个体的总体智力水平。但是所谓的智力测验只是涉及到智力的某些方面而已。(2)体能力倾向的差异:个体在某一测验的各部分上的作业,常常表现出显著的差异。这种个体内变异在智力测验上表现为分测验得分的差异。智力测验往往不足以作出这种个体能力倾向差异的分析。
(3)素分析技术的发展:因素分析使我们能够编制多重能力倾向测验,从而为个体各种能力倾向的强弱提供比较。来自实际的需要。、能力倾向测验的特点:能力倾向测验预测失败比预测成功更为正确;必须审慎解释各种特殊能力分数间的差异;能力倾向测验在训练计划中应审慎运用。、多因素能力倾向测验:该测验被用来测量个体在不同领域内的技能和知识,从而为职业咨询、分类和人员安置提供最有效的信息。这种测验的结果不是一个总分或 IQ,而是一组不同能力倾向的分数,它们提供了一种智能剖面图,显示出个体的强点和弱点。、多因素能力倾向测验发展的原因:对个体内在差异的认识、对一般智力测验特征性的认识、职业咨询和分类的需要。统计学发展的影响。、工业能力倾向成套测验:多用于工商业的人员选择与安置。它包含了测验有一般智力测验及数学、知觉、机械和心理运动能力测验。它还建立了一组职业能力模式。、一般能力倾向测验(GATB):由美国就业服务社编制。研究者们在工作分析和对 59 各测验因素分析的基础上,设计了 GATB,主要用于职业咨询。它共有 12 个分测验,8 个纸笔测验和 4 个仪器测验。适用于高中至成人。第 10 章 成就测验 1、成就测验的历史发展:
(1)最迟在汉朝,中国便已经有了非正式的考试制度。公元 1370 年(明朝初期)笔试成为科举取士的一部分,这可视为成就测验的正式开始。
(2)今天在世界各地广泛应用的标准化成就测验发源于美国,始创者是赖斯。另外一个早期的奠基人是桑代克。并且桑代克被公认为是教育测验的鼻祖。、成就测验和智力测验、能力倾向测验的区别:成就测验和智力测验、能力倾向测验的测量对象都是认知性特质。这三种测验都是测量个体从与环境的相互作用经验中发展出来的能力。所以在本质上,它们有相同之处。能力倾向、智力测验所测量的也可以看作一种 “ 成就 ”。不过,如果从测验的目的、性质及所含盖的经验范围来看,这三种测验仍有某些不同之处,不能相互取代。
就测验的对象而言,三者本质上有重叠之处,无法加以截然区分。大多学者认为成就测验测量的是一些特定的、限定于某一范围的能力和知识,而另两者所测验的则为一般性的、较为广泛的能力。
从功能上看,成就测验也不同于智力、能力倾向测验。后两者的主要功能是预测一个人在未来的教育、训练或工作经验中可能的表现,它们的使用是在教育或训练程序以前,用以反映被试是否有接受某种课程或专业技能训练的能力。成就测验则是评估被试在接受一些教育或训练程序后所获得的学习成果,它的实施发生在教育、训练过程后。在测验的技术品质上,成就测验要注重内容效度,而能力倾向、智力测验则必须有较高的预测效度,否则就失去其基本价值。成就测验的功能:考查和报告学习成就、筛选和安置、诊断、评估教育计划或教育质量。成就测验可以用于评估某种教学法和教学程序的功效,以作为改进教材和教法的参考。4、成就测验的分类:成就测验可从其内容、用途、编制方法和原理等四个方面进行分类,具体可分为:单科测验与成套测验、评估性测验和诊断性测验、标准化测验和教师自编测验、常模参照测验和效标参照测验。5 低成就与学习障碍的评估:
(1)低成就是指:学生在学业上的成就低于其所具有的学习能力。
(2)学习障碍可视为低成就中的一类。有关学习障碍的定义,使用最广的是美国联邦法的规定: “ 学习障碍是指和口头或书面语言的理解和应用有关的一种或多种基本心理过程有障碍,这种障碍可表现在听、想、说、读、写或数学运算的能力不足。”(3)学习障碍的特点: 学习成就和一般智力之间不一致。2习障碍的绝大多数定义包含了排除标准。3 障碍是异质性的。4习障碍是一类发展现象。习障碍个体经常会因学业成就差而 8 遇到社会交往和情绪适应上的困难。6 学习障碍的评估:
(1)在学习障碍的评估中,最基本的工具是:信度、效度可靠的成就和智力测验。大多数学习障碍组合测验包括这两个领域的主要测量工具,如斯坦福外倾(E)、神经质(N)、精神质(P)三个分量表和一个效度量表(L)。E 量表的高分表示人格外倾,低分则表示内倾。N 量表得高分的被试可能焦虑、担忧、郁郁不乐、情绪反应强烈、以至出现不够理智的行为。P 量表的高分则可能表示孤独、不关心他人、难以适应外界环境、感觉迟钝、与他人关系不佳、喜欢寻衅闹事等。L 量表测量说谎或掩饰,但也代表假设的一种人格特质 , 即社会朴实或幼稚。
在 EPQ 测试结果上,男、女有差异; P、E、N 量表得分随年龄增加而下降,L 则上升。精神病人的 P、N 分数都较高,L 分数极高。EPQ 有良好的信度和效度。EPQ 的中文版,在北方地区有陈仲庚等人的修订本,南方有龚耀先、刘协和等人的修订本。EPQ 广泛应用于人格研究,较少应用于临床及其它场合。、序列系统法:人格研究表是杰克逊根据默瑞的需要理论设计的,共有 22 个量表。7、投射测验是:人格评估的工具之一,它通过被试对模糊不清、结构不明确的刺激的反应,分析、推断其人格特点。它的基本假设是:一个人对暧昧不明、非结构化的刺激的反应,由于没有明确的情境线索、过去经验或他人的观点的影响,会反映出其自身独特的人格特征。刺激本身并不含有一定的意义,然而它们所引发的反应则是有特殊意义的。此一意义来自被试对测验刺激的主观解释和想法,在不知不觉中,投射出其心理上的需要、个性、情绪、动机、冲突、防御等内在状态。、投射测验的理论基础:投射技术的缘起和发展与心理分析理论有密切关系。投射测验的设计者常用心理分析观点作为指导来选择刺激,解释测验的结果。
(1)罗夏克墨迹测验(RIT):是由瑞士精神病学家罗夏克编制的使用最广泛的墨迹测验。1921 年,他从所使用的墨迹中筛选出 10 张图片出版,这就是著名的 RIT。在 10 张图片中,有五张是黑白的,有两张除黑白外,还有红色墨迹,其余的三张则为淡彩色 , 每张图片上的墨迹都是对称的。实验的实施分为三个阶段:自由联想阶段、询问阶段、极限试探阶段。11 RIT 的计分和解释通常从三方面进行:
A.反应的部位:测试者要根据被试是对墨迹图的整体、局部,B.还是对空白处做反应,C.将各反应分类。
D.反应的决定因素:是指 E.被试做反应的依据,F.包括形状、彩色、阴影等。G.反应的内容:指 H.被试回答的内容。RIT 主要适用对象是成人,但也克应用于三或五年级以上的儿童。
(2)主题统觉测验(TAT):由默瑞和摩根在 1935 年编制出版。TAT 的材料包括 31 张图片,其中一张为空白图片。图片中绘有主题不明确的一些图画,大多数图画中包含人物。测验者每次给被试看一张图片,要求他 / 她讲一个故事,在指导语中鼓励被试尽量发挥想象力。
(3)语句完成测验的程序是要求被试将一系列的句子补充成为完整句子。9、对投射测验的评价:
(1)鉴于心理学家和临床工作者对人格的深层结构或无意识仍保持相当兴趣,投射测验作为相应的测量工具仍有其地位。因为其它人格测验根本就不以无意识内容作为测量对象。(2)投射测验作为一种测验工具,在评分、解释的客观性及信度、效度等测量指标上有待提高。
(3)应该加强从事投射测验人员的训练工作。、主体测验:是一类非结构或半结构化的、随意而非伪装的人格评估技术。(1)主体测验一般包括会谈和自我概念的测量。
(2)会谈从结构性质上来分,包括结构型会谈和非结构型会谈。
(3)语义区分测验(SDT)最早出自奥斯古德等人 1957 年的语义心理学研究。11、Q-分类或称 Q-技术是:由司蒂芬森 1953 年创立的,用于单一被试前后测验结果的相关或两个人测验结果的相关分析。Q-分类对研究自我概念的变化特别有用。第 12 章 兴趣、态度和价值测量、在兴趣测量方面贡献最大的是:史特朗,他在 1927 年完成了第一个正式的职业兴趣量表。另一个主要贡献者是库德。2、兴趣的研究:
(1)荷兰德认为:兴趣是个体人格的表现,个体对职业的选择受到动机、知识、爱好和自知力等因素的支配,但最主要的影响因素是兴趣和人格。荷兰德界定出六种主要人格或兴趣类型,与它们相应的是六大普通职业主题。
(2)罗伊认为,职业兴趣及职业选择的首要因素,是由儿童与家庭成员的关系造成的。一个温暖、和谐的家庭会使儿童成为 “ 以人取向 ” 者,而一个冷漠、疏离家庭中的儿童则具有 “ 以事取向 ” 的特点。职业选择的另一个维度是从 “ 有目的交流取向 ” 到 “ 利用资源取向 ”。依据这两个连续的维度,可以对职业角色进行分类。、史-坎兴趣量表:其前身是史特朗职业兴趣量表(SVIB)。SVIB 是由史特朗在 1927 年首先编制,当时仅适用于男性。专门为女性而编制的量表则于 1933 年出版。4、总加量表:里克特 1932 年所设计的总加评定法在编制态度量表时较为简易。这种方法假设每一项目都具有同等量值,不同被试对同一项目反应上的程度差异可以进行分极评定。
-----------------------
更多心理学考研:
http://wenku.baidu.com/album/view/fd2886eb172ded630b1cb6ea
【圣男时代】倾情奉献
第四篇:心理测量复习
心理测量
第一章 绪论 高尔顿(英)
1893年在《人类才能及其发展的研究》中首先提出“测验”和“心理测量”这两个术语。直接推动测验运动发展的第一人,最早实际从事测验活动,采用评定量表,问卷法,自由联想技术的先驱,发展出分析个别差异资料的统计方法。
受到洛克感觉论思想的影响,认为“外部世界的任何信息欲传至个人,唯一的途径是经过我们的感官。” 卡特尔
1890年《心理测验与测量》使“心理测验”第一次出现于心理文献中 文中提及了评定学生的智力水平:10项测试
与高尔顿观点相同:认为唯有通过对感觉器官的辨别力与反应时的测量才可测得智力的功能。
比奈(法)
心理测验的鼻祖,世界上第一个真正意义上的智力测验诞生
1903年《智力的实验研究》中智力是广义的,包括一切高级心理过程。
比奈观点:智力是人所具有的及其复杂的能力,非简单的方法所能测量,因此要直接选择广泛而复杂的课题才能测量智力。
与西蒙合作,完成了世界上第一个智力测验量表——比奈-西蒙量表 1905年在《心理学年报》发表《诊断异常儿童的新方法》介绍次量表,因此该量表也称1905年量表。
1908年,1911年修正,分别称1908年量表,1911年量表
在美国,最著名的修订:斯坦福大学教授推孟1916年执导修订,即S-R量表 心理测验在我国的发展:
昌盛时期:从“五四”前后至1928年,1931年6月,由艾伟,陆志伟,陈鹤琴,肖孝嵘等组织的中国测验学会在南京正式宣告成立。停止发展:1949年至1978年 重新发展:20世纪70年代后期 第二章 心理测量和测验的一般介绍
测量定义:依据一定的法制使用量具对事物的特征进行描述的过程。测量最基本特征:把事物进行区分的过程
测量三要素:测量的对象-事物的属性和特征;测量的规则或法制-给事物的属性分派数字的依据;测量的结果-描写事物属性的数字或符号。
法制有好有坏,当测量的其他条件相同时,使用不同的法制会产生不同的测量效果。测量的要素:参照点和单位。
参照点包括绝对的零点和人定的零点。不以绝对的零点为参照点的计算只能进行加减运算,不能进行乘除运算。
心理测量多采用人定的相对零点,因此其结果只有高低之分,没有倍数之分。理想的单位:有确定的意义;有相等的价值。
一般来说,心理测量的单位不够完善,既无统一的单位,也不符合等距的要求。测量水平:类别测量,等级测量,等距测量,比率测量 测量量表:类别量表,等级量表,等距量表,比率量表
类别量表又称名称量表,等级量表又称顺序量表,比率量表又称等比量表 心理量表均为顺序量表,采用相对参照点
心理测验:依据一定的心理学理论,使用测验对人的心理特质进行定量描述的过程。(依据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值)心理测量的特点:间接性,相对性,客观性
间接性是指无法直接测量人的心理,只能测量人的外显行为(特质理论)相对性是没有绝对零点
心理测量运用测验为工具,达到了解人类心理的实践活动,是动词 心理测验是了解人心理的工具,是名词
心理测验三要素:行为样组,标准化及客观性
行为样组:为了正确地,可靠地推论所要测量的东西,就得凭借一组行为,这一组行为即行为样组。
一个测验的好坏,首先决定于测题编制的好坏,即必须要求这些测题能够引发和测量出具有高度代表性的行为样组。
标准化:测验的一致性,包括测验用品的一致性,测验指导语的同一性,测验中主试与被试关系的稳定性,测验评价的一致性等
客观性:测验不受主观支配,其测量方法可以重复,测验的实施,记分和解释都是客观的。客观性是衡量科学性的一个根本标志,对心理测验来说,决定一个心理测验能否存在的必要条件。行为样组的代表性和测验程序的标准化都是为了保证这种客观性。心理测验客观性指标:信度,效度,难度,鉴别力 中等难度的项目鉴别力最高
信度:测验结果的可靠程度(信度问题实质是一组被试两次测量的一致性问题)信度的高低可用相关系数来表示,信度包括:重测信度,复本信度,内在一致性信度
一般来说,标准智力测验信度应达到0.85以上,个性测验和兴趣测验应达0.70-0.80水平,学业成就测验0.90以上。
效度:一个测验实际测量出所测特征或功能的真实性程度,心理测验最重要的客观性指标。鉴别一个测验的好坏,其首要指标是效度。效度是针对测验的目的而言的 效度分为:内容效度,结构效度,效标关联效度
内容效度:测验所选的项目测题符合所欲测验内容的程度,运用逻辑法,经验法 结构效度:测验实际测量出所欲测量的心理结构或特征的程度 效标关联效度:又称实证效度或准则关联效度 根据测验对象:认知测验(能力测验),人格测验 根据人数分类:个别测验,团体测验
根据测验材料:语言或文字测验,非语言测验或操作性测验
测验应用的功能:了解个别差异;诊断,预测和评价;甄选,分类和安置;为心理辅导和心理咨询服务;心理和教育科研的辅助手段。第三章 智力测验
智力测验也就智力测量,目的在于测量智力的高低。指在一定条件下,使用特定的标准化的测验量表对被试施加刺激,从被试的一定反应中测量其智力的高低。也指由经过专门训练的研究人员采用标准化的测验量表对人的智力水平进行科学测量的一个过程。智力测验就是对表现一个人智力水平的行为样组进行测量,用数字对之加以描述,它的结果是给人的智力行为确定一种数量化的值
智力测验结果用智商(IQ)表示,比奈提出智龄-比率智商-离差智商
智龄(MA)是由儿童答对测题的多少确定的,然后通过智龄与实龄(CA)的比较来衡量儿童智力水平的高低 智龄只能表示一名儿童智力的绝对水平,不能比较实龄不同的儿童智力的高低 智商(比率智商)首先由德国汉堡大学斯腾教授提出的 智商能表示智力的相对水平,成为比较儿童聪明程度的指标 比率智商公式:智商(IQ)=智龄(MA)/实龄(CA)*100 比率智商的基本假设:智力发展和年龄增长成正比。
离差智商,1949年韦克斯勒首次采用IQ=100+15(Z)
韦克斯勒儿童智力量表修订版(WISC-R)特点:是当今国际心理学界公认的已被广泛运用的个别智力测验量表;适用范围是6岁至16岁少年儿童;在结构上言语(文字)和操作(非文字)测验兼而有之;第一次在用于儿童的,个别实施的,汇合性的测验中采用了离差智商。韦克斯勒把全量表分为言语量表,操作量表两大部分
WISC-R将形式相同的测题分别组成份测验,每一项分测验内测题有难易之分并按难度的递增依次排列。共有12项分测验,言语量表由常识,类同,算术,词汇,理解,背数6个分测验组成,操作量表由填图,排列,积木,拼图,译码,迷津6个分测验组成,其中背数和迷津是补充测验。斯比量表第四版特点:在内容上涵盖较广泛的认知技能及信息处理能力方面的测试,突破早期版本较偏重语言的倾向,范围扩大至数量,空间及短时记忆;采用“分测验”的形式;15个分量表,主要评估四个较大领域的认知技能-语言推理,数量推理,抽象视觉推理,短时记忆;施测程序上,保存了原先适应性测验特点;提供代表一般推理能力的总分及上述四个领域的分数,四个领域中任何组合的分数,以及15个分测验的个别分数。斯比量表全量表的标准分:T=100+16(Z)瑞文测验原名渐进矩阵,是英国心理学家瑞文与1938年创制 已发展出标准型,彩色型,高级型,联合型四种 瑞文测验标准型(瑞文测验的最初型)由ABCDE五个单元构成,每单元12个测题,共60题,测题按从易到难原则依次排序 AB单元主要测量儿童直接观察辨别的能力
CDE三个单元主测一个人对矩阵(3*3)的系列关系进行类别推理的能力 这五个单元的渐进矩阵的构图说明其中的系列关系越来越隐蔽,因素越来越多,解决这类问题越来越依靠间接的抽象概括的思维能力——类比推理 瑞文推理彩色型
为了适应测量幼儿及智力低下者而设计的,共36题,将原来黑白的标准型中的AB两单元加上色彩以突出图形的鲜明性,并插入一个彩色AB单元,共12题 瑞文推理高级型
适用于智力超常者,共60题,包括渐进矩阵Ⅰ型(12题)及Ⅱ型(48题)瑞文推理联合型,简称CRT 由标准型与彩色型联合而成,由72幅图案构成72个测题的一本图册,内有A, AB,B,C,D,E六个单元,每单元12题,前三个单元彩色,后三个单元黑白,适用于5-75岁以内的幼儿,儿童,成年人及老年人。
较高的信度,中等的效度,但不能完全代替多方面相的智力测验 智力测验的优点:就评价内容来说,智力测验中严格选定的测题比较有利于考察被试的各种能力;就被评价者的范围来看,智力测验把一个人的分数与更广大的地区内的同龄人进行比较;评定学生智力发展水平的快速和有效的工具
智力测验在教育上的应用:选拔和安置;筛选,诊断和制定补救工作;教育研究成果效能核定和评价。第四章 人格测验
人格测验是以人格为测量对象的测验 人格:个性中除能力之外的部分,特指那些不同于人的认知能力的情感,动机,态度,气质,性格,兴趣,品德,价值观等。、人格特点:复合型,相对稳定性,差异性,可变性
人格测验分类:结构不明确的投射测验,结构明确的问卷测验 投射测验:罗夏墨迹测验,主题统觉测验(TAT),文字联想测验,画人或画树测验 问卷式人格测验:自陈量表,评定量表 自陈量表方法:合理建构法(逻辑法),因素分析法,实践标准法(经验法)相对应的量表:内容效度人格问卷,因素分析人格问卷,经验效标人格问卷 评定量表:以标准化程序来评定结果,评定法可以看做是观察法与测验法的结合 卡特尔16种人格因素问卷(16PF A,B,C,D,E,F,G,H,I,L,M,N,O,Q1,Q2,Q3,Q4,特点:客观性,标准化,多功能,广泛性,深刻性 明尼苏达多相人格问卷(MMPI)效度量表包括无回答(Q或?),说谎(L)15题,效度(F)64题,修正(K)30题 艾森克人格问卷(EPQ)标准分:T=50+10(Z)四个分量表:E量表(内外向),N量表(精神质,又称情绪性),P量表(神经质,又称倔强性),L量表(效度,测定受测者的掩饰,假托或自身隐蔽等情况)加州心理调查表(CPI)
四类:人际关系适应能力的测验(6个量表);社会化,成熟度,责任心及价值观测验(6个量表);成就潜能与智能效率的测量(3个量表);个人生活态度与倾向方面的测量(3个量表)
三个效度量表:Gi(好印象),Wb(幸福感),Cm(从众)
投射测验特点:使用非结构任务,允许被试有各种各样不受限制的反应(刺激材料越不具有结构化,反应就越能代表被试人格的真正面貌);测量目标具有掩蔽性;解释的整体性。投射测验的不足:评分缺乏客观标准,难以量化;缺少充分的常模资料,测验结果不易解释;信度和效度不易建立;原理复杂深奥,非经专门训练者不能使用。第五章 信度
信度的操作定义:对测量一致性程度的估计。
一般地,性能良好的能力与学习成就测验的信度应达到0.90以上,性格,兴趣,价值观等人格测验的信度系数应达到0.80以上 误差:抽样误差(信度时可忽略),系统误差(与信度无关,与效度有关),测量误差(与信效度都有关)
信度完全受测量误差的影响
真分数:心理测量中的真实值,即测量中不存在测量误差时的真值或客观值 真分数的操作定义:无数次测量的平均值,用X∞或T
Xt= X∞+Xe或X=T+E
Xe或E 表示误差分数,Xt或X表示实测分数
真分数理论的三个基本假设:误差分数的平均数是零;误差分数与真分数相互独立,即相关为零;两次测量的误差分数之间的相关为零
信度的基本定义:一组测验分数中真分数方差与实测分数方差的比率
测量误差来源于:测验本身,测验实施过程,被试本身
估计信度的方法:重测信度;复本信度;内在一致性系数;评分者信度;综合重测信度和复本信度特点的稳定-等值系数
重测信度:也称稳定系数,是一组被试在不同时间用同一测验测量两次,两次测验分数的相关系数。——估计测验中跨时间的一致性
复本信度:又称等值系数,估计两个假定相等的复份测验之间的一致性,是两个平行测验分数的相关。——估计测验跨形式的一致性
内在一致性系数:估计测验跨项目或两个分半测验之间的一致性 评分者信度:估计测验跨评分者的一致性
稳定-等值系数:估计测验跨时间和形式的一致性
估计内在一致性系数的方法:分半法,对项目反应的方差或协方差进行分析 分半法:先把一份测验按题目的奇偶顺序或其他方法分成两个尽可能平行的半份测验,然后计算两半之间的相关,即得到分半信度系数。斯皮尔曼-布朗公式修正:
斯皮尔曼-布朗公式通式:
基于项目协方差的方法:
库德-理查逊公式20(K-R20),库德-理查逊公式21(K-R21),要0,1计分 克朗巴赫
系数,适用于非0,1计分的一种内在一致性系数
斯皮尔曼-布朗方法与库德-理查逊方法假设相同,均要求测题的难度相等,组间相关相等 评分者信度:由多个评分者给一组测验结果评分,所得各个分数之间的一致性 影响信度系数的因素:分数分布范围;测验长度;测验难度 分数分布范围越宽,信度系数就越高
其他条件不变时,测验长度越长,即题目越多,信度就越高
测验的标准误差:测量误差分布的标准差,表示测量误差的大小,用Se表示,又称标准误 测量的标准误差反映的也是一组被试的情况,可以用来估计个人的真分数 用测量的标准误差估计真分数:
第六章 效度
效度操作定义:一个测验对其所要测量的特性测量到什么程度的估计,即测验的准确性 效度理论定义:效度是总变量中由所测量的特性造成的变差所占的百分比
效度的性质:针对测验结果;针对某种特定的测验目的;只能程度上的差异(即高,中,低)效度种类:内容效度,结构效度,准则关联效度
内容效度:测验用的测题对整个测验内容范围的代表性程度。验证和提高内容效度的方法:专家评定,双向细目表 结构效度:测验能说明心理学的理论结构或特质的程度,或用心理学上某种结构或特质来解释测验分数的恰当程度。准则:检验效度的参照标准,用以显示测验所欲测量的特性的变量,通常以一种测验分数或活动来表示。
影响效度的因素:测验本身的因素;测验实施和计分方式;被试的主观方面;进行效度化所依据的有关准则;样组方面
信度与效度的关系:高信度是高效度的必要条件,而不是充分条件;信度系数的平方根是效度系数的最高限度。第七章 项目分析
项目分析:对组成测验的每个测题进行分析
项目难度:表示题目难易程度的指标——等级量表 1.P=R/N 二值计分(只有答对与答错两种情况)P难度,R答对该题的人数,N参加测验者的总数 2.P=X/Xmax 非二值计分
Xmax该题的满分,X全体考生在该题上所得的平均分数 P值越小的项目,难度越大。难度值在0.35-0.65之间为好
3.分组,取得分最高的27%的被试作为高分组,取得分最低的27%被试作为低分组 P=(PH+PL)/2
对不同选项数测题的难度进行比较时,要进行项目难度的矫正
CP=(KP-1)/(K-1)CP矫正后的难度,P 未矫正的难度,K选项的数目 转换为难度的等距量表(查Z值)
避免负号的出现:Z1=Z+5 或△=13+4(Z)
5,13为平均数,1,4为标准差 难度与测验分数的分布:
正偏态分布,大多数被试集中在左侧低分端,接近零分的多,说明测验过于困难,适合于筛选性测验
负偏态分布,大多数被试集中在右侧高分端,接近满分,说明测验很多项目太容易,缺少难得项目,适合于达标测验
一般能力测验和成就测验的平均难度在0.50左右为宜
项目的鉴别力:又称区分度,指项目对不同水平的被试反应的区分程度和鉴别能力
项目鉴别指数:取27%,D=PH—PL
D值越大,项目的鉴别力越大,表示项目的质量越好 D 0.40以上,优良;D 0.30-0.39,良好,如能修改更好;D 0.20-0.29 尚可,仍需修改;D 0.19以下,劣,必须淘汰 第八章 量表与常模
常模:标准化样本的测验作业情况,一般把用作比较的团体叫做常模团体,其一般平均分数叫做常模。
建立常模:通过分析标准化样组的实际作业情况 导出分数:从原始分数转换而来的具有一定参照点和单位的测验量表上的数值,与原始分数等值的量表分数 标准化样组的条件:标准化样组的成员必须给予确切的定义;标准化样组必须是欲测量的全域的一个代表性样组;取样的过程必须有详细的描述;标准化样组的规模要有适当的大小;标准化样组是一定时空的产物。
常用的概率抽样方法:简单随机抽样,等距抽样,分层随机抽样,整群抽样 百分量表是等级量表,标准分数量表可以使测验分数表示为等距量表,即具有相当的单位的量表
标准分数Z是原始分数与平均分数的离差以标准差为单位的分数
常态化的标准分数是通过对原始分数的非线性转换而来的,有一个近似正态曲线的分布 T分数:平均数为50,标准差为10,T=50+10(Z)
百分等级:常模团体中得分在该原始分数以下的被试的百分数
百分等级是对原始分数的一种非线性转换,百分量表时等级(顺序)量表,无法加减乘除。第九章 测验的编制与使用
测验的一般程序:确定测验的目的;分析测量目标;产生测题;测验的标准化;鉴定测验的基本特征;编写测验指导书。
心理测验的使用:选择测验,施测,评分,测验结果的解释和报告及实际运用
第五篇:心理测量技能
心理测量技能
1、WAIS-RS 韦氏成人智力测验(个体测验)
项目内容:分城市和农村两式,各包括言语测验(VIQ)和操作测验(PIQ)两部分共11个分测验。其中,言语部分包括:知识、领悟、算术、相似性、数字广度、词汇6个分测验;操作部分包括:数字符号、图画填充、木块图、图片排列、物体拼凑5个分测验。(代表测验)算术、数字广度、数字符号属记忆注意能力项目。图画填充和图片排列受言语能力影响。算术及5个操作项目有时间限制。
适用范围:16岁以上,以长期生活、学习与工作所在地判断属于城市还是农村。个别测试
实施步骤: 一般先言语后操作的顺序。特殊情况可以改变。测验计分: 原始分与量表分,年龄量表分
原始分按照操作手册要求转化为平均数为10,标准差为3的相应的量表分,量表分相加可得出不同分测验分数,再相加可得总量表分,最后查表得出智商分数IQ;
年龄量表分:以10为平均数,3为标准差。13分相当84百分位子分>1
以总分变化反映病情演变:减分率≥先50%为显效,≥25%为有效。
注意事项:量表项目缺乏“情绪高涨”“思维飘忽”等项目,在躁狂症或精神分裂症受到限制;是辅助诊断工具,筛选阳性只能说明可能患有心理疾病。P1948、SDS 抑郁自测量表
项目内容:共20项,10个正向,10个反向。时间:最近一周 频度量表 适用范围:评定抑郁症状轻重程度及其治疗中的变化,特别适用于发现抑郁病人。测验计分:1~4四级评分,标准分分界值为53分,粗分×1.25后取整结果解释:无~53~轻~62~中~72~重。
反映四组特异性症状:精神-情感症状;躯体性障碍;精神运动性障碍;抑郁心理障碍。
注意事项:对严重阻滞症状的抑郁病人评定困难P1969、SAS 焦虑自测量表
项目内容:共20项,15个正向,5个反向。时间:最近一周适用范围:评定焦虑症状轻重程度及其治疗中的变化,特别适用于发现焦虑病人。测验计分: 1~4四级评分,标准分分界值为50分,粗分×1.25后取整结果解释: 无~50~轻~59~中~69~重注意事项:对各类神经症鉴别作用不大;关于焦虑症状分级量表总分值仅能作为一项参考指标而非绝对标准。P198项目内容:567项,分基础量表(10个临床和7个效度量表)、内容量表和附加量表三大类。只为精神病临床诊断,做前370题。
适用范围:18~70岁,小学毕业以上的城镇人口,农村适用性差。测验计分:除临床量表Si和Mf(线性T分)外均为一致性T分。结果解释:临床分界点:T60分。
1、效度量表解释:
Q、F、L、K:继续沿用MMPI解释标准。
Fb:后F量表,检查被试者对370题以后项目的答案效度。VRIN:反向答题矛盾量表,高分为不加区别地回答项目。
TRIN:同向答题矛盾量表,高分≥60为不加区别给予肯定回答,低分≤40为给予否定回答。
ICH:中国人低频量表,高分表明答题方向与正常人相反。
2、临床量表解释:大体同MMPI,量表0、5一般不做编码分析突出编码:次高点比第三高点至少高出5分(T分标准)。非突出编码:次高点与第三高点相差不足5分(T分标准)。12/
21、13/
31、28/82、68/86
虑。高于14分提示有临床意义。注意事项:不适合作为焦虑障碍的筛查和诊断工具;只是用来评价焦虑状态严重程度及其变化特点,不具有鉴别焦虑和抑郁障碍的功能;缺乏可操作性强的评分标准,要对评定员进行认真培训保证一致性。一次评定约15-30分钟,第14项需结合观察评分。P18115、BPRS 简明精神病评定量表
项目内容:原16项,增加2项后18项,5类因子记分。我国量表协作组增加2个项目:自知力障碍,工作不能。
适用范围:有精神病性症状的重性精神病患者,尤适于精神分裂症,但不具备诊断功能。实施步骤:
1、评定方法:观察与病人口述。评定近1周的情况。
2、评分标准:1~7 七级评分,没有或不能评定记 0,统计时删除。测验计分:总分、因子分和单项分
1、总分:算术和,18~126 之间。
2、因子分:5类,焦虑忧郁、缺乏活力、思维障碍、激活性、敌对猜疑。因子包含项目得分的算术均数,在 0~7 分之间。
3、单项分:0~7 分。结果解释:入组标准分 > 35 分。总分越高,病情越重。干预前后总分差值越大,结果解释: IQ在90~109之间的人平常,约占全体人群的50%,70~130正态分布,<70智力缺陷。VIQ、PIQ差异达10以上才有意义,优势半球有损害,VIQ < PIQ;非优势半球有损害,PIQ < VIQ
与年龄量表分比较:分测验高于平均分3分以上为强点,低于平均分3分以上为弱点
与常模量表分比较:应以10为平均数,13分及以上为强项,7分及以下为弱项 再测效应:一个月内第二次测验P>V差量增加6分,几乎显著的V>P差异可能反映有实际意义,刚刚显著的P>V差异应被忽略。
2、CRT 联合型瑞文测验(个体、团体均可)
项目内容:非文字智力测验,彩色型和标准型的合并本。72幅图,分6个单元,每单元12题。
适用范围:5~75岁均可粗评智力等级,可个别也可团体测量。实施步骤:限时40分钟,20和30分钟各报时一次,并记录所做题量。
测验计分:二级评分,对1错0。原始分转化为百分等级,再转化为IQ分数。
结果解释:IQ在90~109之间的人为中等,约占全体人群的50%,70~130正态分布,<70为弱智。注意事项:每次施测团体不应超过50人,超过30人增加主试助理。
3、中国比内 比内-西蒙智力量表是世界上第一个正式的心理测验,首次引入比率智商的概念。中国比内放弃比率智商,采用离差智商。项目内容:51题,从易到难排列。适用范围:2~18岁。农村城市共用。
实施步骤:先填写记录纸上要求的简历并签名,主试应签名,后按照指导书的实施方法进行测验,连续5题不通过,结束测验。
测验计分: 通过一题计1分,答对及认可通过的分数相加得总分,根据实足年龄和总分可查表得相应智商。
结果解释: 智商平均数为100,标准差为16。IQ在90~109之间的人约占全体人群的46.5%,70~140正态分布,≤69为智力缺陷。注意事项:施测时主被测对坐P1724、MMPI 明尼苏达多项个性调查表
项目内容:共566项,14个分量表,其中:10个临床量表,4个效度量表。用于临床诊断做前399题。
适用范围:年满16岁,或小学毕业,或没有影响测试的生理缺陷。测验计分:卡片式个别,手册式可个别可团体
记分步骤:分性别、数Q量表得分、算原始分、加K分、转换成T分(专用换算表换算)、剖面图
临床量表:
1、疑病 Hs
2、抑郁 D
3、癔症 Hy
4、精神病态 Pd
5、男子气-女子气 Mf
6、偏执 Pa
7、精神衰弱 Pt
8、精神分裂 Sc
9、轻躁狂 Ma
10、社会内向 Si
效度量表:
1、不能回答的问题 Q:566版超过30,399版超过22分为无效
2、说谎 L:原始分超过10分为无效
3、诈病 F:高分表示可能是装病;如果测验有效,F量表分数暗示 精神障碍程度
4、校正 K:判断态度是否隐瞒;对部分分量表进行加权Hs+0.5K,Pd+0.4K,Pt+1.0K,Sc+1.0K,Ma+0.2K
结果解释:标准分分界值:中国T分为60分,美国T分为70分。注意事项:P18019、MMPI-2 明尼苏达多项人格调查表第二版
因子分:精神质因子P、神经质因子N、内外向因子I、装好坏因子F、反社会因子A、男女子气因子M。
3、内容量表:内部症状类、外显侵犯行为类、消极自我认识类、一般问题类
20、MMPI与MMPI-2的典型组合模式(剖面图)(二级书 P222)
1、效度量表:(非常低 < 40 < 低 < 50 < 不高 < 60 < 高 < 100 < 非常高)1)全答肯定:L、K非常低,F非常高,呈高尖“∧”,临床量表左低右高。2)全答否定:L、F、K均高,临床量表Hs、Hy非常高。3)装好模式:L、K高,F低,呈“∨”。4)自我防御模式:L不高,F低,K高。5)症状夸大模式:L、K低,F高(接近或超过70),呈“∧”。
2、临床量表:以量表5(Mf)为垂直中线1)神经症模式:左高右低,量表1、2、3均超65A类神经症:
1、3为最高和次高,比2高出5分。解释:将个人烦恼以合理化和社会可接受的形式表现出来。B类神经症:呈现1、2、3依次下降。解释:长期的过分躯体关注,多疑敏感。C类神经症:呈现2、1、3下降。解释:慢性神经症倾向,伴有混合性躯体症状、多种躯体不适。D类神经症:呈现1、2、3依次上升,且均高于65。解释:多见于女性,为妇科方面主诉,癔病性剖面图。2)精神病模式:左低右高,量表6、8为高双峰,6、7、8组合占优势。3)边缘性模式:所有或绝大多数量表超过65,常伴F量表极度升高。5、16PF 卡氏16种人格因素测验P186 项目内容:187题,适用范围:初中以上文化程度的青壮年和老年人。团体测试,也可个别实施。测验计分:0~2三级评分(聪慧性有正确答案,对1错0),后查表得出标准分数。标准10分结果解释:以高低分特征来解释结果,标准分:1~3为低分,8~10为高分。乐群/聪慧/稳定/恃强/兴奋/有恒/敢为/敏感/怀疑/幻想/世故/忧虑/实验/独立/自律/紧张 次元人格因素包括:适应与焦虑性、内向与外向性、感情用事与安详机警性、怯懦与果断性。特殊演算公式的应用:心理健康者、从事专业而有成就者、创造力强者、在新环境中有成长能力者。注意事项:先答四个例题,每题只能选一个答案,不能漏选,尽量不选中性
6、EPQ 艾森克人格问卷项目内容:分成人版与幼年版,均88题;包括内外向(E)、神经质(N)、精神质(P)、掩饰性(L)四个分量表。适用范围:成年版:16岁以上;幼年版:7~15岁。测验计分:只回答是与否,不能漏答。符合规定计1分,不合不计分,总分按年龄与性别常模换算标准T分。结果解释:E内外向性,N情绪稳定性,P社会倔强性,K掩饰性。气质类型关系图:抑郁质(内向,不稳)粘液质(内向,稳定)胆汁质(外向,不稳)多血质(外向,稳定)分界值:(T分)三八节38.5~43.3~56.7~61.5 六一节
7、SCL-90 90项症状清单项目内容: 90题,包括10个因子(躯体化、强迫症状、人际关系敏感、抑郁、焦虑、敌对、恐怖、偏执、精神病性、其他如睡眠及饮食)。时间:现在或最近一周适用范围:了解精神病人疗效评定;了解躯体疾病患者精神症状;调查群体心理卫生问题。测验计分:总分、因子分总均分:总分/90 阳性项目数:单项分数(0~4级)>1分,(1~5级)>2分的项目阴性项目数:没有症状的项目 阳性症状均分:(总分-阴性项目分)/ 阳性项目数因子分:单类因子项目的得分结果解释:以总分高低反映病情严重程度,分界值(1~5级)总分>160,或阳性项目数>43,或任一因子分>2(0~4级)总分>70,或阳性项目数>43,或任一因
10、LES 生活事件量表
项目内容:48条,包括三个方面(家庭生活28条、工作学习13条、社交及其他7条)
适用范围:16岁以上人群。主要用于病因学研究;指导心理治疗;甄别高危人群;指导正常人群。
实施步骤:通常记录1年内的事件测验计分: 一过性事件记录发生次数,长期事件不到半年记1次,超过半年记2次。影响程度:0~4五级评分。持续时间:1~4四级评分。某事件刺激量=影响程度×持续时间×发生次数正性刺激量=好事刺激量之和 ;负性刺激量=坏事刺激量之和 ;总刺激量=正性刺激量+负性刺激量结果解释: 95%正常人一年内不超过20分,99%不超过32分。负性刺激量分值越高,影响越大。
11、社会支持评定量表项目内容:共10个项目,包括客观支持3条、主观支持4条、对社会支持利用度 3条。适用范围:了解被试者社会支持的特点及其与心理健康水平、精神疾病和躯体疾病的关系。统计指标:总分:十项之和;客观支持分2、6、7;主观支持分1、3、4、5;对支持的利用度8、9、10 注意事项:评定的时间范围应考虑每个条目的具体要求,应根据受检者本人惯用的方式和情况评定。
12、应对方式问卷项目内容:共62项,6个分量表。时间:近2年。测验计分: 分量表因子分=分量表单项条目分之和/分量表条目数 6个应对因子关系序列: 退避~幻想~自责~求助~合理化~解决问题 成熟型、不成熟型、混合型
13、HAMD 汉密尔顿抑郁量表项目内容:临床评定抑郁状态时应用最为普遍的量表,有3种版本,常用24项内容。他评量表 适用范围:有抑郁症状的成年病人,不能很好鉴别抑郁与焦虑。实施步骤:
1、评定方法:交谈与观察,两名评定员独立评分,先评当时或入组前一周,干预2~6周后再次评定。
2、评分标准:大部分 0~4 五级评分,少数 0~2 三级评分。测验计分:总分与因子分
1、总分:所有项目得分总和,2人评定取算术平均数。
2、因子分:7个因子,焦虑/躯体化,体重,认知障碍,日夜变化,迟缓,睡眠障碍,绝望感。结果解释:(总分)症状越轻,总分越低;反之亦然。24项版本:无抑郁 < 8 ~ 20 < 轻度或中度抑郁 < 35 < 严重抑郁17项版本:无抑郁 < 7 ~ 17 < 轻度或中度抑郁 < 24 < 严重抑郁注意事项:对于老年病人和躯体疾病伴发抑郁的评定在信度效度上受影响;对不典型抑郁的测评可能低估抑郁症状严重程度;量表中的焦虑症状使测评抑郁症状的特异性受影响,降低了对焦虑障碍的鉴别意义。一次评定约15-20分钟。
14、HAMA 汉密尔顿焦虑量表项目内容:14个反映焦虑症状的项目,主要涉及躯体性和精神性焦虑。适用范围:评定神经症及其他病人的焦虑状况,不适于精神病时的焦虑状况,也不能很好鉴别抑郁与焦虑。实施步骤:
1、评定方法:交谈与观察,两名评定员独立评分,先评当时或入组前一周,干预2~6周后再次评定。
2、评分标准: 0~4 五级评分。测验计分:总分与因子分
1、总分:所有项目得分总和,2人评定取算术平均数。
2、因子分:2个因子 躯体性焦虑:肌肉、感觉、心血管、呼吸、胃肠道、生殖泌尿和植物神经系统症状。精神性焦虑:焦虑心境、紧张、害怕、失眠、认知功能、抑郁心境和会谈行为表现。结果解释:(总分)无 < 7 < 可能 < 14 < 肯定 < 21 < 明显 < 29 < 严重焦
干预效果越好。
注意事项:评定约20-30分钟,评定入组前一周情况,以后一般隔2-6周评定一次;BPRS适宜于对中、重度精神病性症状评定,对轻度评定不理想,不具备精神病性障碍诊断功能,且关注阳性症状较多,阴性症状反映不足。P184
16、BRMS 倍克-拉范森躁狂量表项目内容:原11项,增加2项后为13项。我国量表协作组增加2个项目:幻觉,妄想。
适用范围:评定躁狂状态,适于情感性和分裂情感性精神病躁狂发作成年患者。实施步骤:
1、评定方法:会谈与观察,评定最近一周情况。
2、评分标准:0~4 五级评分。
测验计分:总分 0~5:无明显躁狂症状。6~10:肯定躁狂症状。>22:严重躁狂症状。
结果解释:总分越高,病情越重。干预前后总分差值越大,干预效果越好。注意事项:应由经过训练专业人员担任;评定约20分钟,评定入组前一周情况,以后一般隔2-6周评定一次;对精神分裂症的青春型兴奋不敏感,尽管兴奋明显评分却很低。P18717、WISC-RC 韦氏儿童智力量表
项目内容:共12项分测验。言语量表由常识、类同、算术、词汇、理解、背数6个组成;操作量表由填图、排列、积木、拼图、译码、迷津6个组成。背数与迷津为备用测验,同类测验失效时使用。
适用范围:6~16岁少年儿童。城市农村共用。实施步骤:言语测验和操作测验交叉进行。测验计分:
1、实足年龄计算:精确到天,测验日期减去出生日期,不够的向前借位,1年=12个月,1月=30天。
2、量表分与智商的换算:原始分需要查表转换为量表分,其提供的量表分是在儿童自己所属的年龄组内转换。
结果解释:合计分不计备选项目分。分界点:70分,≤69为智力缺陷。
18、CBCL 儿童行为量表
项目内容:分四种表格:家长用(2~3岁,4~18岁)、老师用、年长儿童自评用。分三个部分:一般情况、社会能力和行为问题。
适用范围:4~16岁儿童,筛查社会能力和行为问题,主要识别与评价行为和情绪问题高危儿童,但不能诊断和反映严重程度,对儿童孤独症和精神发育迟滞的敏感性也不足。
实施步骤:(二级书 P200)
1、评定方法:针对不同情况选用合适版本。
2、评分标准:第一部分不计分。第二部分按照规定计分。第三部分依据最近6个月,0~2三级评分。测验计分:
1、第二部分,社会能力归纳为3个因子:活动情况、社交情况及学习情况,得分越高,能力越强。
2、第三部分,算术和为总粗分,分值越高,行为问题越大。结果解释:
1、第二部分,T分 < 30分为可疑异常。
2、第三部分,总粗分正常上限分界值:
男孩4~5岁:42分6~11岁:40~42分12~16岁:38分女孩4~5岁:42~45分6~11岁:37~41分12~16岁:37分因子分上限分界值:T70分。
测量公式
百分等级:PR=100-(100*R-50)/N(R为排名顺序,N为总人数)
百分位数:(100-PR)/(最高分-PP)=(PR-1)/(PP-最低分)(PR为百分等级,PP为百分位数)
信度系数:R2222222
xx= ST/ SX=1-SE/SX(SE为随机误差方差,SX为总方差,ST为测验真方差)
效度系数:S2222222
X =SV+ SI+SE(SX为总方差,SV为测验有效方差,SE为随机误
差方差,S2
I为系统误差方差)