晋江文学城
下一章 上一章  目录  设置

32、心理测验 ...

  •   心理测验
      一.心理测验的编制
      (一)测验编制的基本程序
      1.确定测验目的:明确测量对象、确定测量目标、明确测量用途(描述性、诊断性)。
      2.制定编题计划:明确测验的内容,使内容全面而具有代表性,并明确各个内容的相对重要性。
      3.编辑测验项目(题目编制技术):收集测验资料(丰富、普遍、有趣味);选择测验项目形式(简答、论文题等);编写测验项目(对照双向细目表)。
      4.预测与项目分析:预测对象有代表性,预测情境要和正式实测时一致;之后,对项目的难度、区分度等进行分析。
      5.合成测验:完成测试项目的选择、编排(并列直进式、混合螺旋式)及复本的编制。
      其中,并列直进式是将整个测验分为若干分测验,属于同一分测验的项目,依其难度由易到难排列;混合螺旋式则是先将各类项目按难度分成若干不同层次,再将不同性质的项目予以组合,作交叉式的排列,其难度渐次上升,其优点是被试对各类项目循序作答,从而维持作答的兴趣。
      6.测验的标准化:测验的编制、施测、评分及解释测验分数的程序的一致性。
      7.鉴定测验:主要是鉴定测验的信度、效度、测验量表及常模。
      8.编写测验说明书:向使用者说明测验目的及功用、理论依据以项目选择依据、实施方法、测验的信、效度、测验适用人群的特点和性质、测验的答案及评分、常模表等等。
      (二)测验目标与双向细目表
      1.测验目标
      测验目标是指测验是用来测量什么心理变量或行为特征的;须有操作定义。
      2.命题双向细目表(命题蓝图)
      命题双向细目表是测验编制过程中的重要依据,相当于编题的计划清单,是包括两个维度的表格(左一列表示测验内容,第一行表示测量结果,数据表示某内容的权重)。它指出了测验所包含的内容与要测定的各种技能,以及每个内容和技能的相对重要程度。双向细目表可以使命题工作避免盲目性,而具有计划性;使命题者明确测验的目标,把握试题的比重和分量,提高命题的效率和质量;可提高测验的内容效度,克服专家评定法的一些不足。
      (三)编制原则
      1.测验编制的基本原则
      信度好、效度高、难度适中、区分度强。
      2.题目编制的一般原则(技术)
      (1)项目取样有代表性。
      (2)项目取样范围同编题计划所列项目范围一致。
      (3)初编题目数量多于最终所需数量(一般是多一倍),便于筛选。
      (4)题目用语力要求简练、明了。
      (5)题目格式不被误解。
      (6)没有引起争议的答案。
      (7)避免涉及社会禁忌和个人隐私。
      (8)题目间相互独立。
      (9)项目难度有一定的分布范围。
      (10)力求施测和评分省时省力。
      3.测题的种类及编制
      根据受测者的应答方式不同,题目分为客观题(固定应答型题目)和主观题(自由应答型题目)。
      (1)客观题
      ①是非题:从是非两个答案中做出选择。
      A.优点:出题容易;回答方便;评分简单;使用广泛。
      B.缺点:只适用考察对简单观念或知识的了解;容易造成猜测。
      ②选择题:从选项中选择一项自认为正确的答案。
      A.优点:不仅评分简单、省时、客观;而且相比是非题,它更少受猜测的影响;使用广泛。
      B.缺点:编拟迷惑答案比较困难;无法测量出被试的言语表达能力和概括、组织能力;猜测影响仍然不能完全排除。
      ③匹配题:测题结构上包含两个部分,一个为一组刺激项目,另一个为一组反应项目,通常是在后者中选出与前者相适合的项目。
      A.优点:覆盖面较广、编拟起来也相对容易。
      B.缺点:对选项的同质性要求较高;无法测量出被试的言语表达能力和概括、组织能力。
      (2)主观题
      包括填充题、简答题、应用题、论文题、联想题、操作题等。我们着重介绍各类题型中最易于编制的简答题:
      简答题要求被试用一个正确的短语或句子或较为简单的一段文字来完成测题。
      ①优点:编写灵活;不易受猜测的影响;可测量各种层次的知识目标和能力,应用较为广泛;不用考虑选项之间的同质性问题。
      ②缺点:不能测量复杂的知识和能力;评分不够客观且费时。
      (四)测验标准化
      1.测验内容标准化
      首要前提保证所有受测者施测相同或等值的题目。
      2.测验编制标准化
      在确定测验维度、题目编制、测验信度和效度分析、项目分析等方面严格按照规定程序进行。
      3.实测过程标准化
      (1)具有相同的测验情景(采光、房间布置等);(2)相同的指导语(说明测验目的及如何做反应);(3)相同的测验时限(不同测验对时间限制要求不同)。
      4.测验评分标准化
      一般要求评分者之间一致性达到90%以上,便可认为是客观的。具体包括:
      (1)对反应及时清楚地记录,避免遗忘;(2)有记分键(即标准答题卡);
      (3)将受测者反应和记分键比较,确定其反应应得分数。
      5.解释分数标准化
      某一测验分数只有与一定的参照标准相比较,才能显现其所代表意义。
      (五)测验等值
      1.含义
      通过对考核同一心理品质的多个测验形式做出测量分数系统转换,使得这些不同测验形式的测验分数之间有可比性。
      2.测验等值的条件
      (1)同质性:被等值的不同测验形式所测的必须是同一种心理品质且内容与范围基本相同;
      (2)等信度:被等值的不同测验形式必须有相等的测验信度;
      (3)公平性:考生参加被等值的不同测验形式中的任一个测试,等值后的结果都是一样的;
      (4)可递推性:由测验X与测验Y之间的等值关系以及测验Y与测验Z之间的等值关系,可以递推出测验X与测验Z之间的等值关系;
      (5)对称性:从等值的两个测验中的任何一个出发,得到的等值结果都应该是相等的;
      (6)样本不变性:两测验的转换关系是内在的,不随所使用样本的变化而变化。也有学者将前四个条件合称为公平性。
      3.计算方法
      (1)等百分位等值
      如果两个分数对于任何一个被试群体都有相同的百分等级,那么这两个分数就是等值的。具体操作是寻找与x分数有相等百分等级的y分数。
      ①作图法
      在同一坐标系中画出两个测验的累加百分位曲线图,找出相同百分等级的x与y。
      ②计算法
      已知x,由求出PR,再由求出y。
      (2)线性等值
      如果两个分数在各自群体内的标准分数相等,则这两个分数是等值的。
      y=Ax+B,AB为等值常数, , 。
      4.等值结果的表示方法
      (1)表列法;(2)公式法;(3)图示法。
      5.基本概念
      (1)经典理论等值与项目反应理论等值
      ①经典测量理论等值以经典测量理论为指导;②项目反应理论等值以项目反应理论为指导,对等值的要求更宽松,等值结果更准。
      (2)测验分数等值与项目参数等值
      ①前者指各测验间原始分数的等值;②后者指各测验间项目参数的等值,且只能在项目反应理论下指导才行。
      (3)水平等值与垂直等值
      ①前者指被等值的测验难度水平、受测团体的能力都相似;②后者指被等值的
      测验难度水平、受测团体的能力水平都不同。
      (4)等值标准误差与等值偏差
      ①前者指抽样引起的等值误差,等值分数越趋于分布两端,其值越大;②后者指等值处理方法不当引起的等值误差。
      (5)锚测验与数据平滑法
      ①锚测验:测验等值设计中,用来关联两个待等值的测验,以寻找两形式的等值关系的一组测验;其制定要求包括:与原测验一样测量相同的心理品质、等信度、长度不小于原测验的1/5。
      ②数据平滑法:用来使分布曲线趋近平滑的统计技术,以减少对等值的影响。
      6.步骤
      (1)定等值目标;(2)做等值设计;(3)采集数据;(4)选操作定义;
      (5)算等值结果;(6)评价
      二、心理测验的施测
      (一)测验的设计
      测验的设计是指对测验的结构和内容、进行测验可达到的目的、测验结果可提供的信息、测验的适用范围、测验的心理测量学指标等进行总体设计。进行心理测验前,主试应充分了解测验的设计,根据考察的目标、受测者的特点、测验设计等来选择合适的测验。测验的使用一般应按照测验手册严格执行。总体上测验过程包括选择测验、测验实施、测验评分、结果报告四个过程。
      测验的实施
      施测前的准备工作:准备好测验材料;熟练掌握施测手续;熟记测验指导语并能用口语清楚流利地说出来。
      指导语:主要作用是使受试者按正确的形式对题目做出反应;测试的主持者和指导语都应保持中立,不倾向于答案的任何种方向。
      测验情景:测验场地(通风,光线,噪音),座位,答案纸型等都会影响测验分数。
      测验焦虑:会影响结果的真实性。测试时要稳定被试的情绪。另外能力越高,测验焦虑越低:越渴望得高分的人,测验焦虑越高。竞争性测验焦虑高,经常接受测验的人的焦虑低。轻微焦虑会增加测验效果,焦虑太高或毫无焦虑则会降低测验效果。
      与受测者建立良好的协调关系:以保证他能按指导语行事。
      评分技术:及时清楚地记录被试的反应,制作标准答案,将被试反应与标准答案进行比较。
      测验分数的解释
      解释是指主试如何向被试或有关人员报告测验结果
      测验结果的报告:
      测验结果的综合分析:首先,应根据心理测量的特点进行分析。其次,不能把分数绝对化,绝不能根据一次测验的结果下定论。另外,主试本人更应该对测验有一个正确的认识。测验结果的分析还必须参考其他各项资料,应兼顾个体间差异和个体内差异的分析。
      测验结果的解释和定义:向被试、有关人员或单位报告测量的结果。
      测量结果报告的注意事项:
      ①一般而言,不要把测验结果直接告诉家长或被试,而只需告知测验结果的解释。
      ②在对结果进行解释时,应对测验中出现的异常情况给予恰当的说明。
      ③建议不要采用绝对的语言,妄下定义。
      三、测验常模
      (一)分数转换
      1.原始分数与导出分数
      (1)原始分数:测验中直接获得的分数。
      (2)导出分数:在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的具有一定单位和参照点,且可以相互比较的分数量表或符号系统。
      2.百分等级
      (1)含义
      指一个群体的测验分数中,得分低于这个分数的人数的百分比(计算见心理统计学部分)。百分等级分数是应用最广的导出分数。
      (2)评价
      ①优点:A.具有可比性;B.易于计算;C.解释方便;D.较适用于各种被试和各种性质不同的测验;E.百分等级不受原始分数分布状态的影响。
      ②缺点:A.不具有可加性;B.单位不等,尤其在分布的两个极端。如果原始分数的分布是正态或近似正态,就会出现百分等级单位在中间比较密集而在两端比较分散的状况;当靠近均值的原始分数转换为百分等级时,分数间的差异会被夸大,当原始分数靠近两端时,分数间的差异则会被缩小;C.百分等级只具有顺序性,而无法用它来说明不同被试之间分数差异的数量。D.百分等级是相对于特定的被试团体而言的,所以,解释时不能离开特定的参照团体。
      3.标准分数及变式
      (1)标准分数
      具有稳定性、明确性、可加性、可比性等优点,但存在计算繁杂、有负值和零、有小数、在进行比较时须满足数据的原始形态相同等缺点(详见心理统计学部分)。另外,当两个原始分布形态不相同,这时可进行非线性转换,将原始分数都转换成正态分布,具体步骤分为:①原始分数转为百分等级;②百分等级查表得出Z值。
      (二)分数合成
      1.含义
      分数合成是指,将几个分数或几个预测源组合起来,以获得一个合成分数或作出总的预测;具体包括项目的组合、分测验或量表的组合以及测验或预测源的组合。
      2.合成方法
      (1)临床诊断法:根据经验而依靠直觉合成分数。
      具有高度综合性、灵活性;但不够客观、数量指标不精确、要求判断者受过训练并具有丰富经验。
      (2)加权求和法:若各测验所测特质间有互相代偿作用,这些测验的分数又是连续型资料,并能大体同时获得时,我们可以采取加权求和的方法;具体加权方式包括:单位加权(测验分数直接相加)、等量加权(转换为Z分数后相加)、差异加权(转换为Z分数后,根据不同测验的权重进行相加)。
      (3)多重回归法:研究一种现象和其他多种现象在数量上相互联系和相互制约的统计方法。
      (4)多重划分法:在各个特质上都确定一个标准,从而把成绩划分为合格和不合格两类。只有通过了前一个测验,才能继续实施后一个测验,只有每个测验都合格,总要求才算合格,又称连续栅栏法。
      (三)常模及常模团体
      常模参照分数是将受测者的成绩与具有某种特征的人所组成的有关团体作比较,根据一个人在该团体内的相对位置来报告他的成绩。这里,用来做比较的参考团体叫常模团体,常模团体的分数分布叫做常模。
      1.常模
      根据标准化样本(常模团体)的测验分数,经过统计处理而建立起来的具有参照点和单位的测验量表;是关于原始分数、导出分数和常模团体的有关具体描述。
      2.常模团体
      (1)含义:是具有某种共同特征的人组成的一个群体。若群体较大,常模团体则是该群体的代表性取样,因此又称作标准化样本。
      (2)注意事项
      ①群体构成的界限必须明确;②样本必须具有代表性;③取样过程必须详尽描述;④样本大小要适当;⑤要注意常模的时间性;⑥一般常模与特殊常模结合。
      3.常模的编制
      (1)确定群体,抽取常模团体;(2)对常模团体进行施测,获得测验分数及
      分数分布;(3)制作常模分数转换表,即常模量表。
      4.常用的常模参照分数
      常模一般可分为两类,一类是发展常模量表,是指某类个体正常发展过程中各个阶段的一般水平。是将被试得分与不同发展水平的人作纵向比较;另一类是组内量表,是指某类个体在测验所测特征上的一般表现水平,是将被试得分在一个团体内作横向比较,主要有百分等级常模与标准分数常模两种。
      (1)发展量表
      ①年龄常模:各年龄儿童的正常的一般水平。通过将被试的成绩与相应年龄组学生的正常水平作比较,判断其水平。
      A.要素:区分不同年龄组的题目、常模团体、常模表(得多少分该归入哪个年龄的对照表)。
      B.评价:容易理解但是非等单位,如3岁和4岁间的差异不等于10岁和11岁间
      的差异。
      ②年级常模:不同年级学生在某种测验上的正常的一般水平。
      通过将被试的成绩与相应年级学生的正常水平作比较,判断其水平。
      (2)商数
      ①教育商数
      ②智力商数(比率智商)
      ③成就商数
      (3)百分等级常模
      基于某个常模团体,为测验的原始分数与百分等级之间建立起对应关系的组内常模。百分等级指出的是个体在常模团体中的相对位置。这种常模由原始分数、百分等级、常模团体组成,常以转化表形式出现,包括简单转换表和复杂转换表。使用者可将原始分数转为相应的百分等级,也可根据百分等级找到原始分数。
      (4)标准分数常模
      基于某个常模团体,将测验的原始分数转换成标准分数Z或导出分数T,从而反每个分数在常模团体中相对位置的一种组内常模。
      (四)项目分析
      1.测验的预测
      在获得预测资料之后才能对项目的难度和区分度进行量化分析。
      (1)前测—后测方法;假设前测为“未掌握组”,后测为“掌握组”。
      (2)已接受教学组—未接受教学组方法;假设未接受教学组为“未掌握组”,已接受教学组为“掌握组”。
      (3)对照组方法:由教师评定是否掌握知识。
      2.难度分析
      与常模参照测验一样,常以通过率(P)表示。有人认为没有必要在标准参照测验中分析测验的难度。
      3.区分度分析
      (1)难度差值
      ①掌握组—未掌握组鉴别指数(D):D=PA-PB;PA和PB表示掌握组和未掌握组的通过率。-1≤D≤1。
      ②个人获得指数(DIG):采取前测—后测法时,可以获得在前测中错误回答而在后测中能够正确回答的被试人数的比例。其值在0~1之间。
      (2)相关系数项目得分和测验总分之间的一致性程度,常被用作项目区分度的指标,其值在-1~1之间。
      4.内容范围的确定
      内容包括欲测量特质中蕴含的全部行为。
      (1)内容范围具有明确边界;
      (2)每一内容范围均可分类,每类可再分为更细小的类;
      (3)界定结果常以命题双向细目表(包括教学目标、教学内容以及每一内容和每一目标结合后所占的比重)呈现。
      5.内容效度分析:常用专家评定法,如填写内容评定表、五级量表。
      (五)常模参照测验与目标参照测验
      1.相同点
      (1)均根据一定的法则对人的行为和心理进行量化;(2)两种测验都具有间接性、相对性及客观性等特点;(3)均有三个要素,即行为样组、标准化和客观性。(4)二者在信度、效度、难度和区分度的指标中,有很多是相同的(如荷伊特信度、内容效度、校标效度、通过率、鉴别指数法、相关法等)。(5)教育测验应该注重两种目标并举。
      2.不同点
      (1)目的不同
      常模参照测验将被试与常模团体相比较,旨在评价被试在团体中的相对地位;标准参照测验则是将被试与某一绝对标准比较,旨在评价被试有无达到该标准。
      (2)信效度方面在常模参照测验中常用相关系数作为信度指标,以测验与校标之间的相关系数作为校标关联效度的指标;标准参照测验中则采用荷伊特信度和分类一致性信度,以“决策效度”作为效度指标。
      难度、区分度方面
      常模参照测验要求一定的难度,区分度关心对心理品质的区分;标准参照测验不太重视难度,区分度关心对在其内容范围上的已掌握者和未掌握者作出最大限度的区分。

  • 昵称:
  • 评分: 2分|鲜花一捧 1分|一朵小花 0分|交流灌水 0分|别字捉虫 -1分|一块小砖 -2分|砖头一堆
  • 内容:
  •             注:1.评论时输入br/即可换行分段。
  •                 2.发布负分评论消耗的月石并不会给作者。
  •             查看评论规则>>