晋江文学城
下一章 上一章  目录  设置

27、测量的信度 ...

  •   二、测量的信度
      (一)定义
      信度即是测量结果的稳定性程度,也叫测量的可靠性。信度有三种等价定义:
      1.信度是真分数变异与观测分数变异之比:
      2.信度是真分数与观测分数的相关系数的平方:
      3.信度是两个平行测验间的相关系数:
      其中,就是信度,又称信度系数。一般性能良好的能力与学习成就测验的信度系数应达到0.90以上,性格、兴趣、价值观等人格测验的信度系数应达到0.8以上。
      (二)估计方法
      1.重测信度
      (1)含义:用同一个测验,对同一组被试前后两次施测所得结果的一致性程度,又称稳定性系数。其大小等于两次测验分数之间的相关系数。估计测验跨时间的一致性。
      (2)计算:皮尔逊积差相关。
      (3)条件:①所测特质须稳定。②遗忘和练习的效果基本上相互抵消。③两次施测之间,被试在所要测查的心理特质方面没有获得更多的学习和训练。
      (4)误差来源:主要由时间间隔造成,还包括其间测验条件和受测者身心状况的改变、测验所测特质本身不稳定等。
      (5)评价
      ①优点:能提供测验结果是否随时间而改变的资料,可作为预测受测者将来行为表现的依据。
      ②缺点:易受练习和记忆的影响、只适用于测量那些不会随时间变化而改变的特质。
      2.复本信度
      (1)含义:用两个平行的测验对同一组被试进行施测所得结果的一致性程度,若两个复本是同时连续施测的,则称其为等值性系数;若两个复本是相距一段时间分别施测的,则称其为稳定性与等值性系数(是对信度最严格的检验,其值最低)。复本信度的大小等于两个复本测验分数之间的相关系数。等值性系数估计测验跨形式的一致性,稳定性与等值性系数估计测验跨时间和形式的一致性。
      (2)计算:皮尔逊积差相关
      (3)条件:①能够构造出两份及以上的真正的平行测验(内容、形式、难易等方面相同或相似)。②被试要有条件接受两个测验。
      (4)误差来源:①对于等值性系数而言,主要是由题目内容造成,另外还包括被试方面的情形波动、动机变化等;②对于稳定性与等值性系数而言,除题目内容的影响外,还会受到由于时间间隔造成的影响,所以信度较稳定性系数、等值性系数要低。
      (5)评价
      ①优点:应用范围较重测信度的范围大。
      ②缺点:严格的平行测验很难构造;容易受练习,记忆和迁移的影响;测验的难度会由于重复而有所改变;
      3.分半信度
      (1)含义:将一个测验分成对等的两半后,所有被试在这两半测验上所得分数的一致性程度。估计跨两个分半测验间的一致性。一般可按题号的奇偶性、题目难度、题目内容分半。
      (2)计算:同样是计算两半分数之间的积差相关系数,但因为这只是半个测验的信度,还必须使用矫正公式矫正。
      (3)条件:①通常在只能施测一次或没有复本的情况下使用。②测验无法分半时不能用。
      (4)误差来源:主要来源题目本身,与时间因素无关。
      (5)评价
      ①优点:可在没有复本的条件下使用。
      ②缺点:有些题目难以分半,不同分半方法之间有差异,不适合用于速度测验。
      4.同质性信度
      (1)含义:指的是测验内部所有题目间的一致性,也称内部一致性系数。包括两层含义:①所有题目测的都是同一种心理特质;②所有题目得分之间都具有较强的正相关。估计测验跨项目的一致性。
      (2)条件:不是所有的测验都要求较高的同质性信度,这取决于测量的目的。一般用于预测的测验或学绩测验可以不考虑同质性,而在提出或验证某种心理学理论的概念和假设时,则须考虑。
      (3)误差来源:主要来源于内容取样和所研究行为的异质性。
      (4)评价:
      ①优点:只施测一次,可以排除练习和记忆的效果。
      ②缺点:只可在测量单一概念的测验上使用,不适合应用于速度测验。
      5.评分者信度
      (1)含义:多个评分者给同一批人的答卷进行评分的一致性程度。估计测验跨评分者的一致性。
      (2)计算
      (3)条件:适用于一些无法完全客观计分的测验,如创造力测验及投射测验等。
      (4)误差来源:评分者之间的差异。
      (5)评价
      ①优点:适合无法客观计分的测验。
      ②缺点:容易受到评分者主观判断的影响。
      (三)影响因素及改进方法
      1.影响因素
      (1)主试方面
      ①施测者不按规定施测,故意制造紧张气氛,或给考生一定的暗示,协助等,则测量信度会大大降低;
      ②评分者评分标准掌握不一,也会降低信度。
      (2)被试方面
      ①于个体而言,被试的心理特质水平的稳定性,如其身心状况、注意力、态度等;
      ②于团体而言,离散程度和团体的平均水平。团体同质性越大,全体得分分布越窄,信度越小,可能低估信度,反之,可能高估信度;另外,团体均分过高或过低,都会使得分分布变窄,而低估真正信度。
      (3)测量工具方面
      测量工具是否稳定、试题取样、试题难度、测验长度、试题之间的同质性程度(一套测验中同质性题目越多,同一特质被考查的次数越多,全体得分分布越广,信度越高)等;
      (4)施测过程方面
      考场是否安静、光线和通风是否良好、设备是否齐全、桌面是否合乎要求;另外,对于计算稳定性系数及稳定性与等值性系数时,两次测验间隔时间越短,信度越高。
      2.改进方法
      (1)主试方面
      主试严格执行实测规程,评分者要严格按标准给分。
      (2)被试方面
      选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。
      (3)测量工具方面
      精心编制测验量表,避免出现较大的系统误差。适当增加测验长度,但新增项目须与原题同质,且新增项目须适度;使所有题目难度接近正态分布,并控制在中等水平,这样得分分布更广;努力提高试题的区分度。
      (4)施测过程方面施测场地按测验手册的要求进行布置,减少无关因素的干扰。
      (四)作用
      1.信度是测量过程中随机误差大小的反映。信度很低,随机误差就很大,这种偏差完全是随机决定,测量中的系统误差与信度无关。
      2.信度可以用来解释个人测验分数的意义。
      3.信度可以帮助进行不同测验分数的比较。
      4.提高信度可以提高统计检验力。

  • 昵称:
  • 评分: 2分|鲜花一捧 1分|一朵小花 0分|交流灌水 0分|别字捉虫 -1分|一块小砖 -2分|砖头一堆
  • 内容:
  •             注:1.评论时输入br/即可换行分段。
  •                 2.发布负分评论消耗的月石并不会给作者。
  •             查看评论规则>>