应和无法观察的被试的潜在特质联系起来了,但CTT采用了线性确定性模型,而潜在特质理论采用了非线性概率模型。(2分)
35.行为样本测查的部分心理特质与特定的行为,而非全部。这于质检、水检不一样,行为样本涉及了抽样问题。 【3.5.50.B.2】(×)(1分) 行为样本测查的部分心理特质与特定的行为,而非全部。这于质检、水检一样,涉及了抽样问题。(2分) 得 分 评卷人 复查人
36.请简述误差的来源。 【3.2.36.B.2】
五、简答题(本大题共3小题,31题6分,32、33题10分,共26分)
答:①来源于测量工具。项目取样;表达的清晰与准确;及其可操作性;信度与效度的问题。(答对2项即可)(2分)
②来源于测量对象。被试的情绪、技能与技巧、学习、发展与教育、练习疲劳、反应倾向等。(答对2项即可)(2分)
③来源于测量过程。测试环境、主试因素、意外干扰、评分计分等。答对2项即可)(2分)
37.请简述IRT比CTT的优越性。 【3.4.45.B.2】
①IRT在估计被试能力或潜力特质时,同时考虑被试的反应组型,因此对于原始得分相同但反应组型不同的个体,往往能够提供不同的能力估计值。(2分)
②IRT可以针对每一个被试提出其能力估计值的测量误差指标,而不是以一个笼统
心理测量与测验期末自测试卷(A)第6页(共7页)
的标准误来代表测量误差,能够比较精确地断定每一个被试能力估计值的误差范围。(2分)
③IRT所采用的项目参数,不依赖于被试样本,也不依赖于项目库。(2分) ④IRT可以由同质性比较高的分测验中计算出被试的能力估计值,主试在时间、精力有限的情境下,可以较快而又不失精确地获得所需要的信息。(2分)
⑤IRT提出的项目信息函数和测验信息函数的概念,可以作为评定个别项目或整份测验的测量误差的指标,完全可以取代传统的“信度”概念。(2分)
38.随着计算机技术的发展,CTT逐渐被淘汰,请简述CTT的缺点与不足并详细说明。
【3.4.43.B.2】
①统计量的样本依赖性,抽样变动大。CTT所采用的统计量,诸如难度、区分度和信度等,都是一种样本依赖的指标,即指标会随着样本的特性而改变。(2分)
②能力与难度量表的不一致,测量误差大。在CTT中,被试能力量表时测验的卷面总分,其参照系是全部项目,项目难度量表是被试群体的得分率,其参照系是被试群体。(2分)
③信度估计的不精确性,复本施测难。CTT中对信度的估计很不精确,估计值具有笼统性,每个测验都只有一个信度值。(2分)
④测验结果拓宽的有限性,预测力缺乏。CTT主要应用于标准化技术和随机化技术来控制变量误差,但是在这种技术下获得的结果只能在相同条件下成立,却不能将其推广到非标准化情境中去,使得测验的应用范围受到限制。(2分)
⑤测量分数的测验依赖性,分数难比较。用CTT来解释测验分数时,必须依赖原测验来做解释,故难以比较不同的测验。(2分)
心理测量与测验期末自测试卷(A)第7页(共7页)
得 分 评卷人 复查人 六、论述题(本大题共1小题,每小题15分,共15分)
39.请论述误差控制的方法并举例。 【3.2.40.C.2】
答:①测量内容的标准化,测量内容是对所有受测者施测相同的或等值的题目。(1分)列如,测数学补习是否有限,小明考数学,小红考英语,即测量内容不一致。(2分)
②测量编制的标准化,即在测验编制时,要注意搜集材料的丰富性和普遍性。(1分)列如,测试中小学生的恋爱观,却用测验成人婚恋观的题来给中小学生做。(2分)
③施测条件的标准化,即所有的受测者在相同的条件下接受测试。(1分)列如做EPT403亮点闪烁实验,今天天气好,今天的被试就在室外做测试,明天天气一般,被试就在室内做测试。(2分)
④评分的客观性,即两个或两个以上的评分者对同一测验试卷的评定是一致的。(1分)列如,两个评分者的评定结果一个是60分,一个是90分,两者结果不一致。(2分)
⑤对测验结果解释的标准化,即对施测过程的解释时一致的。(1分)列如,两个人有完全相同的病症,可医生却说他们得的病不一样。(2分)
相关描述酌情给分,总分不超过15分。
心理测量与测验期末自测试卷(A)第8页(共7页)