[谈谈语言测试中的信度与效度] 信度和效度

  摘 要: 本文简单地介绍了评估语言测试最为关键的两个质量指标:信度和效度,在论证了信度与效度的关系后,探索了如何达到信度和效度之间的平衡以获得测试最大的总效用,并对语言测试的改革实践提出了一些参考性建议。
  关键词: 语言测试 信度 效度
  
  随着语言学、语言心理学、社会语言学和教学测量学的发展,语言测试已成为一门科学性和实践性都很强的新兴学科。语言测试是对语言教学进行测量和评估的一个重要手段,越来越受到广大外语教学工作者的重视。众所周知,测试是教与学的向导,为了让测试发挥出其向导的作用,并从测试中准确而客观地评估教与学的效果,一份好的试卷是必不可少的。一般来说,评判一份试卷科学与否的标准是看这份试卷是否有信度、效度、区分度、实用性、全面性、公正性和后期效应。而信度与效度则是这些标准中最重要的两个因素。
  
  一、语言测试中的信度与效度
  
  1.语言测试的信度
  语言测试的信度,又叫可靠性,是指考试结果的可靠性和稳定性。也就是说一份试卷的测试结果在多大程度上具有一致性,即考试结果不受考试时间、监考人员和考场等外在因素的影响。邹申认为,考试信度简单地说就是考分的一致性。从理论上讲,如果一个考试要具有高信度的话,无论在什么情况下对同一学生测试多少次,该学生每次的考试成绩都应该是一致的;反之,如果该学生每次的成绩忽上忽下很不稳定,那么这次考试的信度就不是很高。
  与考生能力无关却又会影响测试信度的因素有很多,例如:自然条件差,天气过热或过冷,考场周围嘈杂等;试题的量是否足够大;题目是否属于同一性质或范畴;题目的区分度是否高;题目难易度是否适中;评分是否客观;考生本人身体及心理状态不好等因素都会影响测试的信度。所以,为了提高信度,我们必须对症下药,采取各种相应的措施,其中统一规范的考试环境、规范的监考和规范的试题要求都是必不可少的。
  用来检验信度最常用的有三种方法:考后复测法、平行测试法和分半法。考后复测法是指在考试后让学生做同一份试卷,如果几次试验的结果都是一致的,那么这份试卷就是有信度的。但是在实际操作过程中,考后复测法还是有一定的不足,因为学生在不断地学习并提高,而且记忆的因素也会影响到复测的结果。平行测试法是指在设计试卷时,先设计两份难度一样的试卷,并在不同的时间给学生做,如果分数相当,则说明有信度。这种方法的弊端在于无法确定两套试卷在难易程度和内容范围上是否完全相同。分半法是指只进行一次测试,然后将试题的题号按奇偶数分为两半,计算两半所得分数的高低排列的相关性。由于前两种方法存在不足,在实际工作中人们往往采用试题分半法求得测试的信度。
  2.语言测试的效度
  效度,又称有效性,是指一套测试所考的是否就是设计人想要考的内容,或者说,在多大程度上考了想要考的。具体说来,效度就是指一份试卷能在多大程度上满足考查的目的,它是针对某一目的正确解释和使用分数的问题。假如一份试卷具体考查数种语言技能或考查内容超出了考查目的,那么其效度就大大降低。效度是衡量语言测试最重要的指标,或者说是语言测试的基本出发点,一项效度很低的语言测试是没有意义的。
  提高效度常用的方法有:明确考试的目的、决定与考试目的相同的内容、决定考试的方法和增加考试的信度。在设计一套试卷时,设计者首先要明白此次测试的目的,然后严格按照这个目的展开设计工作。考试的目的是什么,就要设计与目的想适应的内容,如果测试的内容完全不符合测试目的,那么这个测试就称不上有效度。考试的方法也是提高效度的一个重要方面,有什么样的考试方法就要设计什么样的试卷。如果是闭卷考试,就应该兼顾到所学的考试内容,难易程度要适中;如果是开卷考试,试卷的设计就应当突出重点和难点,要给学生思考和自由发挥的余地,而不是直接在书上可以找到答案。口试应侧重什么而笔试又应侧重什么等一些问题都是在设计试卷过程中应该考虑的。考试的信度提高了,测试的效度就会相应提高,两者是相辅相成的。
  3.信度与效度的关系
  信度和效度是衡量语言测试质量的最重要的两项指标,它们之间是既相互依存又相互排斥,既各有侧重又相辅相成、密切联系的关系。考试信度侧重与考分的一致性,考试效度则强调考试达到其预期测试目的的程度。考试的高效度只能以考试的高信度为基础,离开信度,效度就无法实现。在Bachman看来,信度和效度是紧密相连而且不可分割的。语言测试的目的是测量考生的语言能力,所以在设计试卷时,不能为了追求信度或效度而忽视另一方面,而应采取一种积极平衡的态度,即研究并发现影响考生语言能力的因素,消除不利因素的影响,扩大有利因素的影响,这样才能既保证效度又有信度。
  
  二、在语言测试实践中把握好信度和效度的平衡关系
  
  作为评估测试质量的两个基本特性,信度和效度虽然在一定程度上是相互矛盾的,但完全可以通过相互协调达到适切的平衡,从而保证测试的总效用性最大化。因此,在语言测试的设计和命题中,不能绝对、片面、盲目地追求或强调某一方面而以失去另一方面为代价,只有综合平衡二者的关系才能获得最大的总效用。
  1.考试内容是否体现新的语言教学观
  语言测试随着语言观的发展而发展,也随着教学理念和教学模式的更新而更新。二十世纪八十年代中期开始流行的交际功能观和九十年代以后兴起的任务教学法都对语言测试的改革提出了新的要求。现行的多种类型的考试题型还是以结构主义语言测试理论为基础的多选题为主,某些语言项目的测试与实际语言能力的相关性不高,很难体现当代语言教学观提倡的英语交际运用能力方面的考查。因此,可以通过调整主观题和客观题的比例,多采用直接测试法,增加听力和写作测试的权重,加大口试考核力度,变化题型等手段提高考试的效度。也可以通过采取大题量小分值,细化评分标准,综合使用整体评分法和分析评分法等措施提高考试信度。
  2.语言测试能否产生正面反拨效应
  测试是教和学的导向,而在实际操作过程中,很多类型的考试长期以来采用固定不变的模式,客观上造成了学生甚至是老师猜题和押题的现象,广大教师更是偏向于应试教学,由此产生了不良的教学效果。Hughes提出了若干提高正面反拨效应的建议:测试要培养能力;测试内容要覆盖面广并具有一定的不可预测性;尽量使用直接测试法;成绩测试要与教学目标相结合,使用尺度参照等。这些建议多数涉及效度,也与信度相关。信度和效度是影响反拨效应的重要因素,正确处理好两者的关系能使测试产生积极有利的反拨效应。
  
  三、结语
  
  语言测试的信度和效度问题一直是语言专家关注的问题,也是广大语言教师所关心的问题。了解语言测试中信度和效度这两个重要的标准及其关系后,教师和试卷设计者应重视语言测试理论的研究,掌握命题的原则,在试卷设计过程中把握好信度、效度及其它评价指标之间最佳的平衡关系,提高各类测试的质量,从而真正达到测试的最终目的,这是服务于教学的这一宗旨。
  
  参考文献:
  [1]邹申.语言测试.上海外语教育出版社,2005.
  [2]刘润清,韩宝成.语言测试和它的方法.外语教学与研究出版社,1991.
  [3]李筱菊.语言测试科学与艺术.湖南教育出版社,1997.
  [4]舒运祥.外语测试的理论与方法.世界图书出版公司,1998.

推荐访问:谈谈 语言 测试中