关于可控制产出词汇能力测试研究的读书报告_奇妙能力歌下载

  摘 要: 单词的掌握是多方面、多维度的。不同的测试方法可以诊断出学生哪个方面的词汇知识被忽视。教师可以因此制定有效的方案帮助学生掌握这方面的词汇知识。Batia Laufer和Paul Nation设计了新的可控制产出性词汇能力测试试题,主要测量受试者在五个词频族可控制的产出能力。根据Batia Laufer和Paul Nation的研究,这种测试方法有良好的信度和效度,而且可操作性很强。
  关键词: 词汇测试 可控制产出能力 测试研究
  
  词汇测试得到越来越多的重视和关注,因为通过对学生词汇量的测试,教师可以作出正确的判断并制定比较可行的词汇教学方案。词汇的测量方法也越来越多。不同的测试方法是服务于不同的测试目的的。由于一个单词的掌握是多方面和多维度的,不同的测试方法可以测出不同方面和不同维度的词汇掌握。就是说通过不同的测试方法可以诊断出学生哪方面的词汇知识被忽视了,然后制定出有效的方案帮助学生掌握这方面的知识。目前,测试词汇方法很多,包括接受性词汇测试和产出性词汇测试。接受性词汇指的是当它们在语境中出现时,学习者能够认识、理解,但却不能正确产出和使用它们。产出性词汇指学习者理解并能正确发音,而且能在口头上和书面表达中正确运用的词汇。是非题、搭配题和选择题类型的词汇测试就属于接受性词汇测试。产出性又可分为自由产出性和可控制产出性。翻译及写作就属自由产出性测试。Batia Laufer和Paul Nation编制的一套词汇量测试试题就属于可控制产出性词汇测试。
  Batia Laufer和Paul Nation的这篇学术论文主要是研究测量受试者在五个词频族的可控制的产出性能力。控制产出性指的是学生在教师或者研究者的强迫下使用这个单词。在这个测试卷中,作者提供了一个句子,在这个句子中目标单词只提供了一个或几个字母,让学生根据句子的语境及所知的字母,填写这个单词。比如:The book covers a series of isolated epis-?摇?摇 from history.五个词频族指的是根据词汇出现的频率把英语单词分为五个级别:2000词级、3000词级、大学词汇、5000词级和10000词级。这五个词频族是以Laufer和Nation(1995)提出的“词频图”为依据。所谓“词频图”用来描述外语学习者作文中的词汇使用情况。简单来说,就是首先将学习者的作文输入到电脑中,电脑自动计算词数(屈折变化和派生词不算),将所有单词归为四类:1000词表,2000词表,大学词表及其它(这一类包含前三类不包含的单词)。Laufer和Nation在实验中发现同一作者其“词频图”是一致的,还发现“词频图”可以去区分不同水平的作者,此外,学习者的“词频图”还与其词汇量相关。这证明“词频图”具有相当的信度和效度。在另一项研究中,Laufer(1994,quoted in Schmitt,2000)用这个“词频图”记录一批高级学生在一学年里的词汇发展,她发现学生的词频图有明显的变化,而且将原来的四类词频折算成两类:2000词内和2000词外,效果最为明显。词频图是一种很有潜力的测量二语学习者写作产出性词汇能力的手段。因此,作者就用了这词频图设计了这个词汇量测试试题。作者创立这个词汇量测试的目的,在于帮助教师了解学生的词汇量掌握情况,因为对于高频率单词和低频率单词,在教法和学习的先后上是不同的。教师应该先教授2000词级的词汇,而对于其他低频率词汇,以学生自学为主,教师只提供学习的方法和策略。
  为了测量试题的信度和效度,以及四个平行试题是否等值,作者作了两个研究。第一个研究的问题是:用其中一套试题,测试不同英语水平的学生,在总分及各个词级的分数上是否有明显的不同。一个人掌握词汇的多少和牢固与否,直接影响他们的语言表达能力,影响他们思想表达的丰富与准确程度,从这个意义上讲,词汇量的多少就代表着外语水平的高低。反过来说,不同英语水平学生的测试结果有明显的不同,就证明这套试题有良好的可信度。作者选择了四组不同英语水平的外语学生参加这个测试,分别是高中10年级,11年级,12年级和大学一年级的学生。作者用了Kuder-Richardson公式(KR21)对测试结果进行统计。结果表明,不同英语水平的受试者在总分和各词级分数上有明显的不同,显示出英语水平越高的受试者,掌握低频率词汇越多,证明了这个试题的信度高。第二个研究的问题是:用四套平行试题测量同一受试者,看这四套试题是否都有很高的相关性。参加这个测试的受试者也是来自四个不同英语水平。但不同于第一个实验的是,这次试验中每个受试者必须完成四套平行试题中的某一词级的试题。作者同样用KR21来统计测试结果,显示出这四套平行试题有比较高的相关性。这个测试属于诊断性测试,因此还有另一个方法可以衡量这几套试题是否等值。通过不同试题对同一受试者的诊断结果是否一致,可以看出它们的相关性。这种方法的测试结果也再次表明了这四份试题的高相关。作者最终又根据试题的信度和相关度,把这四套试题重组,选出了两套信度更高的试题。
  Laufer和Nation设计的这套试题是从Paul Nation 1983年设计的Vocabulary Levels Test发展而来的,他们把这个测试称作Vocabulary Levels Test的产出性版本(productive version)。
  Vocabulary Levels Test的格式如下所示:
  The 2000-word level
  1.Apply
  2.hide ?摇?摇 choose by voting
  3.jump ?摇?摇 become like water
  4.manufacture ?摇?摇 make
  5.melt
  6.threaten
  (an example from the Vocabulary Levels Test,taken from Nation,1990)
  这个测试利用 Thorndilke和Lorge在1944年的词频表,依据词频(frequency count)的概念,以及West的GSL(General Service List),将测试所划分的五个级别:2000词水平、3000词水平、5000词水平、大学词表水平和10000词水平。每个水平考18个题(分成六组,每组试题由六个单词和二组单词释义组成,这样每个水平一共考了36个单词),如果被测者能够答对12道题以上就认为具有这个水平的词汇量。这个测试的优点在于制作简便,评分容易,不会给被测试者很多猜词的机会,能在短时间内测试大量单词,并且被测试者能够利用一切可能的手段来答题。Vocabulary Levels Test自面世以来,就受到广泛的关注,许多研究者和机构试用它,检查它的信度和效度。新西兰的惠灵顿维多利亚大学英语学院用它来做分班考试(Belgar & Hunt,1999),发现它的信度指数达到0.93,证明它具有良好的信度。研究者还将学生在Vocabulary Levels Test的成绩与其在TOFEL考试的成绩相比较,这两门成绩显著相关,这从一个方面也可以说明Vocabulary Levels Test有良好的效度。
  Laufer和Nation编制的这套产出性版本的试题,也是每个水平抽取18个单词进行测试,每个级别被测试者如果答对12道题以上,都算掌握该级别的词汇量。不同的是在18个句子中,这些单词都是不完整的,测试者要补全残缺的单词。但就是这点体现了接受性和产出性词汇测试的区别。Vocabulary Levels Test属于接受性词汇测试,是量的测试。而这套可控制产出性词汇测试是属于质的测试,不仅仅是对词汇的辨认或理解,而是在一定语境中去应用这个词汇,这体现了词汇测试从广度到深度的发展。
  这套可控制产出性词汇能力测试试题有个很大的优点,就是可操作性很强。首先,考这套试题所需时间很短,每个词级只有18道题。其次,改卷也很方便,只有正确和错误两种可能。最后,在分析试卷的时候也很容易,每个词级是1000个单词。如果18道题中有9道是正确的,按照比例,就应该是1000词中掌握了500个单词。但如果想让这套试题更为普及,学生也能自行操作的话,应该用计算机来执行这个考试,建立一个词题库,每个词级有1000道试题,学生开始做题时,计算机系统自动随机生成18道题,假设答对12道题为合格,当学生的测试结果≥12道题时,计算机将会自动升级到下一词级的测试。这样的话,测试就更为方便简单,测试结果也更有时效性,学生随时都可以对自己的词汇水平有个大致的了解。这也是词汇测试发展的趋势,目前已出现了很多词汇测试软件。词汇测试方法的多样化及简便化,能更好地实现测试目的,帮助学生了解自己的词汇掌握情况,也便于教师制定有效的词汇教学方案。
  
  参考文献:
  [1]Laufer,B.and Nation,P.A vocabulary-size test of controlled productive ability.Language testing,1999.
  [2]Laufer,B.The development of passive and active vocabulary in a second language:same or different?Oxford university press,1998.
  [3]Bachman,L.and Palmer,A.Language Testing in Practice Oxford university press,1996.

推荐访问:产出 能力测试 词汇 控制