【项目生成技术的研究与发展】项目计划书范文

　　摘要：项目生成技术作为新一代的测验技术，与传统测验技术相比，它在节省大量人力物力的同时，又能充分保证测验的结构效度；它有助于扩充计算机自适应测验的项目数量及提高其安全性；它还可作为认知诊断测验开发的基础。本文总结了国外项目生成方面的理论和技术成果，就项目生成技术的意义、发展、现状和研究方法进行了阐述。
　　关键词:项目生成技术心理测验开发认知心理学心理测量学
　　
　　国外研究者对项目生成技术（Item Generation）的研究始于20世纪60年代，经过几十年的发展和S.Embretson、 I. Bejar等研究者的努力，项目生成技术的优势已经凸显，并将在二十一世纪得到迅速发展。项目生成首先应研究所测任务的认知策略、认知加工过程和该领域的典型项目，归纳出影响此类项目心理计量参数的刺激特征和其他影响因素，及不影响项目参数的其他刺激特征。这样既可以以此为基础，通过已知的刺激特征及其权重来预测其项目参数，又可以以此形成项目设计原则，使得通过计算机程序在测验施测的同时生成结构效度良好、心理计量参数已知且具有最佳认知诊断功能的项目成为可能。
　　有人称项目生成技术的特点是三无，即无题库、无需项目反应理论（IRT）和无需太多投入（S. Irvine， 2002）。的确，项目生成诞生最初目的就是为大规模测验服务，因此决定了它的特点就是：项目实时生成、不需使用IRT的方法去估计项目参数而可以直接通过项目刺激特征的权重直接计算项目参数、与传统测验编制相比较项目生成能够节省大量的人力与物力。
　　
　　1 项目生成技术的意义
　　
　　项目生成技术作为新一代的测量技术，具有重要的理论与实践意义。
　　1.1 项目生成技术归纳出项目认知模型与设计原则，既节省了大量人力物力，又能充分保证测验的结构效度。
　　使用传统方法人工编写测验费时费力，生成的项目又往往难以保证其品质，造成此种局面的部分原因在于，它不管项目间有多相似，都将每个项目视为独立体。而项目生成技术从研究其认知过程与项目结构着手，一旦确定认知模型和项目设计原则，就可编写计算机程序自动化地生成大量已知心理计量属性的项目。
　　在智力测验领域，过去的做法是通过测验总分与外部效标的相关求得效度。这种方法早已显得太粗糙，而从测验所要测量的潜在结构的角度来证明测验的有效性是十分必要的。因此对测量结构和目标的深层次理解，对其认知过程、认知策略、认知成分与刺激属性的研究，关注各认知变量对总分的影响，这将有助于指导测验的编制工作、保证其结构效度。
　　1.2 项目生成有助于扩充计算机自适应测验的项目数量及提高其安全性。
　　计算机自适应测验（简称CAT）未能得到快速发展的原因之一是由于它需要大量心理计量参数已知的项目作基础。人工项目编写者很难满足对项目这样大量与急切的需求，而项目设计规则与程序能帮助项目生成者实时生成大量的项目，有助于改善这种艰难的局面，对于扩充CAT的题量具有极大的帮助。
　　Wainer认为仅靠增加题量来维持题库的安全性，这是不现实的；与扩大题库的投资相比，窃题增加的费用却是微乎其微的；这也意味着，随着时间的推移，要维持测验同等程度的安全性，就必须以指数级数增加题目量，而项目费用也是以指数级数增加的。而使用项目生成技术，项目在测验过程中实时生成，从而减少了曝光机会、增加了安全性。
　　1.3 项目生成可以做为开发认知诊断测验的基础。
　　测量技术发展到21世纪，人们对测验结果的渴望已经不能用只给出一个总分值来满足，人们更期待出现针对不同个体的、能够揭示其内在特质的诊断性测验。项目生成技术基于对所测领域认知加工过程与项目结构的细致分析，确定了影响人们行为的刺激特征与其他因素，它与CAT相结合，就有可能为被试提供更有效且更个性化的基于项目认知过程和刺激特征层面的诊断分析。
　　项目生成技术对于心理测量而言，除了具有现实意义，还具有理论意义。如果我们可以用项目生成技术生成某特质的项目并得到预期的结果，则表示我们已经开始真正了解这种特质了；更进一步说，如果我们能够准确预测该项目的难度的话，则有了更大的突破。
　　
　　2 项目生成方法及应用
　　
　　2.1 Embretson（1999）提出的认知设计系统方法
　　美国测量理论学家Embretson总结了一套生成项目的认知设计系统方法，该方法的核心是建立该类项目的认知加工过程模型；此外，它还需要其他几个支持系统，其中包括建立保证结构效度的项目设计体系、选择合适的心理计量模型和生成项目的计算机程序。认知设计系统方法与其他传统项目开发方法相比具有四大优势：第一、预测项目参数的能力较强。第二、可以在项目水平上评估结构效度。如果认知设计系统方法与合适的心理测量模型结合起来应用，就可以预测具体的认知成分对于项目难度的相应影响。第三、该方法可以生成指定参数的项目。第四、该方法使得自适应项目生成测验成为可能。
　　2.2 Ian Dennis（2002）提出的项目生成方法1
　　Dennis曾对项目生成方法做过大量研究，提出了项目生成的两种方法。在其方法1中项目总体是可以确定的，它由特定的项目刺激特征及其水平相结合所产生的所有项目组成。通过对总体项目结构的分析，首先确定影响难度的控制因素与不影响难度的非控制因素，这样只要项目刺激特征的值确定了，这个项目就确定了。控制因素用于确定难度，而非控制因素用于产生项目参数相近而形式不同的若干实例项目（又称为同构体）。用方法1适用于保密的环境当中，用它生成项目耗费较小，可以生成大量平行测验；但如果过度曝光，可能导致项目设计原则的泄露。
　　2.3 Ian Dennis提出的项目生成方法2
　　方法2中的项目总体是所有存在元素的任何一种可能的排列方式，因此在施以任何规则以前，对含有N个元素的集合，就有N！个可能的项目；方法2通过在题干和问题处施以规则来减少符合的项目个数。方法2中项目生成的程序要具备检验模型是否与给定的规则相容的逻辑分析能力。使用方法2时，只有在项目生成之后，其难度才能确定。方法2虽然可以解决项目泄露问题，但较之方法1，它需要投入更多。
　　
　　3 项目生成能力的三种水平
　　
　　Bejar（1993）认为按照项目生成能力的不同，可以将项目生成分为三个水平。水平最低的是功能水平上的项目生成，它仅仅强调完成项目生成这个功能本身，而忽视测量结构的探究与认知模型的建立。根据Hively（1974）与Bormuth(1990)介绍，教育领域早期的一些工作就属于这一水平。
　　项目生成的第二个水平是以模型为基础的项目生成，它是在对有关项目进行了认真的认知分析后建立的认知模型以指导项目生成；那些根据认知理论所提出的能够影响难度的变量，最终又可以应用于指导项目的生成。他认为生成测验的先决条件是对测验内容做完善的结构分析，多个研究结果证明这种项目生成是较有效的。
　　项目生成的最高水平是语义水平的项目生成，在此水平上，测验开发者必须对认知结构与心理计量模型进行透彻的分析，从而不仅能生成项目，还可以解析项目以刻画其心理计量属性。这种方法虽然很吸引人，但在现实中很难轻易地实现它，它仅比较成功地应用于分析推理等项目类型中。
　　
　　4 项目生成技术在国外的发展
　　
　　4.1 诞生和初步发展阶段（20世纪60年代到90年代）
　　项目生成长久以来一直吸引着测验开发者，从20世纪60年代开始，西方研究者如Hively、Guttman、Carroll、Bejar、Irvine、Dennis等人就对项目生成做了初步的理论探索与实践研究（S. Irvine， 2002）。Hively（1968）、Guttman（1969）提出了一种可以生成大量算术题目的项目形式。这一时期的许多研究者都热衷于实现功能水平上的项目生成，他们看重完成项目生成这种功能，而不重视研究项目所测品质的认知结构，因此有些项目生成的结果并不如人意。
　　4.2 成熟发展阶段（20世纪90年代至今）
　　早期失败的历史证明，想要对理论内容不加分析就成功地生成项目是不可能的。成熟的认知心理学理论是支撑项目生成技术成功的基础之一，如：What One Intelligence Test Measures（P. Carpenter等人，1990）成为抽象推理测验项目生成的重要理论基础，而Using Algebra Word Problems to Assess Quantitative Ability(M. Sebrechts等人)成为数量推理项目项目生成的理论基础。
　　如今国外研究者已经在能力测验、学绩测验与军事选拔测验等多个领域展开了对项目生成的研究与实践。Embretson等人已经对十余种能力测验项目进行了项目生成研究，其中包括言语类比推理、言语分类、几何类比推理、几何分类、系列完成、段落理解、空间折叠、数量文字问题、矩阵完成问题等。奥地利测量学者Martin Arendasy开发出了项目生成器ITEMGEN，它可以生成6种测量非言语智力的项目类型，其中包括两种矩阵完成任务、几何类比推理、几何系列问题和两种空间能力项目。Bejar等人已将项目生成应用于学绩测验领域以生成GRE数学项目。
　　
　　5 项目生成技术在国内的发展展望
　　
　　在国外，项目生成已经在众多项目上取得了成功，在国内相信其前景也会十分乐观；但目前国内仍未有研究者报告在此领域中获得的成果，可见研究具有一定的难度。首先，想要成功地进行项目生成，就必须建立起合适的认知模型，而认知心理学未能提供更多可操作的认知理论，测量开发者想要提出自己的认知模型确实有很大的难度；其次，项目生成技术生成的项目要能不经试测而直接施用，这是建立在所生成的项目能够达到预计的心理计量属性的假设之上的，而这种假设对于心理测量模型的要求很高，期待能有对项目参数的预测能力更佳的模型出现；再次，项目生成技术要求开发者能驾驭认知心理学、心理测量学、计算机编程技术三个领域的知识与技术，但国内这样的人材却少之又少。笔者认为，国内的心理与教育测量人员要改变这种局面，一方面可以引进国外学者一些较为成熟的项目生成方法与技术，而在认知结构或计量模型上尝试突破创新，另一方面可以根据我国测验自身的特点，尝试创造出新的项目生成方法。
　　
　　参考文献：
　　[1] Ian Dennis (2002). Approaches to Modeling Item-Generative Tests. In Sidney H. Irvine & Patrick C.Kyllonen， Item Generation for Test Development. Lawrence Erlbaum Associates， Publisher. Mahwah， NJ. P54-71.
　　[2] Isaac I. Bejar(2002). Genrrative Testing: From Conception to Implementation. In Sidney H. Irvine & Patrick C.Kyllonen， Item Generation for Test Development. Lawrence Erlbaum Associates， Publisher. Mahwah， NJ. P199-217.
　　[3] Sidney H. Irvine (2002). The Foundations of Item Generation For Mass Testing. In Sidney H. Irvine & Patrick C.Kyllonen， Item Generation for Test Development. Lawrence Erlbaum Associates， Publisher. Mahwah， NJ. P3-33.
　　[4] Susan E. Embretson (2002). Generating Abstract Reasoning Items With Cognitive Theory. In Sidney H. Irvine & Patrick C.Kyllonen， Item Generation for Test Development. Lawrence Erlbaum Associates， Publisher. Mahwah， NJ. P219-250.

推荐访问:生成项目研究发展