第二节
汉语成绩测试的主要类型

从不同的角度或目的出发,汉语成绩测试可分为多种不同的类型。我们把汉语教师通常会给学生施行的测试类型归纳如下:

一、按汉语要素分类

语音、词汇、语法、汉字通常被视为汉语的四大要素。但是,在汉语测试的实际操作过程中,还会有基于汉语的语言长度单位来专门测试短语(词组)、句子、语段[1]语篇[2]的情况。为了使汉语测试类型的划分不但具有系统性,而且能跟日常汉语教学的测试操作相衔接,我们按照汉语教材的处理方式,把短语归入词汇测试的范围,把句子、语段、语篇归入语法测试范围,这样我们就有下列几种关于汉语要素测试的再分类:

1.语音测试

汉语语音测试的内容包括汉语普通话的语音和语调两大部分。语音部分包括字母、音节、声母、韵母、声调、轻声、儿化韵等八项内容;语调部分包括词重音、句子重音、音长、节拍、停顿、句调和几种句子(陈述句、疑问句、祈使句、感叹句等)的基本语调。语音测试的范围跟语音教学的内容是一致的。

语音测试主要考查学生能否:正确辨音辨调;读准声、韵、调;正确读、写汉语拼音;认读汉语拼音和汉字;在语流中正确流利地表达等。对不同学习阶段的学生,在测试重点方面有所区别。在初级阶段着重考察辨音辨调、读准声、韵、调,在中、高级阶段着重考察在语流中能否用正确的声、韵、调进行流利的汉语表达。

2.汉字测试

汉字测试的内容包括汉字基本笔画、汉字字形结构;字形与字音、字义之间的联系;独体字的因形见义;合体字的部件分解;合体字中的会意;合体字中的形声;声符或形符的归类排队;字与词的结合(借助字义理解词义、由字→单音词→复音词的组合)等。

汉字测试主要考查学生能否:正确认写(字、词、句等);用拼音方案给汉字注音,进行同音字和多音字辨析,进行形声字辨析;利用象形、会意、形声字的规律认读汉字和辨析汉字字义,达到规定的汉字书写速度和准确率等。

3.词汇测试

汉语词汇测试的内容包括词语的内部和词语的外部两个层次[3]一方面是在词的内部进行突出个性的微观测试;另一方面是在词的外部进行富有网络语义联系的中观测试。

在微观测试层次上,有几项主要内容:(1)根据词义与语素义关系的类型解释词义。包括根据语素义直接解释词义、根据语素义部分地解释词义、根据语素义间接地解释词义、在语素失落原义的情况下解释词义、在语素义完全不表示词义的情况下解释词义[4]等。(2)“挑明”词的暗含因素。(3)义素分析。它包括词语的感情色彩、语体风格等。

在中观测试层次上,有几项主要内容:(1)掌握词义的类聚群。它包括概念义同中略异的同义词、概括义相关相涉的近义词、概念义相反相对的反义词、概念义有类属关系的上下位词。(2)能以同一语素为基础建立同素词群。(3)词语搭配。通过一个词与不同的词语形成不同的搭配关系来显示其词义和组合能力。

汉语词汇测试主要考查学生能否:识别词语搭配;识别同义词、近义词、反义词、上下位词;生成词义类聚、同素词;列举词语搭配;判断词语在句子中的位置、词语的含义;进行词义辨析、词语联想,在特定的语境中使用词语等。

4.语法测试

汉语语法测试的内容包括词法测试、句法测试、语段测试、语篇测试等。词法测试以词语的用法为主,它主要包括:常见量词、方位词、能愿动词、副词、介词、连词、助词等的用法;动词、形容词和名词的重叠。句法测试主要包括:几种主要补语、定语、状语的用法;词语顺序、常用词组和习惯用语等;几种特殊句式(如“把”字句等)的用法;比较的方式、提问的方式、常用复句等。语段测试主要包括:句与句的因果关系、并列关系、承接关系、转折关系等;句与句的连贯和衔接等。语篇测试主要包括:段与段的因果关系、并列关系、承接关系、转折关系等;段与段的连贯和衔接等。

汉语语法测试主要考查学生:掌握汉语语法结构的程度;按照语境的需要前后连贯、恰当地使用词语的能力;对长句、复句、语段的掌握程度及其成段表达的能力。

二、按汉语技能[5]分类

上面所说的汉语成绩测试类型是从语言要素的角度来进行分类,我们常常把语言要素归入语言知识的范畴。这是否就说明语言知识可以脱离言语技能而孤立存在呢?答案是否定的。因为在实际的汉语交际中,汉语的言语技能和汉语要素总是紧密地结合在一起的,或者说汉语要素存在于汉语的言语技能之中。在汉语作为第二语言教学的过程中,汉语要素教学总是与汉语言语技能训练有机结合的。具体地说,我们既通过汉语要素的教学来进行汉语的言语技能训练,又通过汉语的言语技能训练来进行汉语要素教学。因此,汉语成绩测试还常常从言语技能和言语交际技能的角度分为以下四种类型:

1.听力测试

这里的“听力”指汉语学习者听汉语的能力。根据第二语言习得的研究成果,在第二语言学习者言语技能的发展过程中,听的能力总是先于说的能力(RodEllis,1994)。在实际的汉语交际过程中,也需要汉语学习者的输入(听汉语)能力大于输出(说汉语)能力。由此可见,培养和测试汉语学习者的听力都很重要。

汉语听力测试的内容包括语音识别、语义理解、推测和判断。语音识别包括声、韵、调、连读、停顿、重音、语调、语气等。语义理解包括对关键词义、词组、句子的理解等;对成段讲话、对话基本大意的理解等。推理和判断指根据听到的内容进行相关的推测和确定,比如确定说话人的目的和态度,对事态的进一步发展做出推测等。

汉语听力测试主要考查学生能否:抓住主要信息,获悉某些重要细节,进行正确的推测和判断,准确理解说话人的目的和态度等。

2.口语测试

这里的“口语”指汉语学习者用汉语进行口头表达的能力,而不是指语体[6]。狭义的口头表达包括学习、日常生活、社交、会议、会谈等口头交流;广义的口头表达包括讲课、讲演、辩论、解说等(吕必松,1992)。汉语口头表达不但把汉语语音、语法、词汇这些语言要素知识融为了一体,而且还带有浓厚的汉语语用和文化色彩。

汉语口头表达能力的测试内容包括语音能力(声、韵、调、停顿、重音、语调、语气等)、用词造句能力、成段表达能力、语用能力、跨文化的口语交际能力等。

汉语口头表达测试主要考查学生:能否用正确的语音语调得体、流利地交流和表达;在表达过程中,词语的使用是否丰富、恰当,语气是否自然;语法结构、口语句式是否正确;能否根据交际的需要灵活选择和变换不同的说法,表达是否流畅,是否能达到交际目的。

3.阅读测试

这里的“阅读”指汉语学习者的汉语阅读技巧和阅读理解能力。汉语阅读技巧的测试内容包括[7]:(1)认读字、词的技巧。比如,根据汉字的表意形旁来猜测字义、根据汉语构词法猜测词义、从全句或上下文猜测生词的意义等。(2)阅读长句、难句的技巧。比如,用压缩的方法理解长句、根据关联词理解复句、根据修辞特点和上下文理解难句等。(3)快速阅读的技巧[8]。比如,扫读、跳读、抓关键、跳障碍等。阅读理解能力的测试内容包括:(1)理解关键词语和句子。(2)理解段落。比如,找出段落主句,抓住段落主旨、根据提示词语把握段落的内容。(3)理解文章主题等。比如,概括出文章的主题,找出文章的主题句或主题段等。(4)理解作者的目的和态度等。比如,作者赞成还是反对,作者的写作意图等。

汉语阅读技巧和阅读理解测试主要考查学生:快速查找信息的能力,掌握所读文章的大意和作者意图的能力,了解文章主要事实,跳跃障碍、捕捉所需细节的能力,根据所读文章的内容进行引申和推断的能力,领会作者的深层含义及其思想、态度和情绪的能力等。

4.写作测试

这里的“写作”指汉语学习者的书面表达能力,而不是单纯的命题作文。在“听、说、读、写”四种汉语言语技能中,对汉语非母语的外国学生而言,汉语书面表达的难度最高,因为它涉及对学过的汉字、词汇、语法、语段、语篇、语体、语用和表达技巧的全面运用。

汉语书面表达能力的测试内容既包括练习性质的听后写、看图写、看影视后写、扩写、缩写、改写等,又包括应用性质的写便条、启事、书信、日记、公文等;既有写人、写事的,又有写景、写物的;既有记叙文,又有议论文、说明文等。

汉语书面表达能力测试主要考查学生:汉语书面形式的表意是否清楚,中心是否突出。段落和句际间是否衔接和连贯,遣词造句是否准确、恰当,语句表达是否丰富、有变化性。书面表达的病句有多少,写作格式和标点是否正确等。

三、按教学时段分类

以一个学期为单位,汉语教学活动可以按照教学进程的时间长短划分为若干阶段,不同的时段需要不同的成绩测试与之匹配。因此,按照教学时段来分类,我们可以把成绩测试分为以下四种类型:

1.随堂测试

随堂测试又称为随堂小测验。它是在汉语教学过程中,以汉语教材的某一课为单位,在完成该课的汉语教学活动以后,对学生所进行的形成性测试。这种测试出现的频率高,题量小,测时短,施测的方式很灵活,在每课的汉语教学活动结束后都可以进行。这种形成性测试可以检查学生对所学内容的掌握情况,引导汉语学习者注意复习他们学过的汉语知识和技能,同时也有助于发现他们的学习弱点,以便采取补救措施。随堂测试的内容一般限制在该课所学的范围内。

2.单元测试

单元测试是在汉语教学过程中,以汉语教材的一个教学单元为单位,在完成该单元的汉语教学活动以后,对学生所进行的汉语形成性阶段测试。它在实施测试的间隔周期上大于随堂测试,因为一个汉语教学单元通常是由若干节课组成的,只有这若干节课的教学任务都完成以后,才算完成了一个单元的汉语教学活动。单元测试的内容一般限制在某个教学单元的范围之内,对学习者汉语学习成果的概括水平高于随堂测试。

3.周考

周考是在汉语教学过程中,以一周的教学时间为单位,在每周的汉语教学活动完成以后所进行的形成性测试。周考也属于阶段性汉语测试,在每周的汉语教学活动结束时都要进行,所以它也是经常性的。

周考与单元测试既有相同之处,也有不同之处。二者的区别在于,实施测试的计算单位不一样。前者以教学时间“周”为计算单位,后者以教材内容“单元”为计算单位。这种形成性测试的周考可以引导汉语学习者掌握他们必备的汉语知识和汉语技能,发现他们的中介语偏误类型和成因,从而使教、学双方采取适当的补救措施。周考的内容一般限制在一周所学的某个教学单元的范围内,对学习者汉语学习成果的概括水平高于随堂测试。

4.期中考试

期中考试是在汉语教学过程中,以半个学期的教学时间为单位,在每半学期的汉语教学活动完成以后所进行的测试。期中考试也属于阶段性汉语测试,是对汉语学习者在半学期之内取得的汉语学习成果及其达到教学目标的程度所进行的全面测试。期中考试的内容通常要覆盖一门汉语课程的若干个教学单元,对学习者汉语学习成果的概括水平高于周考和单元测试。

期中考试既可以视为形成性评价的组成部分,又可以视为终结性评价的组成部分,这取决于从什么角度来看它。以一学期为界,期中考试可以视为形成性评价的组成部分。以半学期为界,期中考试又可以视为终结性评价的组成部分。

5.期末考试

期末考试是以一个学期为单位,在每一学期的汉语教学活动完成后所进行的测试。期末考试属于终结性测试,它以预先设定的一学期的汉语教学目标为基础,在一门汉语课程的整个教学活动结束后,对这一学期汉语学习者的最终学习成果及其达到教学目标的程度所进行的全面测试。它是为了评定汉语学习者的学业成绩,为其汉语能力或资质作证明。考试内容覆盖一门汉语课程的全部教学单元,对学习者汉语学习成果的概括水平高于期中考试。

四、按测试目的分类

成绩测试是服务于汉语教学目标的,它应该匹配相应的汉语教学法,有助于判断汉语教学的效果,有助于随时调控汉语教学的发展进程。随着汉语教学的不断推进,成绩测试的目的也会不断变化。按照测试目的的不同,成绩测试还可以分为以下四种类型:

1.分班测试

分班性测试(placementtest)又称为分级测试、安置性测试。它一般在新学期开课前施行,主要目的是为把非零起点的汉语学习者合理地安置在适合其汉语能力的班级学习而搜集信息。因此,测试结果往往就成了对汉语学习新生进行分班的依据。

分班性测试属于鉴别性测试,需要注意提高汉语测试的区分性,以便把不同汉语能力层次的学生区分开来。具体地说,汉语试卷难度要适宜,应具有难、中、易的阶梯层次,并按一定的比例来搭配。反之,汉语试卷太容易或太难,大家的汉语测试成绩都差不多,在分班或分级方面就会产生困难。但是,分班测试对学生汉语能力的区分只要求能达到可以辨别学生的上、中、下水平层次的效果。实际上,这样的区分效果十分粗略,因而不要求该测试的记分很精确。另外,在测试内容上要精简,在测试程序上要简化。这是因为分班工作的效率直接影响到能否按时开学上课,如果测试内容繁杂,测试程序繁琐,就不能在短期得到测试结果,从而延误新学期的开课。

2.发展性测试

发展性测试(progressachievementtest)又称为进步性测试、形成性测试。它一般在汉语教学过程中频繁地施行,并以系列测试的形式出现,比如,若干个随堂小测试、若干个单元测试等。目的是测量汉语学习者所取得的进步,检查他们是否掌握了课堂上所学的内容,此外,还为调整教学策略搜集信息。

因为汉语学习者所取得的“进步”是逐渐趋向于最终的汉语课程教学目标的“进步”,所以频繁施行的一系列发展性测试也应该与最终的汉语课程教学目标有关。但是,怎么才能使发展性测试既能与最终的课程教学目标有关,又能与他们现实的汉语进步有关呢?那就需要建立若干个面向终结性测试的发展性测试,逐次、逐层地向同样基于课程教学目标的终结性测试推进。如果把这种推进过程看成是一种有序的、动态的线性运动的话,那么序列中的每一个发展性测试都是推进中的一个点,每一个点都朝着终极目标前进了一小步。因此,很好地定义每一个点的短期目标,才能保证最后实现最终的课程教学目标。

3.诊断性测试

诊断性测试(diagnostictest)是在汉语教学过程中多次施行的,用来确定学生的汉语学习缺陷或障碍的一种测试,以便教师采取有针对性的汉语教学措施,以便学生有针对性地调整汉语学习策略。

诊断性测试的目的决定了它的测试内容具有自身的特点。首先,测试内容要集中在测试者想了解的问题方面。比如,想了解学生对“把”字句的掌握情况,那么测试内容就应该围绕这一主题来进行。其次,针对某一问题的测试内容要细化、深入。比如,想了解学生在“把”字句上存在的问题,可以分别从“把”字句的语义、语法、语用,甚至使用“把”字句的人、使用“把”字句的目的等多方面去探测,才有可能发现问题,找到原因。正因为如此,针对某一问题而进行的诊断性测试,在试题数量(广度)和试题内容(深度)上都倾向于多而细,这使得单纯为了诊断学生的学习问题而一次性地构建测试和施行测试很不经济。为了解决这个矛盾,第二语言教学界开始出现了电脑诊断性测试。

因为诊断性测试是为了发现学生的问题,所以它的题项设计应该有利于诱发学生的有关汉语学习问题,有利于追溯该问题产生的原因。测试的评分反而不重要了,甚至可以不评分。

4.终结性测试

终结性测试(finalachievementtest)又称为总结性测试。它一般在学期末课程结束时施行,目的是总结评定汉语学习者的学习成果。

终结性测试内容显然与课程的教学内容有密切关系。但是,测试内容与教学内容之间究竟是一种什么性质的关系?如何发生联系?这在语言教学测试界还存在着争议。一些人认为,测试内容应该直接基于详细的课程教学大纲或者教材内容。因为这样的测试内容,测的就是所教的,也就是学生实际上学过的东西。上述解释似乎很合理,至少这样的测试可以被看成是一个公平的测试,但是这样做也冒着很大的风险。我们设想一下,如果课程教学大纲设计得不合理,或者教材内容有缺陷,那么以此为基点而编制的试卷也是不可靠的,这样的测试结果就不能准确地反映学生在汉语课程教学目标上成功的程度,甚至还会误导学生,因为测试结果反馈的信息有差错。因此,还有一些人建议[9],终结性测试内容应该直接基于课程教学目标,ArthurHughes就是他们的代表。

五、按测试方式分类

在如何测试第二语言能力的问题上,语言测试界实际上还存在着较大的分歧。一些人认为,语言是由许多成分构成的,掌握一种语言就是要掌握这些构成成分。测试语言能力就是考察人们对其成分的了解和使用(刘润清、韩宝成,2000)。还有一些人不赞成上述看法,认为人们在实际使用语言时,都是把语言作为一个整体来使用的,对单项语言成分的掌握并不一定就等于对语言整体的掌握,所以用单项语言成分测试上的得分来推测某人的语言使用能力是不合理的。这些人更主张全面考察学生的综合运用语言的能力。按照测试方式的不同,汉语成绩测试还可以分为以下两种类型:

1.分离式测试

分离式测试(discretepointtest)又称为离散考点测试。它把汉语知识和技能分解为若干个小成分,每题只测一个成分。如果有若干个成分,那么就由若干个题目来对这些成分逐一进行测量。比如,先把汉语分解为语音、词汇、语法、汉字四大要素。若要测学生的汉语语法能力,则再把汉语语法分解为若干成分,然后编制一系列语法试题,一个语法题每次只测量一个特定的汉语语法点(如“把”字句)。在很多情况下,分离式测试都表现为间接测试(indirecttest)[10],这可能是因为它大量地使用多项选择题的缘故。分离式测试的突出优点是覆盖面大,阅卷方便、经济,信度较高,缺点是效度较低。

2.综合式测试

综合式测试(integrativetest)要求学生综合使用多种汉语知识和技能去完成一个测试任务。它可以在一次测试中,同时考查学生多方面的汉语知识和技能的综合使用情况。比如,写汉语作文、边听汉语讲演边记笔记、边阅读汉语文章边填空等都属于综合式测试。在很多情况下,综合式测试都表现为直接测试(directtest)[11],这导致它大量地使用主观性试题,因而出现信度较低、覆盖面小、阅卷费时费力的缺点,但同时它又具有效度较高的优势。

六、按认知层次分类

在第二语言测试领域,参照Bloom对教育目标的分类,从认知角度来划分,可以把经过学习后所形成的第二语言能力划分为不同的层次[12]这样的划分对设计试卷的难度阶梯尤具意义,因为所考察的语言能力层次的高低跟试题的难度有密切关系。第二语言的能力层次是由低到高逐渐发展形成的,高一级的能力层次是在低一级的能力层次基础上发展而来的。按照由低到高的顺序有如下五种汉语成绩测试类型:

1.识别性测试

识别性测试主要通过唤起学生的回忆、对照、提取等认知心理活动来完成测试任务。测试内容包括识别汉字、语音、语法、词汇、文化等。比如,识别汉字的形音义,识别汉语的声、韵、调,识别同义词、近义词、反义词、上下位词,识别句法的语境等。学习者需要根据已学过的汉语知识和技能,通过一系列较为简单的汉语认知思维活动来完成测试任务。

从测试目的来看,识别性测试主要是考查学习者对学过的较为简单的汉语知识和技能的掌握情况,这是汉语学习者应该具备的最低的能力层次。

2.理解性测试

理解性测试主要通过引起学生的注意、分析表层形式、从形式建构意义、加工成命题[13]认知心理活动来完成测试任务。测试内容包括理解汉字、语音、词汇、语段、语篇、文化等的表面意义和深层含义。比如,理解汉字的形音义,理解汉语声、韵、调的意义,理解词汇的字面义和使用中的引申义,理解不同语境下的不同用法和含义等。学习者需要根据已学过的汉语知识和技能,通过一系列较为复杂的汉语认知思维活动来完成测试任务。

从测试目的来看,理解性测试主要是考查学生对学过的较为复杂的汉语知识和技能的掌握情况,这是汉语学习者应该具备的较高的能力层次。

3.判断性测试

判断性测试主要通过引发学生的分析、归纳、判断等认知心理活动来完成测试任务。测试内容包括判断对汉字、汉语的语音、词汇、语段、语篇、文化等的释义及其不同语境下的使用。比如,判断汉字形音义的匹配,判断汉语声、韵、调的匹配,判断汉语词汇的本义和使用中的引申义,判断它们在不同语境下的恰当用法和含义等。学习者需要根据已学过的汉语知识和技能,通过一系列较为复杂的汉语认知思维活动来完成测试任务。

从测试目的来看,判断性测试主要是考查学生对学过的较为复杂的汉语知识和技能的掌握情况,这是汉语学习者应该具备的较高的能力层次。

4.推断性测试

推断性测试主要通过学生的分析、归纳、判断、推理等认知心理活动来完成测试任务,以此考查学生对学过的汉语知识和技能的掌握情况。测试内容包括推断汉字、语音、词汇、语法结构、语段、语篇等的缺失部分,推断说话人的“言外之意”,推断事件或事物的发展趋势等。学习者需要根据已学过的汉语知识和技能,通过一系列较为复杂的汉语认知思维活动来完成测试任务。

从测试目的来看,推断性测试主要是考查学生对学过的较为复杂的汉语知识和技能的掌握情况,这是汉语学习者应该具备的高级能力层次。

5.运用性测试

运用性测试指测试任务涉及多种汉语知识和技能的综合运用,需要通过学生的多种汉语认知心理活动才能完成。它包括理解、分析、归纳、判断、推理、整合[14]、输出[15]等综合性的认知心理活动。测试内容包括在一定的语境下,选择合适的语体和措辞,对汉语语段或语篇等恰当地、生成性地输出,并能达到预定的交际效果。学习者需要根据已学过的汉语知识和技能,通过一系列复杂的汉语认知思维活动来完成测试任务。

从测试目的来看,运用性测试主要是考查学生对学过的各种汉语知识和技能的综合掌握情况,这是汉语学习者应该具备的最高级的能力层次。

七、按阅卷方式分类

成绩测试的评分一般都由阅卷人来完成。对试题的评分存在着几种不同的情况,有的试题对阅卷人的主观判断依赖很大,有的试题对阅卷人的主观判断依赖较小,还有一些试题不依赖阅卷人的主观判断。按照试题对阅卷人主观判断的依赖程度,汉语成绩测试还可以分为以下三种类型:

1.主观性测试

主观性测试(subjectivetest)指对题目的回答比较灵活,题目可以有多种具体的答案,因此评分时对阅卷人主观判断的依赖性很强。比如,汉语口头或书面回答、作文等。它的优点是效度比较好,靠猜测得分比较难,容易测出学生实际的汉语使用能力。缺点是信度不易把握,评分比较费时费力。

2.客观性测试

客观性测试(objectivetest)指对题目的回答很固定,题目的答案只有一个,并且是命题者预先设定的,因此评分时不依赖阅卷人的主观判断。最典型的客观性测试是多项选择题。它的优点是测试内容的覆盖面大,针对性强。答案确定、唯一,信度较好,评分简单方便,省时省力。它既可以让专业人员阅卷,又可以让非专业者参与阅卷。

3.半客观性测试

半客观性测试(semi-objectivetest)指对题目的回答比较固定,题目的答案可以有几个,并且这几个答案是命题者预先设定的,因此评分时对阅卷人的主观判断性依赖较小。最典型的汉语半客观性测试是排列句序题。半客观性测试的评分信度也比较高。

八、按教学方法分类

语言测试是随着语言教学的发展而发展的,有什么样的教学法,就要求有什么样的测试法与之匹配。由于近年来语言交际教学法的发展,语言任务型教学的出现,又先后出现了交际性测试和任务型测试。因此,从语言教学方法的角度,汉语成绩测试还可以分为以下两种类型:

1.交际性测试

交际性测试(communicativetest)注重在交际过程中测试使用语言,主张语言运用是第二语言学习的最终目标。它认为语言能力有更广泛的内涵,不仅包括语言知识和技能,还包括语言使用的适当性等。交际性测试的标准是看学生能否在目的语语境中有效地进行交际。在它的考题设计中常常出现“信息差”(informationgap),并要求学生能通过已知信息获取未知信息。它还提倡考试材料和题目要贴近现实的语言使用环境,具有真实性等。

交际性测试的主要特征是:(1)注重意义。(2)试题语境化。(3)有带着交际目的的恰当的语言活动。(4)有具备实际使用价值的言语。(5)真实的语言材料。(6)交际结果不可预见。(7)以互动为基础。(8)学生在真实的心理状态下表现语言能力。(9)根据实际交际结果判断成绩。(Weir,1993:167)

汉语交际性测试是对外汉语教学界在努力探索的领域,有关方面的测试活动还不够成熟,研究成果还不多见。

2.任务型测试

任务型测试(task-based language assessment)是以任务为核心的(韩宝成,2003)。它把任务作为测试分析的基本单位,从任务出发去选择测试的项目,以任务为基础来编写试题,根据学生完成任务的表现(taskperformance)来评定成绩。

需要注意的是,语言测试的目标是测量语言能力,所以学生完成测试任务本身并不是测试的目标,真正的测试目标是学生完成任务所具备的语言能力。任务型测试既然是“基于”任务的,那就表明“任务”只是途径和必要条件,我们主要是通过学生完成语言测试任务所表现出来的语言行为来评价他们的语言能力(刘壮等,2008)。

对于设计和实施基于任务的语言测试,Long& Norris(2000:600)提出了六个步骤:(1)确定测试的用途。这包括:谁将使用测试后获得的信息?测试应提供哪些信息?测试的目的是什么?哪些人会因测试受到影响?测试会带来哪些后果?等等。(2)根据需求分析确定目标任务,并按任务特征分类。(3)根据对任务特征进行分析得到的信息,来设计测试及项目规范。(4)确定详细的评分标准,以便对学生完成任务的情况做出评价。(5)从测试的预期用途、效率、合适程度和效果等方面对测试任务、工具、步骤及评分标准进行评估。(6)对测试进行系统的、不间断的效度研究。

实际上,要实施任务型汉语测试必须解决两个问题:(1)如何准确地选择和描述现实中的任务。(2)如何解释测试中的任务与现实中的任务二者之间的关系。因为对这两个问题的回答不仅影响到汉语测试的准确性,而且影响到根据测试结果对汉语学习者所作推论的有效性。

目前对外汉语教学界的任务型汉语测试还处于探索、起步阶段,有关方面的测试活动和研究报告都还很罕见。

[1] 语段指大于单、复句,意思连贯的语言片段。

[2] 在不同的著述中,“语篇”有不同的含义。这里的“语篇”指大于语段,意思连贯的语言片段。

[3] 参见杨翼(2001a)。

[4] 参见符淮青(1985)。

[5] 这里的汉语技能指汉语言语技能和汉语言语交际技能。

[6] 汉语语体可以分为口语和书面语,这种意义上的“口语”跟“口语测试”中的口语含义不同。

[7] 参见陈田顺主编(1999:30)。

[8] 参见吕必松(1996:210)。

[9] 参见Arthur Hughes(1989)。

[10] 间接测试指测试者要求被试所表现的行为不是测试者想测的技能。比如,想测“说”的技能却让被试用纸笔方式进行选择性判断。

[11] 直接测试指测试者要求被试所表现的行为就是测试者想测的技能。比如,想测“写”的技能就让被试写一篇作文。

[12] 参见高兰生、陈辉岳(1996:42)。

[13] 参见鲁忠义、彭聃龄(2003)。

[14] 信息整合。

[15] 汉语语义和形式的输出。