二语写作测试中的评分量表研究(一)
详细内容
[摘要]目前国内外对二语写作测试中的评分量表研究较多,但结论各异。为了能够客观合理地给学生作文打分,还需要借助计算机和语料库的最新发展成果,在语言层面保证评分的准确性和客观性,同时由多个评阅人对作文的篇章结构和内容综合打分。
[关键词]写作测试 信度 评分量表 计算机 语料库
英语写作评分中的信度及误差控制是研究较多又很棘手的问题。国内外许多研究证明,作文评分中有很大误差,因此控制评分误差以提高信度的研究引起了研究者的注意。
二、研究背景及文献综述
写作测试评分中的中心因素是评分员和评分量表,在评分量表中,整体评分法 (holistic scoring) 与分项评分法 (analytic scoring) 是写作测试中最常用的两种评分法。整体评分法是按考官对考生的写作内容和流利性等方面的整体印象,总体给一个等级或分数,分项评分法则把考生的写作能力的各个构成因素分解开来,从不同的维度分别评分,然后根据每个方面的得分和权重算出写作总分。
这两种评分方法主要应用于口语与写作等主观性测试,国内外对于两种方法的评分信度进行了相关研究,但选用哪种评分法以达更高的评分信度,在语言测试界见解不一。诸多研究者认为分项法评分信度比整体评分法更高 (Hamp-Lyons, 1991; Weigle, 2002; 李筱菊,2001) 。但另一派研究者持相反观点,认为整体评分法的评分信度、评分人间一致性更高,适应在大规模测试的写作评分中采用(Cooper,1977; Huot,1990; McKendy,1992)。对此论断,其他研究者采用不同方法进行了实证性研究,现将某些代表性研究概述如下。
在20世纪后期,限于理论与研究工具的发展,一些研究采用相关分析来计算写作中两种评分方法的评分信度,这样只能检验写作评分中的随机误差,随着教育测量学的发展及新分析技术的应运而生,评分信度的研究更加深入和准确。
Swartz等人(1999)运用概化理论,以美国中学251名学生为受试,用ESL position Profile 量表进行实验,结果发现整体评分结果的概化系数达到 .94, 而分项评分结果中有几项维度的概化系数都较低。Nakamura(2002)以90名日本大学生为受试,采用FACET分析手段,发现使用分项评分法评分人的表现都合格,分项评分结果的信度明显高于整体评分法。Schoonen (2005) 采用结构方程模型,以89名6年级学生为受试,采用整体和分项两种不同量表评分,发现评分方法对写作分数的概化性和评分人效应有影响,整体评分结果的概化性比分项评分结果显著高。