摘 要:
普通话水平测试;
非客观因素;
对策 Abstract:This article focuses on the non-objective factor which affect the quality of processing of PSC and its analysis,and moreever makes some advices to reliability of PSC. Key word:PSC ;
the non-objective factor;
advices 普通话水平考试(简称PSC)是测查应试人的普通话规 范程度、熟练程度,认定其普通话水平等级的全国范围内的 一项标准参照性考试。几年的测试实践证明,普通话水平测 试能够比较科学准确地衡量和评定应试人的普通话水平,具 有可操作性和可信度。国家语委在近两年也在部分省份采取 了人工打分和计算机打分相结合的新的测评方式。PSC作为 标准参照考试,本身也允许误差的存在,但各种非客观因素 造成的误差的累积,就会使得评分结果产生质的变化,从而 影响到测评成绩的公正性,降低考试的信度。鉴于此,有必 要厘清种种非客观因素易出现的环节,最大限度地避免这些 非客观因素的干扰。
一、测试员自身原因对测试结果的影响。1、测试员专业水平的高低不同。原因有二:一方面由 于测试员所学专业知识的限制,对某些语音发音状态的辨别 存在盲区,无法分辨某些语音发音的差别;
另一方面,由于 测试员自身的语音面貌有缺陷,对应试人同类的或相似的语 音问题就会产生认同感,难以作出正误判定。
2、测试员的心理定式也是影响PSC测评信度的一个因素。
不同的评分心态暗含着测试员对不同应试对象所应具备的 普通话水平的心理评价。测试员潜意识里对应试对象的语言 规范有着不同的心理定势和不同的心理期待值,在掌握评分 标准时,往往会有不同的宽严尺度,影响测试的客观公正与 成绩的可比性。
3、测试员测试强度过大也会造成不必要的误差。测试 时,测试员的大脑、眼睛、耳朵和手需要同时进行工作,注 意力要非常集中以保证测试结果的准确性,因此测试员很容 易产生疲劳感。随着听辩灵敏度下降,错判,漏判的比率势 必上升,容易出现打分前紧后松的情况。
4、测试员的自身素质和职业修养。PSC既是一个考试过 程,也是一个言语交际的过程,如果测试员表情严肃,甚至 摇头叹气就会加剧应试者的紧张情绪,影响其正常发挥。机 测状态下,测试员上网、接听手机,乃至喝水都有可能导致 误判。
二、.应试者的临场表现对测评结果的影响。
1、紧张焦虑的情绪。紧张是影响应试成绩的大敌,因为紧张,常用字不认识;
朗读中不能自然地读出轻声和儿化, 不停地回读,甚至错行;
命题说话中语音数量不足等情况比 比皆是。因此消除应试者的紧张心理对于客观地反映应试者 的普通话水平尤为重要。
2、应试者对测试的态度也一定程度上影响测试员的评 判结果。应试者如果抱着无所谓态度的就会在语音面貌上表 现出语速快,相同的语音错误反复出现等特点,这样极易给 测试员负面的心理定位,打分时自然手紧一些。相反,那些 对待测试显得非常认真和重视的应试者,往往能得到好的印 象分,模棱两可时,也会放过一马了。
3、应试者前两项的测试结果也影响测试员打分的客观 性。前两项读单音节字和读多音节词语已经涵盖了普通话全 部的声韵调及声韵组合,因此测试员会在测评完前两项之后 给应试者一个初步的语音印象,这个印象对后面大约70分的 分值也起到很重要的作用。计算机打分则有效的避免了这一 问题。
三、计算机语音识别标准的模糊性造成误差。
量化分析法是普通话水平测试采用的基本方法。它对语 音的正误情况分为正确、错误、缺陷三种。实际上,应试者 发出的音节并非都与这三种类型一一对应;
每个测试员对语 音描述的理解和掌握也不同,对正确音与错误音之间大量存 在的中介音的容忍程度也有不同,这就造成了扣分标准不一 的情况。机测后,这一问题也得到了部分的解决,但语言学本身对发音方法和发音部位的描述就具有模糊性,如n、ng 这两个韵尾。前鼻音n 属于舌尖中音, 作为韵母的韵尾, 只 要在元音后直接添加舌尖抵住上齿背、带鼻音的发音动作即 可, 此时口腔空间狭窄、口形偏闭合状态。而发后鼻音ng 时, 口形略开, 内口腔空间较大, 舌位下沉且后移。然而, 这两 个音在测评时常常表现出接近前鼻音又带有后鼻音的临界 状态:口形半开不开, 舌位居中, 开口度也处于中间状态。
这势必给机测的量化带来难度。再如j、q、x这一组舌面音。
最常见的就是将其发成舌尖音,也就是舌面过于靠前,以舌 尖为积极发音器官主动构成气流通道阻碍而发出的音。虽然 有些将舌面音发成舌尖音的错误很明显, 容易听辨。但是, 把有舌尖参与、舌位靠前特征的"舌面音"是处理成判错还是 缺陷,无论人工还是机测都是很难界定的。
四、测试题型、评分标准中的主观操控空间。
PSC试卷第一项读单音节字和第二项读多音节字,共占 30分,主观操控空间集中在缺陷与错误的误判,由于分值很 小,一般不会有太大的误差。而第三项朗读和第四项命题说 话共70分,占总分值的70%,测试员在这两项上的手紧与手 松就会带来测试结果质的不同,即等级的不同。
第三项朗读的扣分点为:①语音错误;
②声母或韵母的 系统性缺陷;
③语调偏误;
④停连不当;
⑤不流畅;
⑥超时。
这些扣分点里,②至⑤项的中均存在"视程度扣0.5、1、2分 "的标准。这样,在总分30分里,理论上最大的主观操控的空间就占到23%,机测实行后,有效地避免了这种极端状态 的发生,但机测"视程度扣分"的依据和评分细则的量化机理 仍不明确。第四项命题说话是测试员受主观因素影响最大的 项目。在人工测试中,该项目往往成为测试员平衡总分的一 个重要手段。在测算了应试者前三项的结果之后,测试员已 经根据前三项的成绩对该应试者初定了等级,在此环节,就 易产生扣分向既定总分靠拢的倾向。例如:,测试员认为应 试人的前三项和"说话"项表现不够好,只有二级乙等水平, 根据其表现"说话"项应扣6分,假如前四项共失掉7分,五项 共扣去13分,总分为87分。为了将其定为二级乙等,测试员 将他的"说话"项扣去7分,使其总分成为86分。机测实行后, 命题说话作为平衡总分的功能被有效地过滤干净了。但其评 分细则里仍有一些非客观因素的存在。如:语音错误在11- 15次之间,无明显方音,扣5、6分,有明显方音扣7、8分。
测试员对有无"明显方音"的不同理解就是主观操控的范围, 达2分之多。足以使测试成绩跨越不同的等级。再如,从自 然流畅程度的5分分值里,我们也可以看到从最好到最差有3 分的梯度,大纲对这3分的扣分标准也是以定性式的语言描 述的,如"语言基本流畅,口语化较差,类似被稿子,有所 表现扣0.5分,明显,扣1分;
语言不连贯,语调生硬,结结 巴巴,明显背诵,经常离题,程度一般扣2分,严重的,扣3 分。"这些定性式语言弹性极大,必然导致主观随意性。
五、建议。鉴于上文分析的PSC中不利于客观公正评判诸多环节, 笔者提出几点努力方向:1、加强测试员队伍的培训,做到 理论与实践并重,职业道德与专业素养齐修。2、培养应试 者良好的应试心理。3、评分细则亟待出台,进一步加强定 量分析,尽量减少定性式的评分语言。4、进一步提高普通 话测试软件的水平。但是,不论怎样明确和规范PSC的评分 标准,评分质量的高低,最终还是取决于普通话水平测试员 的实际工作。因此,测试员应努力提高自身普通话口语水平, 学习专业理论知识, 加强职业修养,对战胜自身生理和心理 因素的影响,以有效地降低非客观因素造成的测试结果的不 稳定性。
参考文献:
[1]、江苏省语言文字工作委员会办公室.普通话水平测 试指导用书(江苏版)[M].北京:商务印书馆,2004. [2]邢福义.现代汉语[M].北京:高等教育出版社,1991
扩展阅读文章
推荐阅读文章
推荐内容
钻爱网 www.zuanai.cn
Copyright © 2002-2018 . 钻爱网 版权所有 湘ICP备12008529号-1