浅析音频文本转录对英语口语能力的影响
来源: | 作者:qujianfeng999 | 发布时间: 2019-05-15 | 0 次浏览 | 分享到:
摘要:本文以克拉申语言输入假说中的监控假说为指导,主要研究英语学习者使用音频文本转录法来转录自身的口语输出为文本资料并纠正问题的过程中口语能力的变化情况,并探究该方法对学习者口语能力的影响。实验通过训练——转录——分析——纠正——训练的模式,针对学习者口语训练中缺乏有效监控与修正的缺点,使学习者充分利用每次的口语练习,提高口语表达能力。研究发现,该方法能够对学习者口语能力产生一定的、相对显著的影响,但对口语水平不同的学习者影响不同。
一、引言 
  大部分英語学习者存在口语练习时间有限、训练中难以纠错、错误点纠正后缺乏巩固、口语能力与实际应用难以匹配等困难。在传统的英语口语课上,多由老师对学习者的口语输出进行整体纠错。但因为学生人数较多、小班教学的机会较少,这类修正对单个的学习者缺乏针对性,导致学习者口语提高较慢,练习效率低。课后的口语练习多由学习者本人自发地进行,大部分学习者在训练中发现错误时仅做出口头修正。这种修正是暂时的、应急的,难以使学习者深度反思、认识自己口语中的问题。且大部分学习者很少有记录口语输出的习惯,缺乏有效的口语监控机制,难以进行有效回顾、纠错和反思。无论是对于口语教学还是课后口语训练,短暂的口头修正远不能达到有效率地提高口语水平的目的。但是,当抽象的口语资料转化为可视的文本时,学习者能够看到自身的口语输出,更清晰、透彻地监测口语问题,为有效率地提高口语能力创造了可能。 
  音频文本转录在国外又称“text transcription”,是一种在语言学习过程中学习者将自身的口语音频资料在通过手写或电脑输入,转录为文字资料,并对其进行纠正、修改的方法,类似于一种口语监控。克拉申在监控假说(The Monitor Hypothesis)中提出,学习者用母语进行表达时能够做到以脱口而出,但在使用第二语言进行表达时,人们经常会不自觉地留意自己的语言是否正确,这种“注意”或“留心”就是监控的过程[1]。对于英语专业的学习者来说,音频文本转录即是一种深化的、刻意的、可视的口语监控。 
  情景对应训练则指的是将学习者的口语练习置于模拟生活实际情况的情景中,要求学习者根据情景进行相应描述或对话。为保证实验中的口语测试能对被试人员的英语口语实际应用产生正面的影响,测试采取情景对应的方式进行训练,确保口语训练的实践意义。 
  音频文本转录的创新之处在于,“转录”这一口语训练方法革新了传统训练。音频文本转录不仅能改善学习者缺乏有效监控与二次输入的问题,而且可以使学习者独立完成口语练习,并有效地自我反思。在修改中,学习者能发现并扫除一些自身的语言错误和口语问题,对该部分进行有针对性的学习,进而锻炼了学习者自我检测、自我提高的主动学习的能力。此外,就音频文本转录法自身而言,转录的时间可以因个人情况随时改变,是一种较为灵活的口语训练方式。 
  二、文献综述 
  1.国内研究 
  针对口语教学与训练中出现的问题,国内已有颇为丰富的研究。但从研究的内容上看,国内学者对口语表达结果、口语教学、口语测试类研究较多,而口语表达过程、语境因素等研究较少[2]。口语研究偏重于口语教学、口语输出结果的分析。在口语教学方法方面,有对任务型教学、纠错教学、情景教学等的研究。与之相比,音频文本转录研究从学习者的角度出发,把口语输出作为监控对象,要求学习者针对口语问题进行自我修改,充分保证了学习者在监控口语时的能动性。 
  但是,目前国内很少有直接研究转录这一口语练习方法的资料。在研究转录的方向上,电子科技大学成都学院曹倩瑜的研究《基于转录语音数据的英语口语错误分析》与本研究存在一定相似。虽然本研究与该研究都是在转录的基础上探究英语口语能力,但是研究手段、研究目都各不相同。曹教授的研究是以转录为研究手段,即“转录过程由示波播放器播放,按国际标准经严密程序转录为文字数据进行研究”[3]。而本研究中,转录直接由学习者完成。另外,曹教授的研究主要通过转录研究口语输出中集中的语音、语法、词汇错误,为改善英语教学提供借鉴。但本研究主要研究转录本身在一定时间内对学习者口语能力的影响,并不过分强调统计口语错误以及对口语错误的分析研究。 
  2.国外研究 
  与国内研究相比,国外对转录的探索开始得更早、研究得更深入,且已经获得一定的理论成果。通过对国外文献资料进行研究与归纳,研究人员发现国外研究具有以下特点: 
  (1)在研究目的上,国外研究主要围绕转录在英语教学领域和英语测试(如国际雅思测试)中的使用效果,期望通过研究音频文本转录,探索英语教学的新模式以及高效提高应试口语能力的新方法。 
  (2)在研究方法上,国外研究也通过实验法进行研究,探析音频文本转录如何让二语学习者注意自身的口语输出。以爱丁堡大学Tony Lynch教授对音频文本转录对英语教学影响的一系列研究中的代表为例:研究人员在课堂上将来自中国、日本、泰国、希腊等国家的8名二语学习者分成四个二人小组,在角色扮演中练习英语口语,在表演完成后带领学习者一同将音频转录为文本,先由学习者相互纠正错误,再由老师纠正错误[4]。研究表明,在口语课堂上,转录的使用能够有效使学习者充分注意到输出中的错误,并在后期的输出中改正其中一部分错误。类似的研究人员还包括英国阿斯顿大学的Thomas P.Stones教授,著述“Transcription and the IELTS Speaking Test: Facilitating Development”、日本青山大学的Paul Mennim教授,著述“Long Effects of Noticing on Oral Output”等。 
  (3)在研究过程上,国外学者引导二语学习者完成口语输出的方式多种多样,转录的内容也各不相同。其中口语实验的模式包括角色扮演、看图说话、雅思口语题目测试等。三、研究方法与实验过程 
  1. 研究方法 
  项目采用实验法进行研究。实验中,采取对比分析法设立实验组和对照组进行研究。 
  由于学习者在学习、生活中有较多渠道接触英语,且不尽相同,因此在实验中可能会出现众多变量,影响实验结果。为确保学习者的口语能力是因使用音频文本转录与否而受到改变,降低其他因素的影响,实验设置了实验组与对照组,每组各11人。所有的被试人员均为北京师范大学2015级英语专业的非师范生,专业课程一致。一定程度上排除了其他变量对被试人员口语能力的影响,尽可能地使音频文本转录成为影响口语能力变化的核心因素。 
  在口语实验中,研究人员在设计测试的项目时借鉴了拉多于1961年提出的分离测试法(discrete-point test)。分离测试法包括测试语言要素和语言技能两方面的内容,考察被试人员的语音、词法、句法、语法规则及听说读写能力[5]。在此基础上,参考同类型二语习得研究,采用Wolfe-Quintero等人提出的测量二语能力发展的三个维度,即流利度、复杂度和准确度。其中,流利度指的是语言输出和母语者说话一样快;复杂度指的是能够运用多种且难度指数高的结构或词汇;准确度指的是语言无错误[6]。对三项的打分准则参考雅思打分标准。由于转录过程的重点在于“转写”与“监控”,且被试人员均为大一新生,大部分对自身语音错误的监控能力较差。因此,语音将不被纳入实验考察范围,只在实验中具体考察三个口语维度,并在基础上综合考察被试人员的总体口语水平。在情景对应训练中,研究人员选择了与现实生活紧密贴合的话题,让每个被试人员对每个话题能产生共鸣,有话可说。 
  2. 实验过程 
  实验中,22名2015级英语专业本科生被试人员被随机分成实验组和对照组,每组各11人。在2015年10月到2016年1月期间,连续十周、每周一次进行训练。 
  对照组的口语训练过程包括:研究人员向被试人员提供口语情景话题,被试人员有一分三十秒的准备时间。然后,被试人员需要针对该情景进行一分钟三十秒以上的口头表达,期间研究人员进行录音并备份。 
  实验组在对照组的基础上使用音频文本转录,即被试人员需要听自己的录音,并把录音转写成文本,完成转录,形成文稿一。在文稿一的基础上,被试人员需要针对自己的错误自主修改文稿,并进行简短的自我反思,形成文稿二。修改阶段也可称为监控阶段,在这一过程中,被试人员被要求独立对自己的言语内容和言语形式进行回顾性监控[7],包括对内容的准确性、组织或顺序、合理性进行监控。鉴于在监控假说中,克拉申指出,监控是否发挥作用取决于三个必要条件:有足够的时间进行有效地选择以及语法规则的应用;能够注意语言形式,即考虑语言的正確性;具备该语言的语法概念以及语法规则知识[8]。实验中为保证监控的可操作性,没有限制修改时间,且在修改过程中提供了电子词典和纸质词典供有需要的被试人员查阅。 
  每周训练完成后,研究人员根据口语能力评价表给每一位被试人员打分。在打分阶段,为保证口语测试的评分信度,研究人员反复参考评分标准,利用评分比对、重评、不定期抽查、复评的方式尽量保证评分信度。在完成所有音频文本转录实验后,分析实验所得数据和结论,并采用访谈的形式采访了实验组的所有被试人员,从被试人员本身直观地了解他们使用音频文本转录的感受、评价与建议。 
  四、实验数据分析 
  1.测评员信度分析 
  从220份录音中任意抽查33份,对每份录音的中的停顿、重复、自我更正、不常见单词和短语、特殊句式、第一层错误、第二层错误、第三层错误 进行计数,并与对应的该项分数进行Pearson 相关性,具体结果如下表: 
  根据SPSS软件数据分析结果,流利度(M=90.0303, SD=5.85494)与流利度分数(M=68.7545, SD=6.63490)存在显著正相关,r=0.622,p<0.001;复杂度(M=4.1515,SD=3.21249)与复杂度分数(M=68.8788,SD=6.94891)存在显著正相关,r=0.452, p<0..05;确度(M=96.5758, SD=2.39831)与准确度分数(M=69.8424, SD=6.84242)存在显著正相关,r=0.576,p<0.05。 
  由于停顿个数、重复个数、自我更正个数等三个口语维度的具体项目与打分呈现显著相关,因此说明实验评分是有效的,测评员打分具有客观性,可以在此基础上进行实验数据的分析与处理。 
  2.实验结果分析 
  (1)对首次总成绩进行独立样本T检验,对照组(M=66.291, SD=4.206)与实验组(M=67.209, SD=7.326)口语得分不存在显著差异,t=0.36, p=0.722,说明被试分组是随机的,并未受到被试口语能力的影响。 
  (2)对最后一次总成绩进行独立样本T检验,对照组(M=66.991, SD=5.5921)与实验组(M=70.855, SD=6.7774)口语得分不存在显著差异,t=-1.458, p=0.160。该结果说明对照组与实验组没有显著差异,表明实验效果不明显。经研究人员分析,具体原因可能在于实验本身的不足。受客观因素影响,实验只招募22名被试人员,且实验时间由原计划的12周减少为10周,导致实验组与对照组相比没有发生显著的变化。 
  (3)根据第一次得分,将被试人员分为口语水平较高(65以上)和口语水平较低(65分以下)两组。然后再次对总成绩增加量D进行简单效应检验。此时,对最后一次成绩进行交互作用的检验,得到如下数据: 
  在本次检验中,研究人员发现自身英语能力确实会影响最后结果(F=8.76,p=0.008),但组别与能力的交互作用不明显(F=0.073,p=0.790)。说明最终口语得分可能不受到组别和能力的交互作用影响。
 (4)除了最终口语得分,研究人员也关注在整个研究中被试口语得分的增长情况,这样也可以排除被试本身英语能力对最终口语得分的影响。研究人员将最后一次总成绩、流利度成绩、复杂度成绩、准确度成绩减去第一次总成绩、流利度成绩、复杂度成绩、准确度成绩,分别得到总成绩增加量D、流利度成绩增加量DF、复杂度成绩增加量DC、准确度成绩增加量DA。对D、DF、DC、DA分别进行独立样本T检验,得到数据如下: 
  总成绩:对照组:M=0.7000,SD=3.83484;实验组:M=3.6455,SD=3.73721; 
  流利度:对照组:M=0.0263,SD=1.78885;实验组:M=4.8333,SD=3.12517; 
  复杂度:对照组:M=1.667,SD=2.63944;实验组:M=5.0000,SD=2.28035; 
  准确度:对照组:M=0.1667,SD=1.72240;实验组:M=5.5000,SD=2.81069。 
  表5实验组与对照组D、DF、DC、DA独立样本T检验 
  如上,实验组与对照组的总成绩增加量表现为边缘显著,可以说实验组较对照组总体有进步。但在流利度、复杂度、准确度这三个口语维度的考察上,研究人员发现实验组与对照组的流利度与复杂度增加量不显著,但准确度成绩增加量表现为边缘显著,可以说实验组较对照组在准确度方面有进步。 
  (5)针对总成绩增加量D,研究人员再次对组别与能力的交互作用进行检验,得到: 
  虽然组别与能力的交互作用(p>0.05)未表现出显著,但根据上图研究人员可以发现有这种趋势,因此研究人员进一步检验在不同能力水平的组内,实验组和控制组的口语得分的提高是否存在不同。 
  (6)研究人员将所得数据根据能力差异进行拆分。发现在口语水平较低组,实验组(M=5.3000,SD=2. 27596)比对照组(M=0.2667,SD=1.59206)进步明显,t=-4.439, p=0.002。在口语水平较高组,实验组(M=1.6600,SD=4.40545)比对照组(M=1.2200,SD=5.74256)进步不明显,t=-4.439, p=0.002。 
  (7)基于以上分析,研究人员进一步检验口语水平较低组在三个维度上的进步: 
  流利度,对照组:M=0.0263,SD=1.78885;实验组:M=4.8333,SD=3.12517; 
  复杂度,对照组:M=1.667,SD=2.63944;实验组:M=5.0000,SD=2.28035; 
  准确度,对照组:M=0.1667,SD=1.72240;实验组:M=5.5000,SD=2.81069; 
  在三个维度的考察上,研究人员发现在口语水平较低组内,实验组与对照組在三个维度上的增加量均表现出明显进步。 
  五、个案研究 
  根据对音频文本转录的研究,本项目在实验初级提出假设“音频文本转录能对英语专业学生的口语能力产生一定积极影响”。但在实验过程中,研究人员发现不同口语水平的测试者在转录过程中有差异较大的表现,导致转录产生的影响发生变化。为了具体考察口语水平较低组和口语水平较高组在使用音频文本转录进行口语训练时产生的差异,研究人员决定在数据之上开展个案研究。 
  研究人员在口语水平较高组和口语水平较低组中分别选取了最具有代表性的A同学和B同学。A同学口语水平高,口语表达较为流利,能够充分表达自己的想法,语言错误较少,会正确运用英语习语。B同学口语能力较低,说英语时经常停顿、重复,不能连贯地表达自己的想法,语言错误较多,措辞简单。 
  首先,两人十次测试中的成绩波动情况不同。具体见下图: 
  如图,A同学总体成绩波动平缓,但曲线略呈下降趋势。前期口语总体水平基本持平,受题目难易程度影响偶尔出现大幅波动。但是,在实验后期,A同学的口语流利度、准确度明显发生下降,其中以流利度下降最为明显。对此,针对流利度下降的问题,从克拉申提出的“监控假说”来看,A同学极可能属于“监控过多者”(monitor over-users),即学习者时刻用学到的知识“监控”自己的语言输出,过于关注口语的正确度而导致实际话语“言不达意”[10],反而更容易导致其原有的口语流利度降低。 
  如图,B同学的总体成绩基本呈现缓慢上升的趋势。尽管题目的难易程度也对B同学产生了一定的影响,但是,总体来看,随着时间的推移,该同学的口语水平在提高。其中,在口语三个维度上,准确度上升趋势最为明显。 
  尽管两人都使用音频文本转录进行口语训练,但口语能力较低者成绩明显提高。为了更具体的考察两位被试人员口语水平的变化,抽取两人三次测试的具体实验数据,得到下表: 
  如上表所示,与各项都没有发生太大变化的A同学相比,B同学的停顿次数明显减少,口语流利度增加;且在口语输出中增加了不常见词或短语、习语以及特殊句式的使用,口语准确度提高;在错误方面,口语水平较低者B改正了最容易犯的第三层错误,即搭配错误、否定词误用和片段句,口语准确度增加。 
  此外,通过研究两位被试人员的观察记录,发现A同学和B同学在转录过程中有着非常明显的差异。 
  在对待转录的态度上,B同学明显有更积极、更主动的态度。两位被试人员在实验之初,都积极参与到转录的过程中,并主动修改文稿一的错误。但随着实验次数的增加,A同学的积极度明显下降。B同学准时参加实验、认真思考、仔细转录,在反思过程中需要花费较长的修改时间。与B同学对比,A同学在实验中期产生懈怠情绪,多次更改实验时间,导致其实验频率与其他被试人员产生差异。该原因有可能造成了A同学的成绩波动。 
  通过对比两位水平不同的被试人员,研究人员了解到,水平、态度的差异会导致转录产生的效果不同,从而影响不同学习者对转录的期望值。口语水平较低的被试人员很有可能更容易从转录中受益,因而会更倾向于使用转录作为口语训练的方法。而对于口语水平较高的被试人员来说,转录对口语产生的积极效果可能并不显著,且实验较花费时间,因此该类学习者很可能倾向于传统练习。 为进一步了解自身口语能力与转录之间的相互作用,研究人员开展访谈。 
  六、访谈 
  实验分数分析从数据层面客观描述了音频文本转录对英语专业学生口语能力的影响情况。为进一步了解使用转录的被测人员的实战经验、对转录的看法、使用转录中具体出现的问题、对转录的期望值等,研究人员设计了一系列问题,并对实验组的11位被试人员开展访谈。 
  首先,在对音频文本转录的实用性和期望值方面,被试人员有以下反馈: 
  总的来看,实验组11位被测人员中有九成以上感觉自身口语能力因使用转录而提高。超过一半的被试人员表示自己在后一次训练中借鉴到了之前监控到的不足。所有口语水平较低的被试人员都表示,在实验结束后仍然愿意继续使用转录作为口语训练的方法;而不愿意继续使用转录训练的两名被试人员为口语水平较高者。 
  据访谈结果分析,对于口语水平较高的被试人员来说,他们自身口语输出较多,导致转录时转录量大、时间较长,但因为口语水平高,出错率低,实际找出的错误很少,因此转录只是单纯增加了口语的文本资料。在此情况下,部分被试人员认为转录不适用于自己,不愿意再使用转录练习口语。而对于口语水平较低的被试人员来说,他们大多是口语能力有限,输出较少,转录花费时间短。但该类被试人员对语法、英语写作等较为敏感,一旦对口语输出进行可视化之后,能够找出错误并修正。尽管二次输入的量可能少于口语水平较高的测试者,但高效的纠错效率使得他们能够从监控中获得更多反馈,有效提升了口语能力。在转录过程中,学习者能够直观看到自己的错误并主动修正,不必担心老师或语伴的可能会批评自己的错误,独立的监控使得学习者更敢于发声练习口语,使学习者对口语训练更有信心。 
  七、结论 
  根据实验、数据分析和访谈所得的结果,研究人员得出以下结论: 
  首先,音频文本转录对口语水平不同的英语学习者的口语能力有不同影响。音频文本转录能够使部分英语学习者口语能力提高,尤其是口语能力位于中低水平的学习者。但對于口语水平本身已经达到一定高度的学习者,使用转录一定程度上不能使口语能力在短时间内得到显著的提高。 
  其次,从三个口语维度来看,使用音频文本转录能够提升学习者的口语准确度。每次口语练习实验者会借鉴上次实验中较好的句型结构,恰当的措辞;规避语法错误,不恰当搭配。因此,口语练习中暴露出的问题越多,实验者在下次口语练习中犯同样错误的几率越小,准确度随之提升。 
  音频文本转录在口语训练中能否发挥实际作用还取决于频率、外界帮助、自身学习能力,完成态度,口语能力等因素。适当的练习频率,有利于实验者记忆上次试验中语法,措辞等方面,便于在下次实验中规避。适当的外界帮助,如结伴训练,相互修改文稿,可以相互监督,相互促进;其次,学生自身的学习态度,学习能力会影响文本转录完成的质量。 
  使用音频文本转录一定程度上能够提高英语学习者口语自信心。英语学习者常常是不敢张嘴说英语,怕说错,久而久之,丧失说英语的自信心。但在音频文本转录实验中,实验者定期练习,有机会在文本修正自己口语中的问题,解除实验者在口语练习中担心自己语法出错,表达不完美等疑虑。随着练习的推进,实验者敢于表达,口语更加流利,自然也就更自信。 
  鉴于以上结论,结合与被试人员的访谈结果,研究人员认为要使用音频文本转录以提高英语口语能力必须做好以下三点: 
  第一,定位口语水平,因材训练。由于实验数据可以看出,学生自身口语能力对实验影响较大。所以不同水平的英语学习者应充分考虑自身英语能力,选取不同难度的训练材料。对于实验者自身而言,训练材料过难,会导致实验者无话可说,致使文本碎片化,无法自我修改;训练材料过易,实验者表达充分,文本修改提升的空间较小。 
  第二,增加训练频率,缩小单次试验间隔,试验者能够清晰记忆上一次实验中语法,措辞等问题,并在下一次的实验训练中有效的规避,若间隔过长,记忆效果欠佳。且英语口语练习频率的增加有利于学生克服张口说英语的紧张感,表达更加流利,排除由于心理因素而导致的重复,停顿等现象,实验结果更接近学生的真实水平。其次,实验者增加训练次数,有利于实验者养成文本转录的习惯,练习更自然。 
  第三,可尝试结伴训练、互相修改文稿。实验者在阅读自己的文稿时,可能自身语言习惯和英语能力水平限制,常常忽略或难以修改个别语法,措辞等问题,这种情况下,结伴训练修改,更有利于提升文本的修改程度,为下次实验提供更多的借鉴之处。此外,修改阅读同伴文稿的过程也是学习的过程,可以汲取同伴文稿中较好的词汇,句型等。结伴训练,同伴可以更加客观地评价并给予建议,提高转录文本的利用率,达到事半功倍的效果。 
  参考文献: 
  [1]KRASHEN,S.D. Principles and Practice in Second Language Acquisition[M].London:Pergamon Press,1981, 15. 
  [2]李英,闵尚超.国内英语口语研究现状及发展趋势[J].中国外语,2010,7(6):85-91. 
  [3]曹倩瑜.基于转录语音数据的英语口语错误分析[J].四川教育学院学报,2009,25(3):95-97. 
  [4]LYNCH,T. Seeing What They Meant: Transcribing as a Route to Noticing[J]. ELT Journal Volumes, 2001,55,2: 124-132. 
  [5]毛忠明,黄自然等.口语测试理论与实践——口语测试理论及国内外主要口语测试种类简介[M].北京:中国书籍出版社,2012,67-68. 
  [6]文秋芳,胡健.中国大学生英语口语能力发展的规律与特点[M].北京:外语教学与研究出版社,2010,3. 
  [7]马冬梅.中国英语学习者口语产出语言及心理过程特征[M].苏州:苏州大学出版社,2013,81-84. 
  [8]王建勤.第二语言习得研究[M].北京:商务印书馆,2009,113-114. 
  注释: 
  ① 研究人员在查阅《基于转录语音数据的英语口语错误分析》一文后,模仿曹倩瑜教授的转录语音数据研究——根据错误频率,将外语学习者所犯的口语语法分为三个层次:第一层错误包括基于综合原因的替代词误用,主要动词词形错误,冠词的冗余或缺省,包括主谓搭配在内的数词词形错误;第二层错误为词性模糊使用,介词to误用,代词、连词、助词和情态词误用,语序错误和及物性误用;第三层错误为搭配错误、否定词误用和片段句。[9]