
1.3 研究设计
本书的考察步骤为先通过平行语料库考察翻译文本特征和源语透过性的发展变化;之后通过类比语料库考察翻译文本中的语言特征及其变化是否同样出现在原创文本中及译语透过性的变化。在完成两个阶段(平行语料库和类比语料库)的考察之后,本研究将通过参照库(清末民初语料库和单语作家语料库)的考察进行补正。具体研究和统计方法包括:
(1)基本统计分析和关键性方法:使用Wordsmith 6.0,AntConc和PowerConc对此三个阶段的语体特征进行基本的统计;使用正则表达式对其语言层面进行检索,并提取搭配词类。关键性方法可以通过翻译文本、原创文本及单语作家文本的比较进行翻译语言区别性特征的提取。在翻译语言特征考察的选择上,不再局限于词频的比较。在语言点的选择上着力进行较深层次的考察,如语体、类联接和词汇语义特征的研究,对翻译语言特征进行深度剖析。
(2)历时复合的语料库研究方法:历时语料库研究是为了便于考察语言的发展变化;复合语料库研究是为了单独考察和比较、分析翻译汉语的语言特征以及翻译汉语与原创汉语的关系。其中,两个参照库可以为翻译语言的特征变化及其对于原创汉语言的影响提供多方验证,促进假设的效度检验,对其进行更有力的解释。
(3)共时和历时结合的方法:共时研究阶段主要通过计算相关系数来测度汉语翻译文本和原创文本的相似程度。历时分析主要通过相对频率比值、对应分析、方差分析、回归分析等计算语言项在不同时期的差异来测度其历时语言变化的趋势。不同时期的翻译文本和原创文本之间在语言表征上的差异将通过基于R语言的多维统计方法进行观察和比较。
当前在统计方法上,无论是在英汉语言接触领域,还是翻译研究领域,统计方法的停滞都在一定程度上阻碍了该领域的深入发展。格里斯和希尔珀特(Gries & Hilpert,2010:297)指出了当前历时研究在统计方法上所存在的问题,并且认为语言特征的历时研究亟待更加可靠和强有力的统计方式,才能探究其更加复杂的本质特征。本书将使用多元统计方法,对翻译文本和非翻译文本在语言特征上的异同进行深度解读。