二十一世纪语料库语言学的新发展

摘 要: 本文主要评述了《语料库语言学:方法,理论与实践》一书,首先介绍了语料库的基础知识:定义与分类、语料数据的获取与分析工具、相关法律道德问题,其次详述了语料库语言学的新发展,最后归纳总结了语料库语言学与心理语言学、功能语言学的相互融合趋势。

关键词: 语料库语言学 基础知识 新发展

语料库语言学在二十一世纪进入跨学科的多维发展时期,《语料库语言学:方法、理论与实践》的出版及时地将语料库语言学现今的发展脉络梳理清晰,弥补了语料库研究的不足。《语料库语言学:方法、理论与实践》是Tony McEnery(副主编:Andrew Hardie)在2012年由剑桥出版社发行的一部新著,剑桥大学语言学专业将其列为必读教学书籍。作者在前言中清楚地表明了本书的编撰主旨:“介绍、解释语料库使用的最基本的概念性问题,并澄清其中的一些困惑;系统回顾迄今为止使用语料库进行研究的主要学术流派。”通过阅读本书,读者可以了解语料库语言学的最新理论与研究进展。

1.内容简介

本书共分为九章,现将每章中的主要内容做介绍。

第一章:什么是语料库语言学?作者简要回顾了语料库语言学的一系列定义性特征,探索了语料库构建与使用的种种方法。基于研究工作的类型不同,语料库领域划分为六大类。划分第一类的标准为交际模式。划分第二类的标准为基于语料库还是语料库驱动的语言学。划分第三类的标准是语料收集的方式。划分第四类的标准是语料设计有无标注。划分第五类的标准是语料库的使用要完全依赖语料数据还是有所选择,即“完全可靠性还是数据选择”(total accountability versus data selection)。划分第六类的标准是语言种类,如单语、双语、多语语料库。

第二章:语料库数据的获取与分析。第一,回顾了语料库的历史演变。第二,回答了公众的一个普遍疑问:“语料库能回答语言学中所有的研究问题吗?”作者指出语料的整合、搜索工具与语料标注都使得探索先前无法想象的研究问题成为可能。第三,在语料标注方面,区分了原数据(metadata)、标识(markup)、标注(annotation)在概念上的不同;列举了一系列标注软件;指出标注要注意一致性;简介了索引的应用。第四,对语料库索引工具做出纵向历史回顾。第五,讨论了语料库语言学中的统计学。

第三章:网络、法律与道德。这一章主要涉及与网络语料库构建相关的法律道德问题。版权是语料库构建的最基础性的问题。语料库的道德问题涉及四大主要方面:道德与被试者、语料库构建者、语料贡献者及语料库使用者之间的关系。核心是要注意隐私权问题,避免宗教问题,而且要牢记保持数据安全是语料库构建者永远的责任。

第四章:英语语料库语言学。本章对语料库语言学发展中影响巨大的英语语料库语言学做出了历史性的简要回顾,并列举了从事语料库研究的几个重点大学及知名学者。ECL对语料库语言学重要的系统的贡献是对词汇与语法的改良性描述。另外,ECL学者还提出了如搭配、语料库标注等语料库语言学的核心概念;研发出了各种语料库工具;培养了众多语料库语言学家。ECL研究者通过ICAME(the International Computer Archive of Modern English)组织相互联系,构成学者网络系统,出版名为《语言和计算机》系列丛书,并定期召开年会。

对英语语料库语言学做出重大贡献的几个学术中心主要集中在六所大学:英国伦敦大学学院(UCL);兰开斯特大学;伯明翰大学;比利时Louvain大学;诺丁汉大学;以北亚利桑那大学为代表的美国诸大学。

第五章:基于语料库的共时与历时语言变体研究。本章主要讨论了如何运用语料库进行英语历时与共时的语言变体研究。在历时研究方面,列举几个著名的历史语料库,尤其提及布朗家族语料库,如Brown, Frown, LOB与FLOB。在共时研究方面,Biber的MD多维研究法贡献巨大。作者详细介绍了MD语域分析法,列举了MD的多种应用。作者指出,与Biber的因子分析法相比,词串从计算机技术上与统计手段上更简洁易懂,而且关键词分析法可以减少MD分析的复杂性。共时研究的另一重要方面与社会语言学相关。迄今为止,语料库语言学方法尚未在社会语言学中起到重要的作用。两者存在相当多的共性,越来越多的社会语言学家采取类似于语料库的方式编撰、采集数据。

第六章:新弗斯派语料库语言学。此章节涉及五个主要方面:搭配、话语、词汇与语法、语料库理论与方法之争、语料库语言学和先已存在理论的关系。首先,重新讨论搭配的定义、搭配索引及搭配的地位。搭配被定义为“在语料库数据中观察到的共现模式”(McEnery 2012:123)。其次,作为首要问题的话语。Teubert指出:“意义存在于话语之中……意义不涉及话语之外的世界。话语与真正的世界没有直接联系……这种联系存在于语料库语言学领域之外”(McEnery 2012:135)。此外,作者区分了语义韵与语义偏好的不同之处,并提出“语用韵”代替语义韵更合适。第三,在词汇与语法的关系上,列举了新弗斯派三种理论方法:习语原则、型式语法、词汇触法理论。第四,在语料库的学科地位上,作者建议用基于语料库的方法涵盖Tognini-Bonelli提出的基于语料库和语料库驱动的两分法概念。在文本的收集方面驳斥Sinclair呼吁的“相信文本”的口号,更尖锐地指出新弗斯派反对语料标准的荒谬可笑之处。最后,在语料库语言学与先前已有理论的关系上,再次批评新弗斯派根本主旨:“相信文本,不相信已有理论”的错误之处。

第七章:语料库方法与功能主义语言学。本章简略概述了功能主义理论语言学的来龙去脉及相关的几种理论框架,描述了功能主义和语料库方法的相互关系。首先,广义上的功能主义包括功能语言学、认知语言学和语言类型学,强调使用中的语言使功能主义与语料库语言学在某种程度上相互兼容。第二,讲述了如何从功能角度做基于语料库研究,指出了在这类研究中,语料库语言学的定量—定性分析法与功能主义研究有机结合了。第三,在语料库与类型学在研究方法上的一致之处。第四,在语料库与认知语言学的相互关系方面,重点探讨了在认知语言学框架内使用语料库数据进行句法、语义分析及两者之间的相互作用。重点讨论了Stefan Gries & Anatol Stefanowitsch的“搭配构式”(collostruction)概念。最后,探討了隐喻分析中的语料库使用,着重列举了Deignan的研究,如研究隐喻:“竞选是一场赛马”;观察隐喻与语料库中语法的相互关系;以“price”一词与其他词的搭配为例考察隐喻与搭配的关系。

第八章:語料库语言学、心理语言学和功能语言学的结合。本章主要涉及两大主题:语料库方法与心理语言学的结合及新弗斯派语料库语言学与功能语言学的结合,重点讲述语料库心理语言学四个方面的运用。一是语料库在语言加工实验中的运用,并以自定步调阅读实验和眼球追踪实验为例证明。二是语言习得与儿童语言语料库,指出构式语法导向的语言习得观深受频率的影响并列举儿童语言语料库CHILDES的使用。三是语料库数据与语言习得计算机模型。指出语料库数据可以转换生成计算机模型的语言输入。四是语料库数据有助于公式化语言习得的研究。在新弗斯派语料库语言学与功能语言学的结合方面,最明显的例子是构式语法与范式语法具有很多相同之处;词汇触发理论认为搭配是心理现象,这与心理语言学不谋而合。

第九章:结论。最后这一章回顾了语料库语言学的过去与现状,并对未来做出了展望;归纳出了语料库语言学在语言学内的学科地位;阐述了在方法多元化的框架下语料库分析的未来发展,特别指出语料库方法有潜力将其领域从语言学扩展到其他人文、社科与自然科学领域。作者对未来做出展望,期望建立“统一的实证语言学”(Unified Empirical Linguistics)以揭示语言的本质,并使作为方法论的语料库语言学得以发挥最大的潜力。

2.评述

Tony McEnery的《语料库语言学:方法、理论与实践》对语料库语言学这门学科作了全方位、多角度的立体剖析,是二十一世纪语料库研究中的一部最新力作。作者以深厚的学术修养与深入浅出的语言,对语料库语言学最新的发展进行了简洁而清晰的阐释。综观全书,笔者认为它具有以下较鲜明的特点:

2.1内容新颖

综观全书,作者介绍、阐释并在某些情况下澄清了语料库的一些基本概念性问题,并且评述了现今正在使用语料库从事研究的主要派别。本书前三章为我们介绍了语料库的基础知识:定义与分类、语料标准与工具的发展历史、相关法律道德问题。本书后五章,尤其是第四、六、七、八章,是作者思想的核心。通过阅读这几章,我们可以了解英国语料库语言学对整个语料库学科的重要影响;熟悉世界上著名语料库研究中心及其学术成就;理解语料库语言学对语言的共时历时研究、新弗斯派语言学、功能语言学及心理语言学的深入影响。

在本书中,作者善于利用前人的研究成果,特别注重近十年的相关科研成果,使读者清楚了解语料库语言相关研究的最新进展。更重要的是作者没有停留在对别人观点的简单评价或语料的罗列之上,而是在综合各家的见解后得出自己的观点,如在第六章中提出用“语用韵”代替“语义韵”。此外,作者对语料库语言学纷杂的发展现状做出了清晰的梳理。作者的论证思路不仅科学严谨,而且角度新颖,摆脱语料库研究的传统束缚。

2.2结构严谨

整部著作的各个章节都采用“简介——主要内容——概要总结”的结构方式。从篇目安排上,不仅有宏观的把握,而且有微观的考察,还有系统的归纳。在简介部分,作者对章节涉及的内容给出相关学术背景的宏观概括;在主要内容部分则分详细条目一一探讨相关问题;在概要总结部分作者把一个章节的核心观点做出简洁易懂的归纳综述。

每章之后都有进一步阅读、实践活动和讨论问题三部分。进一步阅读部分可以在读者深入学习相关内容时给予阅读上的指导;实践活动部分可以让读者运用所学知识练习语料库操作的核心步骤;讨论问题部分使读者对相关问题进行更深入的思考,这种谋篇布局的方式使得该书体系严谨。

参考文献:

[1]Hoey,M. Lexical Priming:a New Theory of Words and Language[M]. London & New York: Routledge,2005.

[2]McEnery, T & Hardie, A. Corpus Linguistics: Method, Theory and Practice[M]. Cambridge: Cambridge University Press,2012.

[3]Sinclair, J. Reading Concordances: An Introduction[M]. London: Pearson Education Limited,2003.

[4]Sinclair, J. Trust the Text: Language, Corpus and Discourse[M]. London: Routledge,2004.

推荐访问:语料库 语言学 二十一世纪 新发展