基于语料库的中国文化负载词汇英译研究

时间:2019-05-14 02:08:28下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《基于语料库的中国文化负载词汇英译研究》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《基于语料库的中国文化负载词汇英译研究》。

第一篇:基于语料库的中国文化负载词汇英译研究

基于语料库的中国文化负载词汇英译研究

[本文为2015年江苏省大学生创新创业训练计划省级项目“基于语料库的中国文化负载词汇研究---以2015年政府工作报告为例”(项目编号:201510332069X)部分研究成果。

江苏省高校哲学社会科学项目“基于语料库的中国英语文化负载词汇研究”(2014SJB554)。]

摘要:本研究以德国功能目的论为依据,探讨2015年《政府工作报告》(以下简称《报告》)中国文化负载词的英译方法。研究采用语料库检索工具Antconc3.2,通过国务院官网2015年《报告》(英文版)报道和中央编译局2015年《报告》重要术语发布建立两个小型语料库。结果发现,2015年政府工作报告英译本词汇具有:实词使用量大、动词名词化显著和解释性名词具有中国特色的特征。通过对政府工作报告的英译文本分析,得出以下结论:《报告》英译是有明确目的的跨文化交际活动,中国文化负载词的英译应遵循“目的法则”,灵活多样地采取直译、直译+增译、意译相结合的翻译方法,以提升中国文化软实力。

关键词:语料库;文化负载词;2015年《政府工作报告》;功能目的论;英译

一、引言

随着自身的全球化和本土化,英语作为世界通用语,日渐与源文化分离,不断产生区域变体,中国英语就是英语在中国本土化之后的使用变体。葛传?耍?1980:91-93)提出,中国英语是以规范英语为核心,表达中国社会文化诸领域特有事物,不受母语干扰,通过英译、借译及语义再生诸多手段进入英语交际,具有中国特点的词汇、句式或语篇。汪榕培(1991:1-8)肯定中国英语是客观存在的,国际著名语言类期刊“World Englishes ”2002年第2期也曾集中刊发了15篇中国英语研究方面的论文,可见,中国英语研究也成为世界英语变体研究的热点之一。金惠康(2003:72-79)认为,中国英语是介绍华夏文明的桥梁,能填补词汇空白、文化空白和中国意念的空白。这些空白标志着中国文化中特有事物的词组和短语,即中国文化负载词,从中可以了解中华民族的价值观、思维方式和风土人情。

中国英语文化负载词汇是中国英语的重要组成部分,其承载的信息量绝不亚于句法和语篇。虽然国内有学者也注意到了中国英语文化负载词汇所折射出的文化身份和意识形态,但这方面鲜有系统性的实证研究,故本文将对2015《政府工作报告》的中国文化负载词汇英译策略和英译方法展开较为系统的研究。

二、研究意义和视角

《政府工作报告》(以下简称《报告》)属政论文体,用词严谨,书面语特征明显,是对上一年工作的总结和新一年工作的部署。《报告》的英译不仅具有传达贯彻党和国家大政方针的重要职能,也是他国了解我国国情、方针政策、政治制度、政治立场等最权威的来源(王小萍,2006:109)。《报告》作为典型的外宣文件,每个词的英译都要仔细斟酌其政治影响。中国外交部官员王弄笙(2004:56-59)曾指出,译文必须准确无误地反映原文,不能偏离原意,更不能曲解原意。

随着中国社会的不断发展,大量反映时代思想和风貌的新词不断涌现。词汇作为语言中最活跃的因素不断更新变化,日益频繁的国际交往也使得词汇的翻译成为了语言中变化最快的部分。(杨原,2006:103-105)早在1991年,Newmark就在其专著《关于翻译》(About Translation)中独辟一章讨论了政治文化负载词汇的特点和英译策略,可见外宣文化交际中词汇翻译的重要性。

德国功能派翻译理论始于1971年,“目的论”是其核心理论。功能目的论的理论基础是行为主义,认为人的行为是在特定的情况下发生的有目的的行为,翻译是在目的语情景中为某种目的及目的的受众而生产的语篇(Nord,1997)。

功能目的论有三大法则:目的法则、连贯法则和忠实法则,后两者必须服从于目的法则。作为一种有目的的跨文化交际活动,翻译的目的决定了翻译的策略。《报告》英译的目的是沟通(王惠,2011),即与世界各国进行平等的文化交流,过度使用异化或归化的翻译策略都是不得体的。

三、语料统计

本文将以Antconc3.2作为语料库检索工具,通过国务院英文官网对2015年《报告》的报道及中共中央编译局对2015年《报告》重要术语的译文发布建立两个小型的语料库。

《报告》英译本的词汇主要有以下三个特征:

一、大量实词的使用;

二、文体正式,动词名词化现象显著;

三、解释性名词颇具中国特色(李楠芳,2012:110)。本文通过统计2015年《报告》英译本前100个高频词,以揭示2015年中国社会发展变化的轨迹和本届中国政府的工作重心,语料数据及分析如下。

1.“We”“we”词频排名第5、第19,总计出现419次;“China”“Chinese”词频排名第16、第19,总计出现101次;“government”“governments”词频排名第20、第92,总计出现91次,表明2015《报告》中“我们(的)”、“中国(的)”、“政府”是主体。“development”“develop”词频排名第10、第15,总计出现169次,表明“发展”是《报告》主旋律。

2.“reform”词频排名第5、第19,总计出现419次,表明2015《报告》“改革”是主基调。“more”“improve”“increase”“promote”“growth”等表示增长含义的词语在《报告》前100高频词中占11个,总计出现445次,表明“改革”的目的是为了促进国家各方面的提升发展。

3.“policies”“policy”词频排名第82、第88,总计出现44次;“economic”“economy”词频排名第36、第68,总计出现76次;“market”“investment”词频排名第58、第62,总计出现52次;“education”“innovation”词频排名第77、第79,总计出现48次,表明2015《报告》对政治、经济、教育、创新等各方面提出了“改革”。

4.网络领域

直译

原文:制定“互联网+”行动计划,推动移动互联网、云计算、大数据、物联网等与现代制造业结合。

译文:We will develop the “Internet Plus” action plan to integrate the mobile Internet,cloud computing,big data,and the Internet of Things with modern manufacturing,“互联网+”是指创新互联网发展的新形态和新业态,促进者经济形态的转变,为中国经济的发展提供了广阔的网络平台。The “Internet Plus” action plan 采用直译的翻译方法准确忠实地表达了“互联网+”这一新词的内在涵义。

5.教育领域

意译

原文:提供跟多优秀文艺作品,倡导全民阅读,建设书香社会。

译文:We will ensure that more outstanding works of literature and art are created for the people to enjoy,and encourage a love of reading in all our people to build a nation of avid readers.“书香社会”的文化内涵在于倡导“全民阅读”,建设学习型社会。“avid”意为“热衷的,热切的”,用“avid readers” 体现全民阅读的氛围,以名词化结构“a nation of avid readers”对“书香社会”进行意译,传达了丰富的内在含义,简洁明了的表述也有助于语篇得到的衔接,体现了功能目的论的连贯法则。

五、结语

本文运用语料库的研究方法,在德国功能目的论的研究视角下,对2015《报告》的中国文化负载词进行了较为全面的英译方法分析。中国文化的输出,在很大程度上取决于翻译工作的力量。(黄友义,2008:6-9)报告》的中国文化负载词汇英译需在“目的法则”的指导下,贴近中国发展的实际、贴近国外受众对中国信息的需求、贴近国外受众的思维习惯,(黄友义,2004:27-28)采用灵活多变的翻译策略和翻译方法,才能实现《报告》外宣目的,让世界了解中国,向世界传播中国的声音。在当今的全球化语境下,本研究对提高中华文化软实力和国际影响力、推动中华文化走向世界、增强中华文化在世界文化交流中的话语权、切实维护国家文化安全方面具有重要的现实意义。

【参考文献】

[1] Nord,C.Translating as a Purposeful Activity Functionalist Approaches Explained[M].Manchester:St.Jerome Publishing,1997,7

[2]黄友义.坚持“外宣三贴近原则”处理好外宣翻译中的难点问题[J].中国翻译,2004(6):27-28

[3]黄友义.发展翻译事业,促进世界多元化文化的交流与繁荣[J].中国翻译,2008(4):6-9

[4]金惠康.汉英跨文化交际中的CHINA ENGLISH[J].广东职业技术师范学院学报,2002(2):72-79

[5]李楠芳.《政府工作报告》英译本的词汇特征[J].湖北经济学院学报,2012(11):110-112

[6]王惠.从目的论角度看《政府工作报告》的中译英[D].北京:外交学院,2011.[7]王弄笙.十六大报告汉英翻译的几点思考[J].中国翻译,2004(1):56-59

[8]汪榕培.中国英语是客观存在[J].解放军外语学院学报,1991(1):1-8

[9]王小萍.中国党政热点词语英译[M].广州:广东人民出版社,2006:109

[10]王银泉.“福娃”的英译之争与文化负载词的汉英翻译策略[J].中国翻译,2006(3):74-76

[11]杨原.有关中国特色的政治经济词汇的英译[J].邵阳学院学报,2006,5(2):103-105

[12]张顺生.谈俗语“打铁还须自身硬”的英译[J].上海翻译,2013(2):54-56.

第二篇:中国文化典籍英译

学号:42120446

哈尔滨师范大学 读书汇报论文

题 目 《中国文化典籍英译》读书报告 学 生 万晓安 指导教师 毛海燕 年 级 2012级 专 业 英语笔译 系 别 翻译硕士 学 院 西语学院

中国文化典籍英译

中国文化典籍英译这本书主要包括绪论,正文和附录。绪论包括两个部分:第一部分题为中国文化典籍和概论概括了典籍英译的理论定界和教学与研究的涉及范围;第二部分题为中国文化典籍英译的理论与技巧,讨论了文化典籍的文献分类,注释体例与翻译技巧。

中国文化典籍的定界,第一 覆盖文史哲三科,兼顾儒释道三教,坚持开放与全球视野尝试打通与贯穿思路 第二 尝试以汉族文献为主,兼顾其他民族的文献的多元化格局,第三以统一的文明史理念,确定典籍选材的上下限,重点以及思路贯穿的途径。中国文学文焕典籍的外译和英译状况,如何在认真而科学的评论中摆脱中国文化的本位论,破除民族的,语言的,文学的偏见仍然是个没有解决的问题,其次是价值合作方式问题。

绪论的第二部分中国文化典籍翻译的理论与技巧,首先讨论何为国学与国学之要点,中国文化典籍的整理与注释,如今分为经部史部子部和集部.关键术语的综合性注释作为译文的正文的必要补充,所谓的综合性注释,就是根据一个词在中国文化典籍中的基本含义和所指的意义,编写一个综合性的知识条目,说明他的来源,所指和扩充的含义,以及可能的引申义,以便定下一个基本的调子,提供一个基本的语义场作为在整个文本和其他地方这一词汇的基础..英文基本术语的对应于阐释明确有序,应考虑到语源知识尽量求的对应,基本定义,搭配关系,语境变异和系统的构建,句子需要明晰而行文晓畅,篇章层次可做必要的调整以求适合性,译文应关注不同文体和表达功能的体现,在知识可靠的基础上讲究艺术性和诗学功能。

本书的正文部分有二十四讲,基本囊括所有的中国文化典籍,第一讲上古神话,首先对神话进行概说,中国神话记载最早且最早见于战国至出汉,著名的《盘古开天辟地》《盘古化生万物》《夸父追日》等,选《女娲补天》作为例文翻译,其中很多中国元素,翻译的生动,女娲直译为Nuwa,九州和四极须加以解释,英文用the four corners of the sky and the world with its nine regions.第二讲为先秦寓言,中国的寓言开始于先秦,但是社会动荡,列国争雄,诸子百家,各抒己见,或借传说故事讥他人之迂腐,寓言大兴。寓言的翻译要点,不外乎以生动流畅的英文来表达其深刻的寓意(moral),然而有些寓言其意明了,或以片言明示之,有的则隐含较深,本例《画蛇添足》,本文涉及朝代的翻译,楚有祀者译为 a native of chu ,after worshiping his ancestors.第三讲诗经风雅,中国的第一部诗歌总集《诗经》(Books of Songs)记录了周代到春秋中叶历时五百多年流传于中原等地的诗歌305首,这里选录的为关雎和君子于役分别属于周南和王风。前者通过自然界鸟类的求偶来表达人类对美好爱情和幸福婚姻的向往与赞美,后来演绎为对于后姬之德的歌颂;后者则写农夫之妻在丈夫被迫久久不归,时时借助家禽的归来表达盼郎归的情感,关雎译成ospreys.第四讲楚辞悲歌,楚辞的主要作者是战国时代楚国没落贵族出身的大诗人屈原。楚辞作为一种新的诗体,屈原并不是唯一的作者,这里选录了楚辞离骚,并直译LiSao何方圆之能周兮的疑问句改为直陈语气,方圆暗示君子小人不能显示,只取其意,A circle fits not with a square design.屈心译为I check my heart.第五讲 道德之宗,中国文化之大宗,由先秦诸子所创立儒 墨 道 法 名 农 杂 阴阳 纵横九大流派,经长期的外界内和而归之于儒释道三家,而道家在其中起到了哲学奠基和一以贯之的作用,老子《道德经》(the way and its power)把其道字译成 tao。寂兮缪兮译 为without sound ,without substance.可以为天下母One may think of it as the mother of all beneath Heaven.第六讲庄周论道,庄子继承并发挥了老子道的思想《逍遥游》的英译sources of Chinese Tradition ,compiled by W.Theodore de Bary , Wing—TSIT ,Burton Watson ,其译文准确传神,生动且有气势,借用西方神话典故形象,出神入化,而传达出中国道教的思想精髓,英语中运用when the bird rouses itself and flies and when it moves itself in the sea 两个时间状语。天池则译为celestial Lake.第七讲孔丘论语一共二十七篇,是孔丘弟子和后学关于孔丘言行的记录,内容包括政治主张,教育主张,伦理观念和品德修养等方面。论语的标题翻译,有音译和译意两种lunyu 和analects 至于Confucius的英译,本于孔夫子而不是孔子有加已改正并派生若干个单词,如Confucian, Confucianism.古文中的子对学人的尊称The master.君子转成形容词 gentlemanly.第八讲人性的概说中国哲学关于人性的思考始于先秦,其中有丰富的思考和讨论,孔子首先提到性相见,习相远的简洁,在蒙学课《三字经》中增广为人之初,性本善。本文选了《孟子。公孙丑上》中关于‘人又四端的论述,人有四端译成four beginnings of human nature ,孟子有专门的译法,Mencius.人皆有不忍人之心采用了直译的方法,all men have a mind which cannot bear to see the surfings of others.见孺子后用about to fall into a well 译将入于井。第九讲名家论坛,名家是中国战国时期一个颇具特色的学派,它以名实关系问题的考察和论辩主题,为逻辑学,语言哲学,哲学认识论和方法论乃至本体论提供了新的角度和思路,公孙龙上乘邓析,师承墨子,与惠施同时代,为中国古典逻辑学和语言分析学奠定了基础。荀子 不仅对先秦诸子多有批判继承而独成大儒,而且对正名问题作出了系统总结并有独到的创造。名实论译为 discourse on name and actuality.语其所产译作together with what they produce.以其所正正其所不正,前须加词加意以去开首唐突之嫌。英译前加主语,anything subject to rectification of location 后用条件句 when it is not properly located.第十讲兵家谋略,兵书是春秋末年齐国人孙武所著十三篇孙子兵法(sunzi: the art of the war)其产生比西方国家经典克劳塞维兹的战争论(on war)要早两千多年,国之大事译意为与国家生死攸关的重大问题,英文中的vital已经有生死攸关之意,以索其情转译为 to assess the outcome of war 和经之以五事译为 in terms of the following five fundamental factors.道;the way 加词I mean moral influence ,意指道德影响力,天加词the effects of 以连文意,阴阳(day and night)地 earth 分为distance ,the terrain ,the land ,the place 再仔细说明颇有次序,独具匠心。法:rules and regulations 并不准确,即刻转为principles,靠近原意,曰则译成find out.兵者,诡道也。译为,war is a game of deception.攻其不备,出其不意。颇有警句风格,attack where he is least prepared.take action when he least expects you.庙算:一词乃是典故,又是全篇的归结语词,he who makes full assessment of the situation at the prepare council meeting in the temple.第十一讲,史学绝唱,中国第一部不朽的纪传体通史是司马迁的史记,历史在以文史哲为宗的中国文化思想有突出地位。最早的中国史书《尚书》,(book of history),《左传》是我国第一部记事较详细的编年史书。史记的庞大在客观上增加了对翻译的难度,列传:records of the historian.吾尝三仕三见逐于君译为 I was three times in office and three times thrown out of it by my sovereign.召忽死之:shao hu committed suicide.其为政也;in the matter of government.第十二讲 文学传记 从历史的真是性来看,似乎文学传记的产生逻辑和历史地位应在任务传记之后,单说传记,乃是一个民族的的自我意识的觉醒。东晋诗人陶渊明,自然受到竹林七贤啸傲山林的处世方式与越名教而任自然的超然思想,以五柳先生传为例,五柳先生采用直译,the man of five-willows.先生不知何许人也,the gentleman’s place of birth is not known nor his name or surname.闲静少言,不慕荣利:he is a quiet man ,being of little speech ,he pursues no glory ,nor material gains.家徒四壁his house is bare around.第十三讲文心文论,先秦诸子百家争鸣,两汉时期文章勃发。此后的魏晋多事之秋,不仅是诗人的时代还是玄学的时代,而且作为两者的结合,也是文论的大兴时代,曹丕,陆机等一代才子,发奋成文,各成一家,不仅为文必秦汉做了理论说明,为盛唐的文以载道开了先河,而且继承先秦诸子的哲学论文以后,开启了文艺学论文的时代高峰。严格的字面翻译以外,拆字法和和拼字法也是常用的翻译方法,如身体,this body,良史 译为 good historian 荣乐 glory and pleasure。在涉及中国文化专门的词汇时,特别是人名地名和书名的时候,译者不仅在注释中有专门的补充说明,而且利用文本有限的空间,进行合理的增加和加注.盛唐诗歌,唐代是中国封建社会的鼎盛时期。国家统一,经济繁荣,三教并用,文化昌盛,为唐代诗歌的昌盛创造了有利的条件,他们从诗经,楚辞,乐府,古诗,民歌中吸取营养,李唐三百年,留诗五万首。盛唐诗仙李白,诗圣杜甫成就最高,诗的翻译不徒译意,还要译味,好的诗译,应是形象与音韵俱佳,译诗的忌讳就是呆译,硬凑韵脚,李白的月下独酌,译为Last words ,意在标新立意,而多一般为直译;Drinking alone in the moonlight.首句译诗花间和一壶酒:an arbor of flowers and a kettle of wine.我歌月徘徊,我舞影零乱。See the moon---how she glances to my song ,see my shadow –it dances so lightly alone.第十五讲诗品诗歌,中国是一个诗文大国,有习惯吧人品和文心视为一体,形成独特的诗文风貌,本文选录诗大序,这里面要注意到的是志 being intent ,心 mind,言 language 情 affection 形 form,文 pattern 正 correct 得 achievement。第十六讲 唐宋散文 散文诗一个广阔的领域,是一种无可定界的文体。最早的散文是以作者个人为单位会为一集,并且因为没有名称而是用了作者的姓名,是有宴会是文人骚客游乐抒志之记录,其序文常邀请当事名家,几乎成一独立的载体,本文选录了春夜宴桃李园,首句中的inn以中文的逆旅,颇有古典风味,浮生若梦,为欢几何?浮生则译成the floating life 与中文在字面上相合。第十七讲,书谱书论,书法史中华艺术园地的一朵奇葩,书法理论如同创作一样。到了唐代,不进书法创作本身取得了骄人的成绩,还涌现出一大批杰出的书法家,例文之中给出了翻译,zhuanshu looks complaisant and mild.li comes in tight-fitted units.cao flows and goes on forever zhen is succinct and neat.第十八讲 禅宗智慧 中国的传统文化是封闭自足的发展过程中,遇到两次外来文化的挑战和接触,一次是东汉以来佛教和平的传入还有一次就是近世西方欧美民主科学精神随着救亡图存强行的传入,佛教的传入自翻译开始,尤其是大乘般若学在译经传道中演为空中,禅分为南北宗,主张顿悟,与主张渐悟的北派禅宗相对立,大乘 Mahayana 法 dharmas 止 cessation 法门 method 真 genius 如 thusness 心性 the mind nature 一心 the single mind 生灭 production generation and destruction 相 appearance 因缘 causality 三世 three ages 等。善知识 good friends ,being outwardly separated from all forms , this is non-form.第十九讲 两宋词章 中国封建文化的高峰唐朝之后北宋和南宋,国势虽然衰落,但在文学上以词为代表,在成就上逐渐达到了唐诗的高度并与齐名,这里选的是北宋文豪苏轼的水调歌头。作为豪放派的代表作,南宋女诗人李清照人婉约而超之,写闺怨而出奇,今选其名作声声慢。我欲乘风归去,riding the wind ,there I would fly 起舞弄清影,何似在人间?I rise and dance ,with my shadow play on high as on earth, would be as gay.第二十讲 元曲杂剧 隋唐之后战乱不断,朝代更迭,少数民族政权相继入主中原。元代的散曲和杂剧把中国传统戏曲推向 崭新的阶段,或表现男女的爱情或表现热爱大自然美景,或关心社会疾苦和社会问题,就来源而论,曲分南北,有北曲和南曲之分这里选录了窦娥冤。

其他四讲也是涉及了古代的文化典籍,所涉及到的中国元素,都巧妙的绘声绘色的翻译过来,如三国演义 等,注释是翻译必不可少的手段。

本书的附录为中国历代文化典籍篇目,说卦传 treatise of remarks on the trigrams 说文解字 Explanation of script and Elucidation of characters.这里汇集了所有的中国要籍,可以借鉴翻译方法和翻译手段。

第三篇:中国特色词汇及其英译[模版]

宣纸 rice paper 衙门 yamen 叩头 kowtow 孔子 Confucius

牌楼 pailou;pai-loo

武术 wushu(Chinese Martial Arts)

功夫 kungfu ;kung fu

中庸 the way of medium(cf.Golden Means)

中和 harmony(zhonghe)孝顺 to show filial obedience 孝子 dutiful son 家长 family head 三纲:君为臣纲,父为子纲,夫为妻纲 three cardinal guides: ruler guides subject, father guides son, husband guides wife 五常:仁、义、理、智、信 five constant virtues: benevolence(humanity), righteousness, propriety, wisdom and fidelity 八股文 eight-legged essays

多子多福:The more sons/children, the more blessing/ great happiness 养儿防老:raising sons to support one in one's old age The 24 Solar Terms:

立春Spring begins.雨水The rains.惊蛰Insects awaken.春分Vernal Equinox

清明Clear and bright.谷雨Grain rain.立夏Summer begins.小满Grain buds.芒种Grain in ear.夏至Summer solstice.小暑Slight heat.大暑Great heat.立秋Autumn begins.处暑Stopping the heat.白露White dews.秋分Autumn Equinox.寒露Cold dews.霜降Hoar-frost falls.立冬Winter begins.小雪Light snow.大雪Heavy snow.冬至Winter Solstice.小寒Slight cold.大寒Great cold 戏剧表演 Theatrical Performances

京剧人物脸谱

types of facial makeup in Beijing opera 生

male characters 末

middle-aged male characters 净

“painted face” characters 旦

female characters

clown 京剧票友

amateur performer of Peking Opera 木偶戏

puppet show 独角戏

monodrama;one-man play 皮影戏

shadow play;leather-silhouette show

折子戏

opera highlights 戏剧小品

skit 哑剧

dumb show;mime;mummery;pantomime 单口相声

monologue comic talk 双口相声

witty dialogue

口技

vocal imitations;ventriloquisim 说书

monologue story-telling 杂技

acrobatic performance 叠罗汉

making a human pyramid 特技

stunt

踩高跷

stilt walk 马戏

circus performances 神化人物 Mythological Figures

八仙

the Eight Immortals 嫦娥

Chang’e(the Chinese moon goddess)伏羲

Fu Xi(God of Fishery and Husbandry)福禄寿三星

the three gods of fortune, prosperity and longevity 共工

God of Water

后羿

Houyi(a legendary hero who shot down nine suns)黄帝

Yellow Emperor 夸父

Kuafu(a fabled sun-chasing giant)女娲

Goddess of Sky-patching 盘古

Pan Gu(creator of the universe)

神农

Patron of Agriculture 禹

Yu(the reputed founder of the Xia Dynasty)祝融

God of Fire 古代建筑 Ancient Architecture

pagoda 琉璃塔

glazed stupa 舍利塔

dagoba;sarira stupa(a pagoda for Buddhist relics)舍利子

sarira remains from cremation of Buddha’s or saints’ body 喇嘛塔

Lamaist pagoda

storied buildings 钟楼

bell tower 鼓楼

drum tower 阁

pavilion 烽火台

beacon tower

华表

ornamental column 牌坊

memorial archway 艺术及工艺 Arts and Crafts

版画

engraving 贝雕画

shell carving picture 彩塑

painted sculpture 瓷器

porcelain;china 刺绣

embroidery

雕刻

carving 宫灯

palace lantern 国画

Chinese painting 剪纸

paper-cut 景德镇瓷

Jingdezhen porcelain

景泰蓝

cloisonné enamel 蜡染

batik 麦秸画

straw patchwork 木/石/竹刻

wood/stone/bamboo carving 木刻画

wood engraving

泥人儿

clay figure 皮影

shadow puppet 漆画

lacquer painting 漆器

lacquerware 双面绣

two-sided embroidery

水墨画

Chinese brush drawing;ink and wash painting 檀香扇

sandalwood fan 唐三彩

Tang tri-coloured pottery 陶器

pottery;earthenware 图章

seal

拓碑

making rubbings from inscriptions, pictures, etc.on stone tablets 拓片

rubbing 微雕

miniature engraving 象牙雕刻

ivory carving 宜兴陶

Yixing pottery

篆刻

sealcutting

中国特色词汇及其英译

作者:未知 文章来源:转载 点击数:1300 时间:2010-12-29 18:33:50

一、前言

英语从它传入中国的第一天开始就发挥着强大的交流作用,同时也开始了在中国发展的过程。而当中国改革开放,政治,经济,科学技术,社会生活等诸方面发生急剧变化的时候,一批又一批新词新语也应运而生,其数量的成长速度之快令人应接不暇。于是在国际英语交流过程中,表现了中华文化中最有个性的内容的,具有浓郁的中国特色的词汇,在西方语言中是没有现成可以对应的词语,这就产生了对应空缺的现象,成为跨文化交际的重要障碍。此时,研究应如何解决这个障碍,为中国文化更好的传播铺平道路显得尤为重要。本文将对上述的一些问题进行阐述。

二、中国词汇的特点

世界上的文字体系大致可以归属三类:表形文字(图画文字),表音文字(音意结合文字),表意文字(拼音文字)[1](25)。汉字,属于表意文字,它与世界大多数民族使用的拼音文字是有显著的差别。它的字形结构与表意作用有着紧密的关系。汉字的这一特点当然是由汉语的本身特点所决定的。古代汉语中单音节词占优势,同音词多,又缺乏形态变化,加上方言分歧严重,而表意性质的汉字正可适应这些特点而满足交际的需要。于是这种文字本身就成为中国文化的一大特色[2](362)。那么汉语的词又是怎样造出来的呢?“汉语的字和词是分开的。汉语的字是有限的,虽然人们还在造新字,但是这是极为有限的。而汉语新词构造却是无限的。”“汉字的词形较为固定,不像英语那样可以变化多端。现代汉语与英语相似,采用合成法来扩充词汇,汉语的字、词拼组新词的时能力及强。”相比之下“英语的字与词是不分的,或者说没有字,只有词。英语虽然有自由词根(free-bound),但数量有限”就是因为汉字多体现其(形)意,所以“汉语词义比较窄,较为精确、固定、比较严谨,因而词义的伸缩性和上下文的依赖性就比较小,独立性就较大。”[1](26)就因为中国词汇具有以上的特点,在双语转换的过程中就会出现词汇空缺的现象,而这些特点的形成与其所在的文化背景是分不开的。

三、中国特色词汇翻译的难点及成因即文化差异所造成的词汇空缺

语言是在历史长河的发展中形成的,语言是文化的载体,文化是语言的土壤。文化的真正意义对于本文化群体来说那是再熟悉不过的东西了,但是对于不同文化的群体,则是非常陌生的。不同的文化造就了不同的语言群体,于是,当不同语言群体在相互交流的过程中就产生了词汇空缺,即无法在非本族语言的范围内寻找到能够表达其意思的相对应的词汇,而这些文化的差异主要表现在信仰,艺术,道德,法律,风俗以及其余社会上习得的能力与习惯上

(一)、传统积淀历史文化因素造成词汇空缺现象 中国是具有悠久历史的东方文明古国,其传统的文化思想自然反应到语言上。传统的固然在人们的脑中是根深蒂固的,就像这个“龙”字,在华夏文化中,“龙”字是传说中的神异动物之一,与凤凰、麒麟、龟合称“四灵”。除这个字义外,它还被视为中华民族的象征,形成一种中华文化图腾,现在称炎黄子孙为“龙的传人”,可见其影响之大。后世的很多皇帝就“龙”这个事物作为权威的象征,如坐龙椅,褂龙袍,睡龙床等等。然而在西方国家,“龙”(dragon)是凶险的,“因为在英语的历史上从贝尔沃夫时代起,龙就是凶险邪恶的象征,是吐火伤人的怪物。”[1](277)这是传统积淀造成的人们对同一事物的不同理解,其进一步的发展就造成了词汇空缺。再如“中秋节”Mid-Autumn Day;“泼水节”Water-Splashing Day等,这些都是中国传统佳节,是中国优良文化的积淀,悠久历史传承至今的瑰宝,这些传统文化佳节现在已经不仅仅是被中国人所专有,它们也在一些喜欢中国文化的外国人中流行起来。而欧美信仰的是基督教,所以有不少词汇包括他们的节日都与《圣经》和基督教有关,如a covenant of salt(不可背弃的盟约),as poor as a church mouse(家徒四壁);较之,汉族文化的重要组成部分与佛教和道教是分不开的,如:苦海无边,回头是岸,佛法无边。再有一些如“武术” wu shu ,“功夫” kung fu,“扭秧歌”yang ko,这些民间的特色文化,在中国还未对外开放,这些对西方人来说都是闻所未闻的,这些都反映了这两种不同的历史文化所造成的词汇空缺。

(二)、地域文化的差异造成的词汇空缺

地域文化差异指的是一个民族所处的地理位置、自然条件和生态环境等不同所形成的文化差异。语言的产生与人们的劳动和生活有很大的关系,中国英语中大量的成语、典故、俚语、俗语、格言、谚语等都带有浓烈的汉名族特色和地域色彩。汉民族是生活在亚洲大陆上,人们的生活离不开土地。而英国是一个岛国,航海业一直很发达。两者的不同就出现了汉语文化中很多词汇与土地有关,而在英语词汇中很多都与海有关;例如,汉语用“土崩瓦解”形容彻底崩溃,无法收拾,而英文用“get into hot water”表示陷于困境。“烂醉如泥”英文用drunk as a sailor,这里不用泥,而用的是水手[3]。

此外,地域的差异影响到的气象变化进而还会影响到农牧业,这方面的不同是造成中英无对应词汇的另一个因素。不列颠岛西北山区潮湿多雨,其后属湿润型,在树林里适合生长蘑菇,而中国地处东南亚,幅员辽阔,各地的其后差别也是相当大的,于是汉语中用来比喻新事物迅速大量地涌现出来的成语“雨后春笋”被译成英文时就为spring up like mushrooms or to mushroom up。

(三)、习俗文化的差异造成的词汇空缺

英汉风俗习惯的差异体现在许多方面,如饮食,婚嫁,节气,对色彩的偏爱,亲属关系等等。这些差异也常常使语言间出现相对的词汇空缺现象。比如,在中国,人们喜欢在喜庆的节日里用红色来装扮,认为红色代表着吉祥好运,新人在结婚的时候都喜欢穿着红色的衣服;而在西方国家里它们则认为红色代表着暴力与血腥,新人们在婚礼时则以白色来代表它们纯洁无瑕的爱情,但在中国,白色却时常表示不幸[4]。所以英语中的吉日不是中国人所想象的a red day正确的应该是a white day。而汉语中所说的红人则不可以翻译成a red-haired girl,其正确的译法应该是a white headed boy.再来看看在对待动物的态度上,英民族喜爱宠物,狗是他们最喜爱的宠物之一,他们认为狗很忠诚。而狗在汉文化中却是一种卑微的动物,它被人看作是“低贱”的代名词。所以与狗有关的词语大多含有贬义,如:“狗胆包天”“狗仗人势”“狗腿子”“狗头军师” “狗急跳墙”;但英文中,有关狗的词语大多没有贬义,如:“居于高位” be top dog; “幸运儿” a lucky dog。再如,中国古时候女子要以三寸金莲为美,于是就有女子“裹足”bound feet: a vile feudal practice which crippled women both physically and spiritually, 以及“童养媳”child wife: girl raised from childhood to be wife of son of family.还有一些反映中国居住习惯的词如“炕” kang: a heatable brick bed等等。以上都可以被看成是习俗文化的差异造成的词汇空缺。

四、中国特色词汇的几种英译方法

翻译是一种跨文化行为,它不仅仅是两种语言间的相互转换,更是两种文化的交融[5],其复杂性是不言而喻的。而中国特色词汇是凝聚着中国悠久历史文化的精髓,在翻译时要如何在保留中国特有的文化内涵的同时,又可以让西方的人们可以弄懂和接受,那就不仅需要译者有深厚的文学功底而且也应具备丰富的文化知识。

(一)、音译

音译,在中国,其定义为“把一个国家或民族的人名、地名、或其它名词的读音译成另一个国家或民族的读音”。而外国学者则把音译解释为“把一种语言中的词、字母的读音译成另一种语言的读音”[6]。从音译法的定义来看,音译法较之其它方法,在翻译引进专业技术术语、人名、地名和商品名等专有名词时较常用。而且,音译在双语转化的过程中能够叫完整明显的保留原有读音,听起来显得特别有亲切感。比如:“茶,由中国流传至世界各国,也是人们所熟悉的,英语中的tea起源于闽南方言„茶‟的读音”[2]369英语中的won ton(馄饨),yamen(衙门),mafoo(马夫),xiucai(秀才)等等。这样,既保持了语义的中国文化特色,又吸引了读者的注意力,又不失顺应了语言交际的环境。但是,音译并非是尽善尽美的,比如市面上卖的一种名为LUX的日常洗漱用品,它的中文名字为“力士”,单看此中文名字,让人们首先联想到的一定是大力士,他们具有发达的肌肉,超强的运动能力,很难让人们想到使用此产品后达到的那种舒爽,滋润的感觉。这就造成了读者们的困扰。

(二)、直译

那么什么是直译?目前尚无定论。但是可以采用一种说法,即在不违背译文语言规范以及不引起错误联想的前提下,在译文中既保留原文内容又保留原文形式,特别指保持原文的比喻、形象和民族地方色彩等的译文为直译[7]。目标是作到形式与内容的统一,即“形”,“神”兼备。如“铁饭碗”直译成iron rice bowl;“红包”直译成red packet;“开放政策”open-door policy;“乡镇企业”township and village enterprises;“黑市”black market “时间就是金钱” Time is money等等,这些翻译既表达了原词汇的内容,又保存了原词汇的比喻。但是直译常常会造成译者往“死译”的空子里钻,翻译出的词汇,文章就会显得刻板,当采用直译时要特别注意这一点。

(三)、意译

意译,简单地说,是放弃原文的修辞格,也不用其他修辞格,只是把意思平铺直叙地翻译出来[8]。他是通过对原词汇深层蕴意的理解将原词汇的表层结构有机地转化为译语的表层结构,重在再现原词汇的蕴意,真实的传达词汇所含的信息[9]如“专有技术”technical know-how “三句话不离本行” talk shop all the time “鱼米之乡” a land of honey and milk “小处节约,大处浪费/小事聪明,大事糊涂” Penny wise, pound foolish;“大排挡”sidewalk snack booth等等,这些意译是通过对词汇深层蕴义的理解后将通过找到对方文化中所相似的事物情景,采用,其真实的传达原词汇所含的信息。它是一种不拘泥于原词汇形式的翻译方法。它重在传“神”不是“形”似。当然,意译也同样存在着一些缺点。许多外来的词汇,一个词并非只有一个对应的解释,翻译时在相对缺少上下文的时候,译者们就难以准确的选择其意译,造成误译;另外,在对缩略词意译的时候,会出现信息的缺失现象:如人们常说的CD中文解释为激光唱盘,而CD的全称应该是 “Compact disk”,其中“compact”一词有紧密的,简洁的,轻巧的意思,单从英语词汇层面上看,是很难联想到这个词组与激光有何联系的。

(四)、音译与意译的结合

如ice-cream,中文解释为冰激凌,其中“冰”是ice的意译,“激凌”是cream的音译;之外还有romanticism即浪漫主义,“浪漫”是romantic浪漫蒂克音译的节略,“主义”则是-ism的意译。

(五)、直译或音译分别与释译的结合1、音译与释译的结合

此方法多用于翻译一些复合词,如“唐人街”或“中国城”China town,其中China是中国封建王朝“秦”字的音译Chin,而town在英语中表示“城市”;也有一些是表示中国特有的民族民俗的词语也运用了此种翻译的方法,如“风水”feng shui: the location of a person‟s house and ancestral grave, supposed to have an influence on the fortune of a family and his off springs;“阴”yin :the passive, female cosmic principle in Chinese dualistic philosophy.它们既保持了中国特有事物的原味,又不会让那些不熟悉中国文化的初学者在开始阅读的时候感到一头的雾水。

2、直译与释译的结合

在一些具有中国古代习俗文化的特色词上,有时也用直译和释译结合的方法。比如说“裹足”bound feet: a vile feudal practice which crippled women both physically and spiritually.“三多一少”:Three mores and one less: the commodity circulation systems of more economic forms, more circulation channels, more management ways and fewer stages for authorization of dispatch

以上两种翻译方法,在翻译形象化语言的时表现出明显的中华民族文化特色,这不但使外国人深感耳目一新,回味无穷,犹如饱餐了一顿异国的佳肴。这些中国特色词汇的出现,也大大丰富了英语的表达方式。

综上,翻译中采用什么方法,主要不是决定个人的爱好和主观愿望,而是决定于翻译活动的客观条件和客观要求[10]。因此,当译者们在翻译的时候,做到尊重原文的主旨的前提下,应该对所采用哪一种翻译的方法进行深思熟虑,以便使译文在被读者阅读的时候较好的吸收其中的知识,在之后的运用中准确的发挥。

五、中国特色词汇的前景

“语言是人类最重要的交际工具”(列宁)。它是人类所特有的,用任意创造出来的符号系统来表达感情和愿望,交流思想的方法[11]。但是,没有一种语言能够完全承载世界的所有文化。如今,英语不可否认地成为一种使用较为广泛的国际通用语言,它是国与国之间相互交往的一种工具,可以说它不再为一国或一个民族所专有,而成为一种中性的信息媒介。随着全球一体化进程的加快,中国对外改革开放的不断深入和中国经济的进一步发展,现代汉语中出现了大量的新词汇,包括旧词新义、流行语、外来新词语等;甚至不少己湮没多年的旧词语也频频亮相,中国在国际事务中地位的不断提高,带有强烈中国特色的词汇在世界大家庭中的地位也会随之进一步提高,对中国特色词汇的研究也将逐步成为中国乃至世界英语教学和研究界的一项重要的探讨课题。中国的语言工作者在该领域的研究要走在世界的前列,其研究就不能仅仅停在“中国特色词汇”这一小的层面上,对于其它层面也应对其深入的,联系的,广泛的研究。应力求使中国英语贴近中国的社会现实,努力以全世界的英文读者为对象,来大力传播中华文明。

六、结束语

中国人是在中国特有的社会文化中成长,生活的,使用带有中国特色的英语。在跨文化交际中,中国特色词汇翻译得当,在表达中国特有事物中会起到独特的作用:可以使汉文化渗透到英语中去,进而使英语在中国“本土化”中得以再生。从汉语意义译成英语后生成新的英语意思,并成为英语文化的一部分。使得英语读者对中国特色英语也并不十分陌生,对中国文化感兴趣,要达到这一效果就要对中国特色英语坚持不懈的研究。

第四篇:英译中国文化经典精读教程

《英译中国文化经典精读教程》总序、前言(21世纪多维英语规划教材)

“21世纪多维英语规划教材”专家委员会

总主编 陆道夫 肖坤学 主编 陆道夫 粟孝君

顾问:何自然梁锦祥

专家委员会成员:(按姓氏音序排列)陈建平(广东外语外贸大学)陈晓茹(广东工业大学)董金伟(广东外语外贸大学)范武邱(中南大学)宫琪(暨南大学)郭雷(华北电力大学)郭英剑(中央民族大学)何高大(华南农业大学)黄运亭(华南理工大学)李月(桂林电子科技大学)凌海衡(华南师范大学)刘洊波(华南理工大学)陆道夫(广州大学)陆国飞(浙江海洋学院)牛保义(河南大学)彭建武(山东科技大学)沈素萍(对外经济贸易大学)王东风(中山大学)王丽丽(福建师范大学)王哲(中山大学)肖坤学(广州大学)谢江南(中国人民大学)辛铜川(广州医科大学)张国申(中国药科大学)张晓红(深圳大学)张广奎(广东财经大学)赵德玉(中国海洋大学)朱跃(安徽大学)

总序

何莲珍(浙江大学外国语学院院长,博士导师)

中国的英语教学近年来取得了骄人的成绩,这是不争的事实。但回溯历史,我国的外语教学即便从清代最早培养译员的京师同文馆算起,也不过100多年。期间受西方语言教学理论与实践的影响,我国的外语教学经历了从传统语言教学到结构主义教学到交际法教学的转变,教学的重点也经历了从知识的传授到技能的培养到交际能力的培养的转变。进入21世纪,我国教育部颁布了《大学英语课程教学要求》(以下简称《课程要求》),对高等学校非英语专业本科生大学英语课程教学提出了一般要求、较高要求和更高要求。一般要求是高等学校非英语专业本科毕业生应达到的基本要求,较高要求或更高要求是为有条件的学校根据自己的办学定位、类型和人才培养目标所选择的标准而推荐的。按照《课程要求》,大学英语课程体系应该将综合英语类、语言技能类、语言应用类、语言文化类和专业英语类等必修课程和选修课程有机结合起来,以确保不同层次的学生在英语应用能力方面得到全面的训练和充分的提高。《国家中长期教育改革发展规划纲要(2010—2020年)》也对我国今后十年的高等教育发展提出了明确的目标:完成从数量到质量的转变,进而提高我国高等教育的国际化办学水平,培养大批具有国际视野的跨学科、复合型创新人才。现任美国耶鲁大学校长的理查德·乐文(Richard Levin)教授对我国高校本科教育创新型人才的培养提出了两条有益的建议,令人深思。乐文教授强调要拓宽跨学科的广度,培养批判性思维。前者是要开展通识教育(General Education),后者是要打破思维定式(Thinking Set),这两者是中国学生创新能力持续发展的基础。无独有偶,早在1928年,同样是在美国的耶鲁大学,著名的耶鲁大学报告提出了“头脑的纪律”和“头脑的家具”的惊人之说。专业知识就像脑袋里面装进的家具,在迅速变革的世界中,从长远来讲并没有太多的价值;学生需要的是头脑的纪律或者说思考的框架,让他们适应不断变化的环境,找到解决问题的各种方案,成为主动学习或自觉学习的独立思考者,而不再是被动机械的接受者。在国内外这种教育背景之下,“怎样学习英语”这个古老的话题似乎又有了新的含义。在我看来,学习英语至少有以下两大要素是要铭记在心的。打好语言基本功是英语学习的第一要素。扎实的语言基本功是成为国际化人才的关键。语言基本功包括语言知识和语言技能。语言知识包括语音知识、语法知识、词汇知识等。在大学英语学习阶段,我认为词汇学习不仅要在广度上下功夫,更要在深度上下功夫。语言技能包括领会式技能和复用式技能,两者缺一不可。除此之外,语言基本功还包括交际能力。交际能力包括语言能力,但不仅仅是语言能力,还包括语篇能力、语用能力,一个具有交际能力的学习者不仅能按照语法规则组成语法正确的句子,而且知道何时何地对何人使用这些句子。扩大知识面是英语学习的第二要素。英语中有句俗语:“A jack of all trades and master of none.”中文意思是“样样通一点,样样不精通”,也就是我们中国人所说的“万金油”。作为一个英语学习者,我认为需要有一种成为“万金油”的精神。英语学习者要扩大知识面,千万不要为学英语而英语,要多方面、多途径地涉猎各方面的知识。学习者不仅要了解目标语国家的历史、地理、政治、经济、文化、风俗和科技等方面的情况,更要深入了解本国的历史、文化等方面的情况,从而让自己成为中外文化交流的使者和桥梁,让中国更好地了解世界,让世界更好地了解中国。恐怕没有人会否认,成功的英语学习者除了语言天赋之外,良师的指导和教材的辅助也是功不可没的。随着我国大学英语教学改革的不断深入,英语教学理念也发生了很大的变化。现代英语教学已实现了从“单纯掌握英语语言工具”到“获取信息、有效交流,甚至抢占知识资本和信息资本”的转变,许多英语新课程也都注入了“以人为本”的教育理念,从过去单纯注重知识传授,转变为引导学生学会学习、学会分析、学会思辨、学会批判、学会合作、学会生存、学会做人,打破了过于狭窄的课程设计和教学定位,转而关注通才教育和素质教育。这几年国内的英语教材在国际化视野下实现了内容的优化与整合,从单一到多维,从单项到立体,从语言知识到文化意识,从语言技能的输入到专业案例的实操,教材的多元化可谓精彩纷呈,势在必行。暨南大学出版社与时俱进地研发并精心策划了这套由广州大学陆道夫教授、肖坤学教授总主编的“21世纪多维英语规划教材”,就是在上述这种新的教学理念基础之上,经过多位英语专家教授把关、一线教师教学实践体验、多轮课堂教学检验的一次大胆尝试。“21世纪多维英语规划教材”试图建立一个多维度、跨学科、宽视野的立体化教材资源库。本套教材包括《商务英语跨文化交际》、《新编会展英语实务》、《医学英语视听说教程新编》、《医学英语SCI论文写作教程》、《法律英语翻译教程》、《西方文化英文经典选读》、《英译中国文化经典精读教程》、《英美经典短篇小说阅读教程》、《大学英语人文通识读本》、《大学英语通用翻译教程》、《英语专业学士论文写作教程》等。编写过程中充分考虑到英语学习者输入与输出、语言与文化、知识与能力、个人与社会、历史与现实、理科与人文的多维交叉和相互渗透。整套教材不仅蕴含了丰富的英语语言资源与文化信息,还精选了当代经济生活中的医学英语、商务英语、会展英语、法律英语、涉外翻译等各类真实语境材料,克服了传统英语教材中务虚避实的形式主义流弊,体现了编者们丰厚的教学积累和温馨的人文关怀。能力培养与人格塑造并重,语言运用与思维训练齐举,应该说是本套教材的一大亮点。我相信,暨南大学出版社这套“21世纪多维英语规划教材”,将会给我国21世纪复合型创新英语人才的培养带来新的启迪,做出新的贡献。

前言

陆道夫(广州大学外国语学院教授,硕士生导师)

随着400多所孔子学院近十年来在海外的兴办与发展,中国文化越来越引起国外专家学者、平民百姓的浓厚兴趣。然而,与之相应的中国文化英语教材建设似乎没能实现同步发展。在国内的许多大、中小学,用英语开设中国文化课程的更是少之又少,以至于不少人虽然谈起西方文化如数家珍,可一旦用英语谈起中国文化,就会因为语言障碍和知识匮乏而捉襟见肘。更有甚者,北京大学和清华大学的两位教授竟然把孟子(Mencius)译为“门修斯”或“孟修斯”,把蒋介石(Chiang Kaishek)译成“常凯申”,令人啼笑皆非。不少大学生或老师对那些诸如“拜年”(ahappynewyearwish)、“对联”(couplets)、“科举制”(imperial civil examination system)以及“三纲五常”(three cardinal guides and five constant virtues)之类富有历史内涵的中国文化术语,不知如何用英语表达(见本书附录二“常用中国文化专有术语汉英对照精选”)。在2013年12月新启动的大学英语四级考试的“段落汉译”中,许多考生对“丝绸之路”、“中秋节”、“福、寿、禄”、“中国结”等中国文化专有词汇无从下笔,直呼“坑爹”,有不少考生甚至干脆用汉语拼音代替英译。这无疑暴露了目前我国英语教学对中国文化的漠视和短见。针对这一情况,我们组织了国内几所大学的一线骨干老师,在近几年开设大学英语拓展课“中国文化英语阅读”的基础上,编写了这本《英译中国文化经典精读教程》,试图通过对先哲圣贤们的经典著作的译本选读,挖掘中国文化的精髓,把握中国文化的精神,为中国文化在海外的传播做些力所能及的贡献。《英译中国文化经典精读教程》选择了能够代表中国传统文化的17本经典著作——《诗经》、《大学》、《中庸》、《论语》、《孟子》、《易经》、《道德经》、《庄子》、《文心雕龙》、《战国策》、《史记》、《孙子兵法》、《三国志》与《三国演义》、《金刚经》、《黄帝内经》、《茶经》等,几乎涵盖了中国传统文化能够涉及的文学、哲学、史学、医学、农学、宗教、军事等重要领域。每一单元分为“背景简介”、“文本选读”、“难点释义”、“问题思考”、“经典导读”、“译本链接”等6大板块。

作为“21世纪多维英语规划教材”的一种,《英译中国文化经典精读教程》可与已经出版的《西方文化英文经典选读》配套使用,作为本科生大学英语拓展课程、英语专业高年级选修课程、海外孔子学院中国文化专修课程等的教材。根据我们近三年在广州大学和南方医科大学开设该课程的教学实践,通常情况下,作为大学英语拓展课程,“英译中国文化经典阅读”课程可安排在大学二年级第二学期或大学三年级第一学期开设,英语专业可根据学生的实际英语水平,在大一下学期或大二上学期开设。阅读经典原文是实现本课程教学目标的根本保障,因此教师应严格要求学生按时、按质、按量完成阅读任务。不同的学校可以根据学生的实际水平酌情增减阅读量。为了加深学生对经典的理解,进一步训练学生的思辨能力和独立思考能力,使之能够主动进行立论、辩论或对自己的论点进行修正,主讲教师可以每3~4周集中开展一次讨论课,或者就同一单元的同类主题,或者就不同单元的同类主题展开课堂讨论,或者安排4~5名学生选择本单元中的名家名篇,围绕“问题思考”中提出的问题,作10~15分钟的拓展性学术报告,并展开质疑、反诘、辩驳等形式的小组讨论。该课程的考核不妨以形成性评估为主,终结性评估为辅。形成性评估包括学术报告、学期论文、小组讨论、读书笔记、阅读摘要等。形成性评估旨在考查学生的组织能力、思辨能力和学术写作能力;终结性评估主要以闭卷考试为主,考查学生对中国文化著名思想家、思想名著和相关文化背景的了解和熟悉程度。《英译中国文化经典精读教程》是广州大学、上海外国语大学、广东财经大学、南方医科大学、华南农业大学、安徽工业大学、安徽外国语学院等高校一线老师历时三年通力合作的结果。全书的编写提纲、基本框架、文字修改均由陆道夫负责。全书的篇目选择、稿件统筹和校正则由陆道夫、粟孝君共同负责。本书在编写过程中参考了大量的文献典籍和现有的学术成果,参考文献已附在书后,恕不一一列出,谨致歉意和谢意。特别要感谢“大中华文库·汉英对照”编委会为我们提供的资料帮助;感谢国内及海外各位英译作者提供的优质译文;感谢浙江大学外国语学院院长何莲珍教授百忙之中拨冗赐序;感谢西安外国语大学老校长,著名英语教育家杜瑞清教授的鼓励与支持。感谢广州大学国际交流处处长梁碧茹女士,美国卫斯理安学院副校长Vivia LFowler博士为我们提供的经费资助和资料援助。感谢暨南大学出版社人文分社社长杜小陆先生一以贯之的理解、尊重、支持、奉献与帮助。感谢广州大学、南方医科大学选修“中国文化英语”课程的近600名本科生。我在《羊城晚报》上读过一篇随笔,大意是谈信息碎片化的微博浅阅读与文化经典的深阅读之间的差异,并由此而带来的思维方式和内心感受的不同之处。微博浅阅读只要求读者能在海量的信息碎片中作快速筛查,然后在两个原本没有关联的碎片中去建立联系,并把这种联系以巧妙漂亮的手法呈现出来即可。如此就可以赢得观众的欢呼和掌声。通常情况下,读者无须知道“为什么”,只需判断“是什么”,然后把一系列的“是什么”组合起来便大功告成。然而,文化经典的深度阅读则需要读者能够持续专注在书本上,集中全部精力,在阅读的同时必须深度思考。这种深度阅读的过程漫长而连续,且常常伴随着静思和默想。令人遗憾的是,碎片化的微博浅阅读在当下却大行其道,越来越多的手机或iPad“低头族”们其实与一台自动机器并无二致:他(她)们用眼睛读取一条信息碎片,用机械式的手指不断刷屏,作出转发、回复、跳过三种选择。这种过程周而复始,无穷无尽。在此,我禁不住想套用英国小说家狄更斯在其小说《双城记》中的开头几句来勾勒当下的某些时代特征:这是一个物质泛滥的时代,又是一个精神匮乏的时代;这是一个欲望蒸腾的时代,又是一个奢华浮躁的时代;这是一个信息超载的时代,又是一个心灵闭塞的时代;这是一个娱乐至死的流行文化时代,又是一个细品慢咽的高雅文化时代。匆匆的时代步伐,疾风暴雨式的全球化浪潮,每个人的内心和自我因此而受到不同方向的牵引,或离散,或纷乱,终至信仰缺失。不少人拜金、拜物、拜权势,甚至愚昧拜神仙,结果丢掉了“独立之精神,自由之思想”,不仅“奴在身”,而且“奴在心”,一味追名逐利,罔顾人格,贪慕虚荣,尽失尊严。所幸的是,在这样的时代,我们仍然有幸能够沉寂片刻,真真切切地去品读中国先哲圣贤们留下的文化经典之优、之美、之智、之深,这不仅是一种奢侈,而是一种福气。因为老祖宗给我们留下的这些文化经典,经过历史长河的洗涤和冲刷,是一种超越物质流俗的性灵之说、感悟之言和生命呐喊。对于那些每每徘徊、恍惚甚至有些迷惘的当下人来说,阅读这些圣贤经典,在某种程度上算是驳杂之中的单纯、重压之下的逃逸、欲望沟壑的真理;在很大程度上可以给我们带来人文的温暖、乡愁的慰藉、现实的观照和历史的反思。鲁迅先生曾经说过:“惟有民魂是值得宝贵的,惟有它发扬起来,中国才有真进步。” 何谓民魂?传统文化经典无疑是其核心之一。我也深信,“腹有诗书气自华”,“红袖添香夜读书”。阅读经典,“会晤”大师;品味经典,领悟大师;阐释经典,效仿大师。身处21世纪的我们这一代人,应该从中国文化经典中摄取精粹,让科学和理性在生命中绽放,让现实生活中的平庸、枯燥、无奇、丑陋和虚伪遁无去处,让人生旅程中的迷茫、彷徨、孤独、消沉、苦闷、恐惧等全都远离我们的心灵家园。阅读文化经典,应该是一个民族灵魂的核心所在,是一个民族精神的支撑载体,是一个民族文化的本质彰显,是一个民族热情力量的释放。一个民族固然需要时尚阅读、娱乐阅读、消费阅读、功利阅读、实用阅读,但是,深度的文化经典阅读之美、之乐、之智其实更能持久地或潜移默化地影响我们日渐空虚的精神世界,净化我们欲望蒸腾的心灵空间。衷心期望这本《英译中国文化经典精读教程》能够达到这样的编写目的。衷心期盼来自各位专家和读者的批评指正。

目录

Unit One

The Book of Poetry(《诗经》)Unit Two

The Great Learning(《大学》)Unit Three The Doctrine of the Mean(《中庸》)Unit Four

The Analects(《论语》)Unit Five

Mencius(《孟子》)Unit Six

The Book of Changes(《易经》)Unit Seven Dao De Jing(《道德经》)Unit Eight

Zhuang Zi(《庄子》)Unit Nine

Wenxin Diaolong(《文心雕龙》)

Unit Ten

Records on the Warring States Period(《战国策》)Unit Eleven

Records of the Historian(《史记》)Unit Twelve Sun Zi:The Art of War(《孙子兵法》)

Unit Thirteen Records of the Three Kingdoms & Romance of the Three Kingdoms(《三国志》与《三国演义》)Unit Fourteen The Diamond Sutra(《金刚经》)Unit Fifteen Huangdi Neijing(《黄帝内经》)Unit Sixteen The Classic of Tea(《茶经》)Appendix 1 Chinese Text(汉语文本原文)

Appendix 2 Bilingual Glossary of Chinese Culture(常用中国文化专有术语汉英对照精选)

Appendix 3 Booklists of “Library of Chinese Classics(Chinese-English)”《大中华文库》(汉英对照)部分书目 References(参考文献)

样章浏览 《诗经》

Cooing and Wooing(Songs of Zhou)By riverside are cooing。

A pair of turtledoves①;A good young man② is wooing,A fair maiden he loves.Water flows left and right Of cresses③ here and there;The youth yearns day and night。For the good maiden fair.His yearning grows so strong,He cannot fall sleep.He tosses all night long,So deep in love,so deep.Now gather left and right The cresses sweet and tender!O lute,play music brightFor the bride sweet and slender!Feast friends at left and right With cresses cooked tender!O bells and drums,delight The bride so fair and slender!(Translated by Xu Yuanchong)

第五篇:语料库研究综述

语料库研究与应用综述

目录 一概述

二中国语料库建设的基本情况 三语料库的加工、管理和规范 四语料库在语言研究中的的应用 五参考文献

语料库研究与应用综述

一概述

语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。

语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:(1)异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;(2)同质的(Homogeneous):只收集同一类内容的语料;(3)系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;(4)专用的(Specialized):只收集用于某一特定用途的语料。除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。

语料库建设中涉及的主要问题包括:

(1)设计和规划:主要考虑语料库的用途、类型、规模、实现手段、质量保证、可扩展性等。

(2)语料的采集:主要考虑语料获取、数据格式、字符编码、语料分类、文本描述,以及各类语料的比例以保持平衡性等。

(3)语料的加工:包括标注项目(词语单位、词性、句法、语义、语体、篇章结构等)标记集、标注规范和加工方式。

(4)语料管理系统的建设:包括数据维护(语料录入、校对、存储、修改、删除及语料描述信息项目管理)、语料自动加工(分词、标注、文本分割、合并、标记处理等)、用户功能(查询、检索、统计、打印等)。

(5)语料库的应用:针对语言学理论和应用领域中的各种问题,研究和开发处理语料的算法和软件工具。

我国语料库的建设始于80年代,当时的主要目标是汉语词汇统计研究。进入90年代以后,语料库方法在自然语言信息处理领域得到了广泛的应用,建立了各种类型的语料库,研究的内容涉及语料库建设中的各个问题。90年代末到新世纪初这几年是语料库开发和应用的进一步发展时期,除了语言信息处理和言语工程领域以外,语料库方法在语言教学、词典编纂、现代汉语和汉语史研究等方面也得到了越来越多的应用。

语料库与语言信息处理有着某种天然的联系。当人们还不了解语料库方法的时候,在自然语言理解和生成、机器翻译等研究中,分析语言的主要方法是基于规则的(Rule-based)。对于用规则无法表达或不能涵盖的语言事实,计算机就很难处理。语料库出现以后,人们利用它对大规模的自然语言进行调查和统计,建立统计语言模型,研究和应用基于统计的(Statistical-based)语言处理技术,在信息检索、文本分类、文本过滤、信息抽取等应用方向取得了进展。另一方面,语言信息处理技术的发展也为语料库的建设提供了支持。从字符编码、文本输入和整理,语料的自动分词和标注,到语料的统计和检索,自然语言信息处理的研究都为语料的加工提供了关键性的技术。

下面先简要叙述1998年到2003年中国语料库建设的基本情况,然后介绍语料库的加工、管理和规范问题,最后谈谈语料库方法在语言研究和语言工程等方面的应用。由于以前的《中国语言学年鉴》很少谈及语料库问题,为了尽可能全面地反映我国语料库研究和应用的情况,必要时会将时间上限向前延伸几年。

二中国语料库建设的基本情况

90年代末到新世纪初这几年投入建设或开始使用的语料库有数十个之多,不同的应用目的使这些语料库的类型各不相同,对语料的加工方法也各不相同。下面是其中已开始使用并且具有一定代表性的语料库。

(一)现代汉语通用语料库

这是一个由国家语言文字工作委员会主持建立、面向全社会应用需求的大型通用语料库,从90年代初开始建设,计划规模7000万字,主要应用目标是语言文字信息处理、语言文字规范和标准的制定、语言文字的学术研究、语文教育、以及语言文字的社会应用。

这个语料库收录的语料以书面语为主、以书面语转述的口语为辅。语料来源是1919年至今,主要是1977年至今出版的教材、报纸、综合性刊物、专业刊物和图书。在设计原则上,讲求通用性、描述性、实用性和抽样的科学性。在语料分类方面,以“门类为主,语体为辅”为原则制定三个大类:

第一类:人文与社会科学类(包括8个次类、30个细类)

1.政法类:哲学政治宗教法律

2.历史类:历史考古民族

3.社会类:社会学心理语言文字教育文艺理论新闻民俗

4.经济类:工业经济农业经济政治经济财贸经济

5.艺术类:音乐美术舞蹈戏剧

6.文学类:小说散文传记报告文学科幻口语

7.军体类:军事体育

8.生活类

第二类:自然科学类(包括6个次类)

1.数理类

2.生化类

3.天文地理类

4.海洋气象类

5.农林类

6.医药卫生类

第三类:综合类(包括6个次类,30多个细类)

1.行政公文类:请示报告批复命令指示布告纪要通知等

2.章程法规类:章程条例细则制度公约办法法律条文等

3.司法文书类:诉讼辩护词控告信委托书等

4.商业文告类:说明广告调查报告经济合同等

5.礼仪辞令类:欢迎词贺电讣告唁电慰问信祝酒词等

6.实用文书类:请假条检讨申请书请愿书等 在不同类别、不同来源、不同时期的语言材料中,按照不等密度的思路确定合适的语料选取比例,从共时和历时两个角度保证入选语料的平衡性,是这个语料库的特点。譬如,在语言材料的年限方面,选材比例是:

1919年– 1925年

5%

1926年– 1949年

15%

1950年– 1965年

25%

1966年– 1976年

5%

1977年以后

50%

在语言材料的门类、语体和来源方面,选材比例是:

人文与社会科学类占59.6%。其中各个次类在本大类中的比例是:

政法

12.7%

历史

8.4%

社会

14.0%

经济

9.8%

艺术

6.7%

文学

44.9%

军体

2.3%

生活

1.4%

自然科学类占17.24%。其中各个次类在本大类中的比例是:

数理

17.2%

生化

19.1%

天文地理

14.1%

海洋气象

9.1%

农林

22.8%

医药卫生

17.7%

综合类占9.36%。其中各个次类在本大类中的比例是:

各类应用文

91.1%

其他

8.9%

报纸类占13.79%。其中各个次类在本大类中的比例是:

全国性报刊

25%

省市报刊

75%

这个语料库在选材过程中收集和记录语料的有关描述信息,为每个语料样本设立了20个描述项目:总号、分类号、样本名称、类别、作者、写作时间、书刊名称、编著者、出版者、出版日期、期号(版面号)、版次(初版日期)、印册数、总页数、开本、选样方式、样本起止页数、样本字数、样本总数、繁简字。用户可以利用这些语料描述标记根据各自的需要进行各种方式的检索。语料库的建库工作分为两步,第一步先建立核心语料库(由7000万字的语料中筛选出2000万字语料组成)。到90年代末,完成了2000万字生语料的收录工作。从2001年开始,对2000万字核心语料进行分词和词性标注加工。

(二)《人民日报》标注语料库

《人民日报》标注语料库由北京大学计算语言学研究所和日本富士通公司合作,从1999年开始,到2002年完成,原始语料取自1998年全年的《人民日报》,共约2700万字,到2003年又扩充到3500万字,是我国第一个大型的现代汉语标注语料库。这个语料库加工的项目有词语切分和词性标注,还有专有名词(人名、地名、团体机构名称等)标注、语素子类标注、动词、形容词的特殊用法标注和短语型标注。下面是一段语料标注的示例,对于1998年1月1日第5版第1篇文章的第11段:

我国的国有企业改革见成效。位于河南的中国一拖集团有限责任公司面向市场,积极调整产品结构,加快技术改造和新产品研制步伐。图为东方红牌履带拖拉机生产线。(赵鹏摄)

标注后的形式是:

19980101-05-001-011/m 我国/n 的/u 国有/vn企业/n 改革/v 见/v 成效/n。/w 位于/v 河南/ns 的/u [中国/ns 一拖/j 集团/n 有限/a 责任/n 公司/n]nt面向/v 市场/n,/w 积极/ad 调整/v 产品/n 结构/n,/w 加快/v 技术/n 改造/vn和/c 新/a 产品/n 研制/vn步伐/n。/w 图/n 为/v 东方红牌/nz履带/n 拖拉机/n 生产线/n。/w(/w 赵/nr 鹏/nr 摄/Vg)/w

在每一个切分出来的词和标点符号后面,是该词语的标记。譬如词性标记(n,v,a,u,m,w等),专有名词标记(nr,ns,nz等),语素子类标记(Vg等),动词和形容词特殊用法标记(vn,ad)。所有的标记都是以北京大学的《现代汉语语法信息词典》为基础词库,在一个加工规范的指导下标注的。

利用《人民日报》标注语料库,人们可以从各个角度考察和分析语言事实,统计各种语言单位出现的频率,譬如,词语或词类的分布、搭配和共现,专有名词的结构方式、兼类词在句子中的表现,语素字的使用情况,等等。也可以从语料里提取各种语言单位或语句片段作为研究实例。与仅仅以汉字串的形式表示的“生语料”相比,经过标注的“熟语料”显然含有更多的语言学特征信息,对汉语词汇研究、语法研究和汉语信息处理系统来说是更好的语言知识资源。

《人民日报》标注语料库中一半的语料(1998年上半年)共1300万字已经通过《人民日报》新闻信息中心公开提供许可使用权。其中一个月的语料(1998年1月)近200万字在互联网上公布,供自由下载。

(三)用于语言教学和研究的现代汉语语料库

建立现代汉语语料库的主要目的之一是对外汉语教学和现代汉语研究,可以分为书面语语料库和以文本形式表示的口语语料库两类。前者如北京语言大学的汉语中介语语料库、现代汉语研究语料库,后者如中国社会科学院语言研究所的北京地区现场即席话语语料库。

汉语中介语语料库的建设目标是为对外汉语教学、中介语研究、偏误分析和汉语本体研究提供资源,因此它的语料来源很有对外汉语教学的特点。作者先在北京和其他省市的9 所高等院校里,从来自96个国家和地区的1635位外国留学生那里收集了成篇成段的汉语作文或练习材料5774篇,共3528988字。再从中抽取了 740人的1731篇语料,共有44218句,1041274字。全部语料都记录了学生姓名、性别、年龄、国别、是否华裔、第一语言、文化程度、所学主要教材、语料类别、写作时间、提供者等23项属性。然后对这104万字的语料进行词语切分、词性标注以及一些专用的语言学特征标注。例如,标出了字、词、句、篇等不同的层次,对语料的非规范形式(例如:错字、别字、繁体字、拼音字、非规范词等)做出索引标记,记录其对应的规范形式。这个语料库的管理系统有语篇属性登录、文本过滤、文字预处理信息登录、语料抽样、断句、分词、词性辅助标注、自动标注以及语料的主题检索、全文检索和数据浏览等各种功能,分别处理语料库的建立、管理和维护,以及用户浏览、查询和检索等。与人工收集的学生病句卡片资料相比,中介语语料库能够更好地反映学生学习汉语的情况,帮助教师更加全面地观察他们的学习过程,了解影响学习和习得的各种因素。在汉语作为第二语言的教学中,为教材编写、课堂教学、测试等环节提供依据。

现代汉语研究语料库的建设目标是为语言学家提供一个研究平台,由2000万字的粗语料库和200万字经过分词和词性标注的精语料库两个部分组成。粗语料库收录的语料样本中绝大部分是九十年代的出版物,有《人民日报》1000万字,《中国新闻》500万字,各种书籍250万字,文学作品150万字,准口语材料(书面形式的对话、独白)100万字。精语料库的200万字语料样本是从粗语料库中按照规定的比例由计算机随机抽取的,有书面语语料160万字,准口语语料40万字,是从语体、题材、体裁三个方面均衡选取的平衡语料库。为了对这些语料进行词语切分和词性标注,作者制定了词语切分的细则和词性标记体系的原则,采用了一个含有112个词类标记的标记集,确定了兼类词的处理方法。这个语料库的管理系统具有建库、检索、浏览、统计、输出等功能,可以按词或词类检索,统计出词的频率、词类频率、词类共现频率、平均词长、平均句长等结果。这个语料库建成以后,很快应用在现代汉语语法、汉语教学和汉语信息处理的研究中,研究内容涉及现代汉语的插入语、汉语句子的主题-主语标注、V+N序列实验分析、词性标注中词语归类问题、动宾组合的自动获取与标注,等等。

建设北京地区现场即席话语语料库的目的是,通过收集大量的现场即席话语语料研究现场即席话语的各种动态机制,以揭示现场即席话语的使用规律。这个语料库的研究策略和取样方法很有特点,首先是严格区分资源库和语料库,资源库收集符合现场即席话语定义的录音材料,语料库收录按照一定标准从资源库提取出来的材料;另外在语料采样前先做摸底性研究,通过研究对现场即席话语的真实情况有所了解,确定取样域,再定取样范畴,然后根据取样范畴去录现场典型材料,这是一种层次范畴化的取样方法。这个语料库目前正在建设之中,已经取得了近600小时的录音材料和50多小时的录象材料。

在用于汉语研究的语料库中,讲究选材均衡,注重语料加工,同时也提供公开服务的,当数台湾中央研究院历史语言研究所的现代汉语平衡语料库(简称Sinica Corpus)。这个语料库的规模为500万个词,每个句子都依词断开,标示词类标记,并且配备了检索系统,在网上开放供大家使用。根据自己制定的一套汉语文本属性特征为语料分类,在不同的类别上尽量均衡地采集语料,是这个语料库的特点之一。文本属性用来说明文档的呈现方式、文章的写作方式、文章写作的内容和文档的来源出处,包括7类,每类下设若干小类:

文类(文档的呈现方式)

报导、评论、广告图文、信函、公告启事、小说故事寓言、散文、传记日记、诗歌、语录、说明手册、剧本、会话、演讲、会议记录 文体(文章的写作方式)

记叙、论说、说明、描写

语式(文档的呈现方式)

书面语、演讲稿、剧本/台辞、口语谈话、会议记录

主题(文章写作的内容)

哲学、科学、社会、艺术、生活、文学

媒体报纸、一般杂志、学术期刊、教科书、工具书、学术论著、一般图书、书信、视听媒体、其它

作者姓名、性别、国籍、母语

出版出版单位、出版地、出版日期、版次

不同研究目的的语言学者可以自己按语式、文体、媒体和主题的小类选取不同类别的语料,组成“自订语料库”,在“自订语料库”的范围内进行语料的检索和统计。除了通常的按词语、词类的检索和统计以外,这个语料库的管理系统还提供了一种“进阶处理”功能,对检索出来的数据作进一步处理,对处理的结果还可以再次处理,形成多层的检索结果。

(四)面向语言信息处理的现代汉语语料库

90年代中后期,面向语言信息处理的现代汉语语料库开始建立并投入应用。其中最早开发的是清华大学用于研究和开发汉语自动分词技术的现代汉语语料库,经过几年的积累已达到8亿多字生语料。在这个语料库的支持下,用统计语言模型的方法研究了汉语自动分词中的理论、算法和技术,编制了总数为9万多个词语的《信息处理用现代汉语分词词表》。这些研究工作体现了我国汉语自动分词技术的发展水平,词表被许多汉语自动分词系统作为底表使用,是不可缺少的基础资源。

TH通用语料库系统是清华大学建立的另一个现代汉语语料库。这个语料库有两个特点,一是语料库管理系统根据不同的加工深度,分四个等级管理语料。第一级是生语料分库,有4千余万字;第二级以上都是加工程度不同的熟语料库,其中第二级存放经过自动分词并由人工校对过的初加工语料500余万字;第三级存放经过词性标注和人工校对的语料约300万字;第四级是经过句子成分标注和人工校对的语料。每个分库又按语料的来源分成一般书籍、报纸、杂志、论文和工具书五类子库。不同等级的语料可以为不同的应用目标服务。第二个特点是在这个语料库的支持下,进行了汉语信息处理技术的研究。譬如,采用以谓语为中心的句型成分分析与语料统计相结合的方法,自动分析汉语的句型,提出了一个“汉语句型频度表”;在汉语文本中自动标注句子成分和句型成分的边界;根据指定的句型在语料库里搜寻句子实例,等等。

HuaYu人工标注语料库是清华大学和北京语言大学合作建立的一个现代汉语平衡语料库。这个语料库按文学、新闻、学术、应用文四个大类收录了200余万字语料。它的特点是讲究加工的深度,除了词语切分和词性标注以外,还根据语句中动词的类型和句子的长度进行“语块”标注和“句法树”标注,目的是为建立汉语短语分析或句法分析的语言模型获取统计数据提供资源。下面分别是语块标注和句法树标注的示例。

对句子“自古以来,人类就重视档案的保存和利用,设置馆库、选派专人进行管理。”进行语块标注以后得到的是一个无嵌套的线性序列,其中S是主语语块,P是述语语块,O是宾语语块:

[D 自/p 古/t 以来/f,/, [S 人类/n [D 就/d [P 重视/v [O 档案/n 的/u 保存/vN和/c 利用/vN,/, [P 设置/v [O 馆库/n、/、[P 选派/v [O 专人/n [P 进行/v [O 管理v。

对句子“我哥哥送给我一本很漂亮的书。”进行句法树标注以后,得到的是一个与树形结构等价的线性序列:

[ zj-XX [ dj-ZW [ np-DZ我/ rN哥哥/n ] [ vp-PO [ vp-PO [ vp-SB送/v 给/v ] 我/rN ] [ np-DZ [ mp-DZ 一/m 本/qN ] [ np-DZ [ ap-ZZ很/d 漂亮/a ] 的/u 书/n ] ] ] ]。/w ]

(五)用于开发特定语言分析技术的专用语料库

这类语料库是针对汉语信息处理技术的需要专门建立的。例如山西大学的专有名词标注语料库和分词与词性标注语料库。

分词与词性标注语料库,规模为500万字,带有分词标记、词性标记和句法标记。标注时依据《信息处理用现代汉语分词规范》和《信息处理用现代汉语词类及标记集规范》。在这个语料库的支持下,开发汉语自动分词和词性标注软件,研究自动分词和词性标注的评测技术。为了解决汉语自动分词中的切分歧义问题,还建立了交集型歧义字段库和组合型歧义字段库,专门收集这两种类型的歧义切分实例。前者有7.8万字,后者收录了140多条。并且在分词和词性标注语料库里作了这两类切分歧义的标注。利用这些语料调查交集型歧义当中的“伪歧义”现象(既切分结果只可能有唯一选择的那些交集型歧义切分字段),发现这种现象在歧义切分字段中很普遍,可以达到90%以上。

专有名词标注语料库用于研究汉语自动分词中专有名词的识别算法。其中包括标注了中国地名的语料280万字,标注了中国人姓名的语料300万字,标注了西文姓名的语料250万字,标注了汉语机构名称的语料50万字,还有标注了网络新词语的语料150万字。利用这些语料,建立了中国地名用字、用词库,姓氏人名库,姓氏用字频率表,名字用字频率表等,用统计语言模型的方法识别专有名词。

(六)双语语料库

基于实例的机器翻译(Example-based)需要大规模的双语平行语料库来支持。语料库里的源语和目标语实例要按照相同级别的翻译单位一一对齐。目前已有的双语平行语料库主要是汉语和英语的,语料对齐的单位有句子级的、子句级的、短语级的,也有词汇级的。机器翻译系统把要翻译的句子与语料库里的源语实例进行对比,分析相似程度,找到最适合的源语实例,再参照与它对齐的目标语实例生成译文。用于这类机器翻译系统的双语语料库必须有一定的规模,用人工做语料对齐的工作显然很难满足要求。这就使文本自动对齐成为建立双语语料库的关键技术。

在目前已有的双语语料库中,哈尔滨工业大学的汉英平行语料库已经直接用来开发英汉双向机器翻译系统。这个语料库有6万个汉语和英语的句子,使用多级对齐加工技术,分别按照句子、短语结构和词一一对齐。中国科学院计算技术研究所的汉英双语语料库有20万个句对,也完成了句子一级的对齐,并在网上提供查询服务。北京大学、中国科学院软件研究所等单位也建立了按句对齐的汉英双语语料库。除此之外,还有以语段或短语为单位收集的汉英双语语料库,譬如中国科学院自动化研究所的汉英双语短语库,有3~5万对已对齐的汉语和英语短语。东北大学的英汉双语语段库,用来帮助建立电子版的英汉搭配词典。

(七)面向汉语史研究的语料库

面向汉语史研究的语料库建设是从搜集汉语史文献资料开始的。台湾中央研究院历史语言研究所从90年代初期就开始了这项工作,他们先收集上古汉语的语料,然后扩展到中古汉语和近代汉语。90年代中后期逐步开始上古汉语语料和近代汉语的标注,在该院信息研究所和计算中心的协助下进行标注技术和检索技术的开发。根据是否经过分词处理和词性标注,台湾中央研究院的古汉语语料库和近代汉语语料库可以分成两类:生语料库和标记语料库。目前生语料库收集的语料已涵盖上古汉语(先秦至西汉)、中古汉语(东汉魏晋南北朝)、近代汉语(唐五代以后)的大部分重要文献资料,并己陆续开放使用。在标记语料库方面,上古汉语及近代汉语都已有部分语料完成标注工作,也逐步提供网上检索。2001年底,开放了近代汉语标记语料库WWW版供各界使用,首先提供查询的文献是《红楼梦》及《三遂平妖传》。在查询方面,除了常用的功能以外,还可以在显示词项及词类的同时给出例句的出处,便于历史语法的研究者使用。

多年来中国社会科学院语言研究所也一直在致力于文献资料的建设,搜集整理了近代汉语书面语语料150万字,中古近代汉语语料约1千万字,部分语料已作了标注。目前已经完成了一个小型语料库,包括:敦煌变文集、祖堂集、三朝北盟汇编、碧岩录、朱子语类、刘知远诸宫调、西厢记诸宫调、元刊全相平话五种、元典章刑部、老乞大谚解、朴通事谚解、孝经直解、鲁斋遗书、经筵讲义等十余种文献,成为汉语史和语言学理论研究的重要资源。此外,语言研究所的先秦专书电子文档有4部文献,共约120万字,并且已由古汉语学者逐篇逐句标注了语法信息。

上海师范大学、浙江师范大学、四川大学等学校也依据各自汉语史研究的方向,建立了历史文献语料库。四川大学的中古汉语语料库有1亿字的中古汉语语料和有关中古汉语研究的资料。浙江师范大学的楚辞语库、前四史语库、六朝语库、太平广记语库、唐诗语库、宋词语库,已用于“前四史”语言研究和唐宋诗词语词研究。

目前历史文献语料库建设的特点是依托学科建设和研究方向,广泛收集资料,注重校勘精审。随着汉语史研究和语料库应用的发展,资源共享和语料加工将得到越来越多的重视。历史文献资源共享,首先要避免语料的重复收集,还要采用国际通用的标准处理语料文本,使语料能够准确、方便地交换和使用。语料加工则是充分发掘语料应用价值的基础工作,从收集历史文献的电子文档,到建成一个具有必要的语言学标记信息、合理的逻辑结构和方便的检索功能的语料库,语料的加工是不可或缺的一步。

(八)比较语料库

为了研究汉语在不同地区的使用情况,香港城市大学建立了LIVAC共时语料库(Linguistic Variation in Chinese Speech Communities)。语料来自香港、台湾、北京、上海、澳门及新加坡六地有代表性的中文报纸,以及电子媒介上的新闻报道。自1995年7月开始,每四天一次,收集这六个地区的对等书面语文本,每次约两万字。内容包括新闻、特写、评论等文章。到2003年上半年,已收集了1亿1千多万字、超过56万个词条。计划收集到2005年6月,囊括新旧世纪交接点前后各五年各地华语社区有代表性的重要语言数据,供汉语的各种共时比较研究使用。

在语料的组织和加工方面,这个语料库用计算机自动分词,再经人工校对分类,可以依字、词、句为基础进行检索,提供字、词配搭、分布等数据,有统计功能。语言学家能通过这个语料库考察上述六地出现的新词、词义有所发展或转移的旧词、以及有地方特色的词语,还可以对具体字或词的频率作统计比较,对字词的差别作计量分析。对研究华人社区的文化、社会、语言差异也有作用。这个语料库的一部分已经在网上提供服务。

(九)少数民族语言语料库

新疆大学从2002年起开始建设现代维吾尔语语料库系统,计划包括5个部分:语料库、电子语法信息词典、规则库、统计信息库和检索统计软件包。其中语料库部分又分成生语料库(经初步整理的原始语料)和加工语料库(经过标注和校对的语料)。目前已有生语料800万词。另外,新疆大学也正在以新闻领域的维汉-汉维机器翻译为目标,建设双语平行语料库。内蒙古大学的中世纪蒙古文语料库收集了《元朝秘史》、《黄金史》、《回鹘蒙古文文献集》等历史文献。他们还建立了500万词的现代蒙古语语料库,研究了蒙古文附加成分的自动切分、复合词的自动识别和语料的词性标注,获得了词频统计、音节统计、词类统计、附加成分统计等数据。西北民族大学建立了1亿3千万字节的大型藏文语料库,用于藏文词汇频度和通用度的统计。中国社会科学院民族学与人类学研究所建立了500万藏语字符的藏语语料库,进行词语切分和标注的研究。新疆师范大学也建立了200万词的维吾尔语语料库。

与汉语语料库相比,少数民族语料库的建设还需要解决一些特殊的问题,譬如拼音文字转写的标准和规范,词语分类体系及其标记集等。

到2003年,已建和在建的各种文本语料库还有很多(包括书面语语料库和以文本形式表示的口语语料库),以上提到的只是有代表性的一部分。与文本语料库相对的,是语音语料库。语音语料库不仅记录语图、声学参数等语音学数据,还有句法、韵律等各种语言学信息标记和副语言学信息标记,可以在语音识别与合成系统中用来建立语音模型,用于语音研究、语音工程开发和汉语普通话教学等领域。语音技术是当前信息技术和通讯领域里最具潜力的发展方向之一,语音语料库在科研和工程上有很高的使用价值。关于语音语料库的详细情况,请见“语音学和言语工程研究综述”。

下载基于语料库的中国文化负载词汇英译研究word格式文档
下载基于语料库的中国文化负载词汇英译研究.doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    中国文化特色词语英译3

    中国文化特色词语英译 (一)宗教及传统文化 拜年: pay a New Year call 财运: luck in making money 江南水乡: the south of the lower reaches of the Yangtze River 禅宗: C......

    中国文化相关词汇英文翻译

    中国文化相关词汇英文翻译 1. 元宵节 Lantern Festival 2. 刺绣embroidery 3. 重阳节Double-Ninth Festival 4. 清明节Tomb sweeping day 5. 剪纸Paper Cutting 6. 书法C......

    中国文化相关词汇英文翻译5篇

    中国文化相关词汇英文翻译 元宵节:Lantern Festival 刺绣:embroidery 重阳节:Double-Ninth Festival 清明节:Tomb sweeping day 剪纸:Paper Cutting 书法:Calligraphy 对联:(Spring......

    目的论视角下旅游文本中文化负载词的英译[模版]

    最新英语专业全英原创毕业论文,都是近期写作 1 浅析中式菜名的英译 2 析《远大前程》主人公匹普的性格成长历程 3 称呼语的语用分析 — 个案分析:以《傲慢与偏见》中的称呼语......

    中国古诗英译研究

    哈 尔 滨 师 范 大 学 成人高等教育本科毕业论文 论文题目 从文化差异角度 看古诗英译中意象的传译 论文作者:刘真真 学 号 :2008025713 作者单位:哈师大教育学系2班 指导教师......

    浅论《道德经》的英译及其对中国文化的传播作用

    内容摘要:浅论《道德经》的英译及其对中国文化的传播作用 潘邻卉 高洁 成都信息工程大学银杏酒店管理学院 摘要:《道德经》是中国传统文化的精髓,了解《道德经》即是了解中国文......

    政府工作报告特点及英译策略研究

    政府工作报告特点及英译策略研究 摘要:政府工作报告是一个国家对过去的总结和未来的展望,是政府向人民述职的一种特殊而又重要的形式。本文选取近几届国务院《政府工作报告》......

    中国菜名的英译研究

    最新英语专业全英原创毕业论文,都是近期写作 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42......