第一篇:论语言科学与语言技术
论语言科学与语言技术
一、“语言科技”新思维的提出
虽然计算机设计的初衷是缘于数值计算,但是英国数学家图灵(a.m.turing)在《机器能思维吗?》(1950)一文中已经预见到计算机和自然语言将结下不解之缘,并且提出检验计算机智能的最好方法就是对语言信息的处理能力。1977年,费根鲍姆(feigeaum)提出知识
工程,计算机信息处理出现了从“数据世界”向“知识世界”的转移趋势。知识世界的载体是语言符号系统,语言信息处理的需求促使语言研究过程和语言研究成果的技术化趋势日益明显,当代语言学已凸显出“语言科学”与“语言技术”的二分互补格局,由此我在《南京师范大学语言科技系建设发展规划》(2001年2月)中提出“语言科技”的新思维。“语言科学”主要指基础性的描写语言学和理论语言学。“语言技术”主要指面向信息处理的应用语言学或计算语言学,其研究任务可划分为“文本处理技术”和“语言模拟技术”。简而言之,语言文本处理技术是通过编辑和编程,将印刷文本转化为可供计算机使用的电子文本的技术。语言系统模拟(simulation)或者语言能力仿真(emulation)技术是通过算法和编程,将自然语言的理解和生成能力输入计算机的技术。获得语言能力的计算机可以实现“人—机对话”而成为名实相符的“电脑”。为研制智能机服务的“语言系统模拟”,可比喻为“语言基因图谱分析工程”和“语言能力移植工程”。强调语言研究的技术化,并非忽视传统语言学研究存在技术性的一面,例如实验语音学和方言语音调查等。之所以以往未能突出语言研究的技术化,其原因在于——除语音研究可借助声学技术设备以外——语言研究的绝大多数领域还一直没有相应的实验性技术设备。
虽然当代语言学家不可能也不必要都转向计算语言学研究,但具有一定的语言信息处理意识却非常必要。早在1964年11月,美国科学院语言自动处理咨询委员会就在《语言与机器》的报告中明确指出:机器翻译遇到了难以克服的semanticbarrier(义障)。然而这一警告,除了致使机器翻译研究热的暂时消退以外,并没有引起语言学界的足够重视。1982年,日本制订了一个为期10年面向ai(人工智能)的“第五代计算机”即智能机的研制计划,其中包括自然语言处理装置。1992年结束时,只部分达到了预定目标。随后又公布了另一个为期10年的“真实世界计算机(rwc)计划”即“新信息处理技术计划”。(许万增1996,p.61-62)据说,90年代后期日本不得不宣布暂停研制,其根本原因就在于未能穿过语言研究的“瓶颈”。自然语言处理装置的任务无法实现,计算机谈何“真实世界”或“人工智能”。时至今日,这一“义障”仍然没有跨越。在《新世纪将对人类产生重大影响的十大科技趋势》(新华社北京2000年12月30日电)的报道中,列出21世纪的“认知神经科学领域”和“信息技术领域”,并分别提出来“探索意识、思维活动的本质”和“计算机向智能化方向发展”的任务,然而没有语言科技领域的合作——关键是认知语义结构网络研究的根本性突破——则不可能实现。
无论从手段还是就目标,对准自然语言处理的当代语言学研究,其性质都应界定为“语言科技”。“语言科技”的内涵是以理论研究为指导,以描写研究为基础,以应用研究为枢纽,促使语言研究向计算机应用、数学、认知科学和现代教育技术领域延伸,沟通文理工相关学科以实现语言研究过程及其成果的技术化;“语言科技”的外延表现为语言工程科技、语言教育科技和语言研究科技。语言学和计算机科学等学科相结合的“语言工程科技”,研究领域是“人—机对话”,其目标主要是自然语言能力的模拟。语言学与现代教育技术相结合的“语言教育科技”,研究领域是“人—人对话”,其主要目标是实现语言教育的多媒体和网络化。“语言研究科技”是将语言研究活动与计算机工具相结合,其主要目标是实现语言学自身的计算机化,包括语料库、词库和句库的研制,语言研究的分析性、统计性、比较性和实验性软件的开发等。这一新思维既突出了当代科技发展所要求的“语言学的技术化”,又体现了以语言学为本而沟通文理工相关学科的研究旨趣。
二、计算语言学的界定要突出技术性
20世纪50年代以后,在理论方法交叉渗透而形成诸多边缘语言学的同时,语言学与计算机结合的趋势开始出现。1954年,在美国乔治敦大学所进行的世界上首次机器翻译试验,标志着计算机科学与语言学的结合已经起步。在这一研究领域,立足于不同的学科视角或知识结构,先后出现了一系列名称术语,如“语言工程”、“语言工程学”、“自然语言的计算机处理”(工科视角)、“语言信息处理”(信息学视角)、“数理语言学”(数学视角)等等。20世纪60年代以后,计算机和语言学的结合逐步深入到语言学的各个领域,形成了包括计算语音学、计算词汇学、计算语法学、计算语义学等分支学科在内的计算语言学(computationallinguistics)。其中“计算语音学”等名词,虽然计算语言学界没人提过,因为已经存在着“言语识别”、“言语合成”等计算机应用专业术语,但是从“语言工程学”到“计算语言学”的术语演变中,透露出“语言学立场”在这门交叉学科中的日益强化。虽然目前的计算机运算速度已经
可以满足语言信息处理的技术要求,但是之所以“人—机对话”尚未实现,其“瓶颈”就在于现有的语言研究成果无法满足计算机处理的要求。归根结底,语言信息处理的最终目标就是“计算机模拟语言能力工程”或“语言能力移植计算机工程”。探索语言能力的性质和描写语言系统的结构,这些艰巨性工作还得由语言学家先来完成。语言信息处理或计算语言学务必以语言学为本而以计算机为用。语言学家必须具备“数字化”意识,了解计算机需要怎样的语言描写成果,然后才可能将研究目标对准语言工程。
迄今为止,正如许多发展中学科一样,“计算语言学”的定义尚无一致认定,归纳起来盖有四种观点(侯敏1999,p.2—p.6):
第一种,计算语言学是以计算机为工具研究语言学。侯敏认为,任何一个学科在使用工具方面都是自由的,使用不同工具研究一个学科会带来不同特点,但不因为使用了新工具就产生了新学科。虽然并不排除新工具的使用没有导致新学科的产生,但同样不能否认工具的变革有可能带来学科体系的革命,以致于产生新的分支或交叉学科。现代自然科学之所以能够建立,无疑得益于望远镜和显微镜的应用,前者打开了人类认知的宏观世界之门,后者打开了人类认知的微观世界之门。望远镜和显微镜带来的不仅仅是“这一个工具”,而是人类认知方式的巨大变革,从而引起了天文学、生物学等自然科学的一系列革命,产生了一系列新学科。因此,问题在于如何使用新的工具或新认知方式。如果仅仅利用计算机做语言研究的统计工具,也许不会产生新的分支学科,但是利用计算机作为语音分析和合成的工具,则形成了计算语音学。
第二种,计算语言学是把语言学成果应用于计算机。侯敏认为,计算机的应用领域几乎没有限度,什么学科的成果都可以在计算机上应用,因此在计算机上应用语言学的研究成果不足以建立新学科。问题不在于在什么学科的成果能在计算机上应用,而在于在计算机上所应用的成果的性质。与其他学科研究对象的性质迥然不同,语言学科的研究对象——语言——是人类最重要的认知符号系统和知识载体,因此面向信息处理的语言成果应用于计算机足以建立新的学科。以往的语言学研究是面向人际交流,而计算语言学研究是面向人机交流,两者具有截然不同的性质。好范文版权所有
第三种,计算语言学是研究语言中的可计算问题。侯敏认为,虽然利用可计算理论研究语言符号是建立了一个新学科,但是这种说法偏于保守,没有把计算语言学推进语言学发展的作用充分体现出来。问题在于面向信息处理的计算语言学研究,其显著特点就是语言的可计算性。“推进语言学发展的作用”这不是计算语言学的定义,强调“研究语言中的可计算问题”未必保守,反而突出了计算语言学的显著特点。
第四种,计算语言学是建立基于计算机科学理论的语言学理论。侯敏认为,把计算机科学的基本思想和方法引进语言学领域,不但可以产生许多应用性课题,而且能够促使研究者从新的角度观察语言学,建立与传统语言学不同的理论。因此计算语言学是一种基于计算机科学理论所建立的语言学理论。问题在于:一方面计算语言学需要理论但本质上不是一门理论科学,同时并非所有的计算语言学家都乐意或适合从事理论研究,另一方面计算语言学的应用性质决定了研究成果的技术性特征,而绝大多数人可能更适合于——实际上也更需要——语言信息处理的技术性研究。
第一种和第二种是欧洲流行的广义定义,主张计算语言学是计算机和语言学的交叉,第三种和第四种是盛行于美国的狭义定义,主张计算语言学是计算机科学和语言学的交叉。也就是说,前者仅仅把计算机当成语言学研究中的一种新工具应用,而后者强调计算机学科的要求和理论对语言学的影响。陈小荷(2001)认为,计算语言学就是以计算机为手段来研究自然语言,较严格的定义是“通过建立形式化的计算模型来处理自然语言的一门科学”。要建立形式化的计算模型来处理自然语言,首先要完成适合于计算机使用的自然语言系统的描写。这一面向“人—机对话”的机用语言系统,与以往面向“人—人对话”的日常语法系统不同。因此机用语言系统的描写应当纳入计算语言学的研究范围,即完成了“机用语言系统”以后,才能“建立形式化的计算模型”使计算机获得自然语言能力。综上所论,计算语言学可以定义为——利用计算机作为工具研究语言、研究机用自然语言系统、研究语言系统或语言能力的计算性,同时建构基于计算机应用、数学模型、认知科学等相关学科基础之上的语言理论的新学科。姑且图示如下:
工具性:利用计算机研究语言
计算语言学描写性:研究机用自然语言系统
技术性:研究语言系统的计算性
理论性:建构新的语言学理论
虽然计算语言学的关键任务是研究人机之间的语言交际问题,即“如何教计算机学会说话”。但是从本质上来说,研究语言系统或语言能力的可计算性和利用计算机工具来研究语言是相通的,只是前者探索的是适合于人-机对话的语言能力,而后者讨论的是适合于人-人对话的语言规则。
依据目前的语言研究成果和信息处理技术路线,计算语言学包括应用基础研究、应用研究和理论研究三个方面。(陈小荷2001)应用基础研究指语言处理的基本技术研究。现阶段的主要进展是:1.自动分词技术:这是计算机理解自然语言的第一步。目前汉语书面语自动分词的正确率达到95以上。2.词语特征标注技术:现阶段的词语特征包括词性和义项,这是句法结构理解的基础。两种标注可采用相似的计算模型但后者要复杂得多,目前尚无大规模的实验结果报道。3.语句分析技术:句法结构和语义结构是自然语言理解的关键技术,目前分析真实文本句子的正确率仅在40左右。4.语料库建设技术:语料库是为特定目的而收集的言语作品集,包括语料处理和检索。研究语句分析需要存放句法分析树的“树库”,但目前的汉语语料库加工程度较低,所建立的树库很少且规模不大。5.语言知识库建设技术:语言知识包括词汇知识、语法知识和语义知识等,事实性和规则性知识分别放在机读词典和规则库中。语句分析技术之所以不能取得突破,主要原因就是目前尚无适合于中文信息处理的大规模语言知识库。
应用研究指自然语言处理的应用工具的研制。现阶段的热点主要有:1.机器翻译工具:半个多世纪过去了,机器翻译的质量仍然令人失望。现在通行的是有限范围翻译和机器辅助翻译。2.自动文摘工具:微软公司的词处理器word有用于英语的文摘功能,哈工大研制的hit-863i型中文自动文摘系统可按用户设定的比例压缩原文。3.自动校对工具:现在存在的主要问题是误报率过高,并且深层错误难以发现。4.信息检索工具:有主题词检索、全文检索两种。前者需要预先有一个主题词表;后者任意字符串都可成为检索对象。另外从语料库中自动获取各种知识的“信息抽取”在线工具的研究刚刚兴起。5.言语识别和言语合成工具:言语识别(或语音识别)可分为词语识别(计算机口语命令)、有限词汇识别(电话订票)和无限词汇识别(将成段说话转为文字)。言语合成(或语音合成)指用计算机将书面语转换为口语即“文语转换”,存在的问题主要是断词不当且语调刻板,仿真度亟待提高。
然而,如果以为应用性特征明显的计算语言学仅仅是技术,则未免失之于偏颇。计算语言学有着相应的理论研究,大致包括人工智能理论(含计算模型理论。目前的人工智能研究,主要还是集中在人工体能、人工技能。在语言能力移植电脑过程未取得实质性进展以前,还谈不上真正的人工智能)和语言学理论两个方面。例如计算机如何或是否可以模拟人脑和语言能力,如何寻找合适的语言计算模型等,就是计算语言学家特别关心的理论问题。除此之外,还有对自然语言本质属性的重新认定、面向信息处理的机用语法学理论、语言系统与数学模型的关系、语言结构和数理逻辑的关系、语言符号的数字化可能性及其局限性、语言的异质性和受限性或语域理论、元语言理论和研究方法等一系列问题。总体而言,一方面,由于牵涉的学科太多,计算语言学的理论研究还相当薄弱,另一方面,与科技发展息息相关的计算语言学不容过多地沉醉于理论探索。计算语言学的强大发展动力植根于鲜明的应用性,必须通过实践推动理论探索。
三、语言系统的计算机模式化要求
从语言学家的立场出发,语言系统的计算机模式化要求,就是要了解计算机需要怎样的语言描写成果,传统语言学(此处指非面向语言信息处理的语言学)的研究是经验描写解释型,而计算语言学的研究是实验操作技术型,自然语言系统要能进行操作技术化处理,首先必须实现语言的计算机模式化。冯志伟(1999,p.215)认为自然语言处理一般应经过三个过程:1.形式化,将所研究的自然语言问题以一定的数学形式表示出来;2.算法化,把自然语言的数学形式转换为算法形式;3.程序化,根据自然语言的算法形式编写计算机程序。侯敏(1999,p.30)认为语言系统的形式化或计算机模式化必须满足三个要求:1.高度抽象化,即从语言现象中抽象出一般规则;2.元语言的形式化,即采取形式逻辑、数学公式、程序语言等形式语言作为元语言;3.运用过程的严密化,即运用过程必须具有数学与逻辑的严密性。
袁毓林(1993)认为形式语言至少具有三个特点:基本单元的明确性、基本运算和基本关系的明确性、运算优先级别的明确性,但是自然语言在这三方面皆不明确。具体而言,1.语法范畴的边界不明,例如语素、词和词组之间、词类之间的界限不明;2.结构关系难以定义,通常所说的结构关系,如主谓、动宾等往往很难明确界定;3.层次关系不外显,人们通常根据语感和语境等来识别结构层次。侯敏(1999,p.36—40)不赞同这种分析,针锋相对地提出:1.可以根据实际需要或应用目的来确立词项或划分词类;2.结构关系分析需要深入到语义平面;3.形式语法已经给出了体现层次的结构树,在分析歧义结构中可加入语义限制,至于有些连人都解决不了的层次歧义结构也不必要求计算机解决。侯敏的观点是“理论追求的是完美,工程追求的是适用”,避开理论困难而采取工程方法,可以建立一个语言分析的近似模型。
所谓“语法范畴的边界不明”,主要是因为这些“范畴”的设置从某种程度上肢解了语言事实;所谓“结构关系难以定义”,主要是因为这些“结构”难以反映语言的本质结构;而所谓“层次关系不外显”,恰恰是语言结构的特点之一。这些探索和争论,实际上反映了三个根本性的问题:1.汉语结构语法学中长期存在的一些困扰,不仅是套用西方语法学框架框范汉语事实所产生的龃龉,而且也是语形语法学自身无法克服的固有问题。几千年来的西方语形语法学研究之所以能够存在,就是因为人脑在发育过程中逐步自建构了与认知能力协同发展的语义结构网络,为语形语法规则提供了语义选择清单与路径。虽然这些语形语法规则在人际交流中可以使用,但是在语言能力的计算机移植中却顿时陷入困境,因为计算机不存在语义网络结构的自建构功能,缺少语义激活路径。根据语形语法规则,计算机造出来的符合自然语句标准的概率极低,多为与对象世界不存在一致性的随机词语串。2.计算语言学所要求的自然语言的形式化,是基于计算机运算模式的语言研究成果。移植进计算机的“定域受限语言系统”和自然语言系统并不完全相等,严格说来,只是一种接近自然语言的计算机模式化符号系统。3.计算语言学的理论和方法,必须建立在语言的本质共性语义性和和计算机数字化运算模式的基础之上。如果对人类语言的认知语义性没有足够的认识,依然安居于语形语法窠臼而迟迟未能建构语义结构网络,语言信息处理的目标则不可能实现。
中国信息科学界有一种看法,计算机对于形态结构的印欧语言处理具有良好的支撑能力,而对中文信息处理则不然(陈力为2000)。之所以计算机对印欧语文信息处理具有良好的支撑能力,是因为印欧语文结构类型便于建立计算机处理模型。从历史上来看,谷登堡印刷术和打字机键盘都是基于字母的简约性而发明的。一方面,字母系统的符号简约性便于进行数据化处理,汉字符号的繁复性难以进行数据化处理;另一方面,印欧语的形态变化为形式化提供了识别标志,而汉语的孤立结构却没有明显的标志。依据现在的计算机处理模型,汉字的繁复性和汉语的非形态性必然导致中文信息处理中存在一些特殊问题:1.中文信息处理的第一个“瓶颈”。汉语的常用汉字数量繁多,汉字需要解决键盘输入、内部代码、汉字识别和显示、程序语言的数据类型、数据库的排序和检索等一系列问题。2.中文信息处理的第二个“瓶颈”。印欧书面语采取词分写形式,而汉语书面语采取单字连写形式。由于采用西方词法学框架,因此必须研制自动分词技术。假定考虑以“字”和“字义块”等作为汉语的结构单位,自动分词技术将相应改为“字义块”切分技术。3.印欧语的同音词较少,而汉语的同音字较多,同义词和量词也十分丰富,这些都给中文信息处理带来必须解决的难题。4.印欧语可以借助实词的形态变化即在词法层面上进行处理,汉语只有在句法和语义层面上进行处理,需要把语序和虚字的语法信息归纳出来再让计算机掌握。5.印欧语的句子结构是以动词性词语为核心的“主—谓”结构,而汉语的句子结构是以体词性词语为核心的“话题—说明”结构。印欧语的句子结构划一而句界分明,汉语的句子结构多样、成分缺省并且前后句义缠绵。
如果说语言系统是一座“冰山”,那么以上这些语言信息处理中遇到的难题还都是语言系统浮在海水上面的那一小部分,真正的障碍是隐没在海水下面的那一大部分。无论哪一种结构类型的自然语言系统的计算机模拟,包括形态语言,迟早会无可避免地碰撞上坚硬实在而又难以捉摸的“语义结构”。语言研究需要敢于在冰海下持续探索“语义结构”的潜水员。从自然语言系统来说,要让计算机理解语言通常认为必须使电脑能够解决三个问题:1.消除自然语言的一词多义;2.揭示自然语言的潜在意义;3.掌握自然语言的联想推理。这些问题都离不开语义分析,而语义分析技术尚处于探索阶段。(侯敏1999,p.247)对于第一个问题,一词多义可给出不同义项的清单。对于第二个问题,给出每一义项的显性和潜性语义特征清单。对于第三个问题,给出义项或义场之间的语义关联模式。由此可见,必须在以往的经验语感法和先验演绎法基础上,引进实验归纳法和结构优化法,消除语义“泥潭”情结,潜心于冰海中的语义“冰山”,才能逐步建构造语义结构网络。
就世界各种语言来说,语言的计算机理解的深层次难点可能还在于:1.至今尚未揭示出人类理解语言的机制,计算机只能局部模拟自然语言理解的某些简单过程;2.至今尚未完成人类理解语言所凭借的知识系统,建立人类进行语言表达的完整理论,计算机尚无从掌握人类语言的知识系统以及语言表达机制;3.至今尚未对人类语言所兼具的规则性和离散性、精确性和模糊性做出定量和定性的系统分析,计算机尚无从掌握语言系统的复杂性和语言使用的随机性。(傅永和1999,p.238—239)既然语言的理解和表达是一个以知识系统为基础的综合性行为,因此语言系统的计算机模拟必须进行跨学科的研究,特别需要语言学、计算机科学、数学和认知科学以及百科知识学者的合作。与侧重于面对自然人语言学习的语形语法学不同,如果面向语言信息处理,那么就需要以计算机智能模式来重新确定语言学的理论基础、研究重点和研究方法。
面向自然语言处理的计算语言学理论基础,目前主要有基于语言规则性的理性主义理论(即先验主义)和基于语言随机性的经验主义理论。依据理性主义的语言学理论主要有:短语结构语法(g)、扩充转移网络(atn)、配价语法(vg)、格语法(cg)、范畴语法(cg)、概念从属理论(cd)、多叉多标记树形图分析法(mmt)、词汇功能语法(lfg)和蒙塔古语法(mg)等。这些理论和方法,因为从“理性”出发,因此不可能反映以感受性为基础的自然语言的真实面貌,其缺失已经日益明显。为了克服理性主义理论的不足,采取经验主义理论处理大规模真实文本的语料库语言学应运而生。在收集语言资源或建立语料库的基础上,运用统计方法进行语言信息处理,语言交际过程的随机性由此得到关注。面对传统语形语法学对自然语言过程的不相适应和语义研究的复杂性,甚至有人尝试撇开语言学家的语言研究,以借助语料库逐步实现自然语言系统模拟。虽然借助语料库可以解决语言信息处理的一些问题,但是仅仅依赖语料库实现自然语言系统模拟注定此路不通。因为自然语言不是一个语料仓库,而是一个语义和语形复合性结构系统。无论是理性主义还是经验主义,都必须意识到:语言信息处理中所处理的是定域受限语言。这一研究的理论基础既不应是纯粹基于语言规则性的理性主义,也不应是完全依赖语言随机性的经验主义,而应是突出语言受限性的实验主义。世界语言学的发展经历了从经验科学到先验科学的漫长过程,计算机的发明必将促使当代语言学成为一门实验科学。强调计算语言学的实验主义,并非一概否定理性主义和经验主义,而是要在实验主义的基础上运用理性和经验的理论方法。
自然语言处理的语言理论,目前主要有基于语形的语言理解系统和基于语义的语言理解系统。前者是以语形语法研究的成果为出发点,从句法形式入手;后者是以语义研究的成果为出发点,从语义关系入手。两种理解系统在文本输入、预处理和自动分词等早期环节上基本相同,不同的是基于语形的理解系统先进行词法和句法分析,后进行语义和语用分析,基于语义的理解系统先进行语义分析和语义结构生成,后进行目标语的形式组合。生成语义学认为句子的句法特点取决于语义,语义部分才具有生成能力。认知语义学把意义看作一个植根于知识网络和信仰系统中的认知结构,理解一个语言形式的意义必须激发相关认知领域中的其他认知结构。既然语形结构只是语义结构的表层投影,既然基于语义的理解系统才符合语言的生成机制,既然语义处理才是语言信息处理的关键,那么只有基于语义的理解系统才能满足计算机对自然语言的理解和生成。
李葆嘉:论语言科学与语言技术(下)
四、人脑语言和电脑语言的性质异同
根据与“人脑语言学”的对应关系,计算语言学也可以称之为“电脑语言学”。从人脑角度出发,电脑语言学的研究是将人脑语言系统移植电脑工具的电子工程;从电脑角度出发,电脑语言学是电脑程序模拟人脑语言能力的仿生工程。
不管是系统移植还是能力仿生,首先必须认识到人脑和电脑的异同。1.构造机制的不同:人脑是生物神经系统,具有生物认知机制,而电脑是电子计算系统,具有电子运算程序。2.伴随情感的有无:人脑具有驱动感觉、思维和表达进行的情感性,而电脑只具有执行程序运算的机械性。3.经验基础的有无:人脑具有以感受性为特征的经验基础以及知识系统,而电脑即使配备了一定的知识背景,也不可能具有人脑一样的认知经验基础。4.认知理性的异同:人脑的感受和认知可以区别为非语言层次和语言符号层次,非语言层次包括直觉和感觉,语言符号层次包括知觉(游移性印象)、象觉(清晰性意象)和统觉(逻辑性抽象)。电脑的认知理性只能够定位于语言符号的象觉和统觉层次,难以具备丰富的认知层级系统。5.交流对象的异同:人脑的交流对象分别为对象世界和人际关系之间,具有交流的二重性;而电脑的交流对象只有执行程序的人或“人—机对话”的一重性,所谓“机—机对话”的实质仍然是“人—机对话”的连网,互联网交流仍然是执行者之间的交流。由于计算机永远不可能直接认知人所面对的对象世界,必须以人类的认知为中介,因此计算机永远不可能超越人类的智慧,计算机统治人类世界永远是一种不必要的担忧。
其次,必须认识人脑语言系统和电脑语言系统的差别。人脑语法或自然语言法则是在历史上逐步形成的,具有随机性、规约性、类推性和耗散性特点;而电脑语法或机用语言法则只是自然语法的再抽象化和再规范化,具有受限性、是否性、程序性和封闭性的特点。即使将来研究出适合于语言信息处理的机用语法,也不等同于自然语法。电脑所能获得的语言能力,只是自然语言的一部分或有限语言能力。因此,移植进电脑的语言系统必须进行界定:1.定域化语言:因为人脑语言是一个可以分为不同语域的复合性层级系统,所以必须首先确定电脑语言与人脑语言的对应层级,最佳选择就是规范性的日常语域。2.受限化语言:只能采取有限网络模式,才能将自然语言裁剪成适合计算机运算模式的机用语言。3.形式化语言:必须将定域受限语言的语义结构和语形规则分别形式化。4.算法化语言:借助一定的数学模型,将形式化语义和语形系统数字化。5.编程化语言:依据一定的程序语言,将数字化语义和语形系统编程化。
语言信息处理的目标,就是在受限性语言层面上逐步实现人—机对话。归根结底,自然语法≠电脑语法,电脑语言系统是通过建立形式化的计算模型进行处理的定域自然语言系统。电脑的运算速度可以远远超过人脑的思维速度,但是电脑不可能具备人的能动性认知行为。语形语法学面对是人—人对话,人们在语言习得过程中不知不觉地形成了建立在认知能力之上的语义结构网络,为语形语法规则提供了一份语义可选性清单。语言信息处理面对的是人—机对话,而语言“白板”的计算机并不具备这份语义可选性清单。语形语法规则,在教计算机如何说话的过程中顿时陷入困境。几千年来的西方语法学之所以能够延续下来,全赖人们具有基于认知能力的语义结构网络的自建构功能。反之,正是这一语义结构网络的存在,致使以往的语言学家误以为语形语法就是语法的全部或主要,而将语义结构法则长期放逐出语法学领域。
自然语言系统的计算机处理对西方具有两千多年传统的语形语法学提出了根本性的挑战,也为东西方语言学的合流带来了新的契机。回顾20世纪东西方语言学合流的历程,之所以出现西方语法学框架和汉语事实的错位,是因为合流基点的选择陷入误区。西语具有丰富的语形结构(这里指形态变化)而汉语基本没有(汉语主要依靠语序、虚词、韵律和语气,另外对语境或语用具有极大依赖性)。选择建立在形态变化基础上的西方语法学框架作为合流的基点,必然导致这一过程的曲折。反思的结果显示,东西方语言学合流的基点应当是建立在人类语言所共有的语义结构基础上的语义语法学理论。随着对语言能力研究的进一步深入和语言信息处理对传统语言学的挑战,传统语义研究在新的形势下得以复活。随着世界语言学从20世纪60年代以来出现了从语形研究向语义研究的转移,东西方语言学研究的合流将在新的基点上逐步实现。
五、面向语言系统模拟的语义语法学
尽管乔姆斯基理论认识到语言形式化的重要性,但生成语义学才是语言研究本体的转向。虽然配价语法和格语法的引进和对汉语语法意合性的认定,促使语义句法研究成为当代中国语法学界的热点,但迄今为止,中文信息处理应用系统自觉而全面地运用语义研究成果的鲜见。这一现状的表象似乎是语义研究成果不多,其根源却在于没有彻底认识到——必须从人类(不限于印欧族群)普通(不限于欧洲唯理主义)语法(不限于形态语言)的高度,来解决语言理论和研究方法的创新。无论是语言信息处理,还是语言机制揭示,汉语研究都需要既能反映汉语个性又植根于人类语言共性的原创理论。
人类的认知表现为对象世界的符号化(认知对象的符号化形成语义单元)、范畴化(语义单元的范畴化形成语义类别)和关联化(语义类别的关联化形成语义结构)。西方语言中的词法范畴原型是先民通过语音形式所表现出来的认知范畴或语义类别。语言的形态标记性、单位分布性和结构层次性都是语义类别关联化在表达层面的投影或者制约。一方面,随着人们认知的发展,反映原始认知足迹的形态范畴(如原始生物观的“性”、原始计算法的“数”)的价值日益消解;另一方面,随着语言系统的演化,表现原始认知足迹的语法手段又不可避免地合并、弱化和丧失。语序、功能词等手段的补偿,导致语言结构类型从综合型向分析型方向嬗变。这一过程证明,原始词法范畴在句法结构中并不具有充分必要性。一种语言可以没有词法形态变化,但不可能没有语义结构规则。不同的自然语言之间之所以可能互译,其基础就是存在可互通性语义,尽管结构类型迥然不同。(李葆嘉2001)
由此可见,人类语言的本质属性是语义性,其他属性都是语义性的派生。人类语言的共性可以概括为:在人类感知对象世界的过程中,神经机制依据象似性模式促使对象世界语符化,音义一体化的语符具有实体性和范畴性,由此组成的语义结构具有语境性和关联性,语义结构的语境性表现为语用、语义结构的关联性投影为语形,而语义结构模式具有生成性。图示如下:
神经机制语义实体语境-语用性
象似性认知过程语符语义结构生成性
对象世界语音范畴关联-语形性
在自然语言能力移植工程中,计算机需要的是具有语言本质共性的语义结构网络,由此有必要首先建构语义语法学。所谓“语义语法学”不是“语义+语法的学”,而是以语义为研究对象的语法学。把语义结构的表层投影——语形作为语法研究的纯正对象,有悖于语言结构的真实本体。乔姆斯基试图在语形结构进行数理化描写的基础上,建构反映语言能力的生成语法体系势必捉襟见肘。这一初始思路必然导致“抛开语义——深层语义——语义解释——逻辑表达——逻辑式”这样的“不断革命”。虽然乔姆斯基强调语言研究的目的在于揭示语言天赋,但依据其理论思路:普遍语法(研究对象)——语言能力(哲学基础)——自然主义(学科性质)——数学方法(方法借鉴)——符号描写(形式载体)——形式语法(研究成果),显然缺少人类天赋中最关键的认知性语义能力这一环节。完全排斥语义的经典理论阶段,其句法结构规则必然导致生成出一批语言事实中并不存在的语符串。即使在不得不引进语义解释的标准理论阶段,也没有放弃把形式结构作为句法生成的基础规则。然而,任何脱离语义的语法形式化注定流产,不可能达到揭示语言生成机制或普遍语法的目标。
如果说语义语法学的语言观强调人类语言的本质共性是语义性,那么语义语法学的语法观则突出语义结构是语法的主要研究对象。在欧洲传统语文学中,“语法”主要指基于形态变化的词法和句法规则。在历史比较语言学时代,“语法”包括语音法则,因此才有“青年语法学派”之称。20世纪的结构主义和描写主义促使“语法”研究的对象日益窄化。依据语言是音义符号系统这一论断,所谓“语法”即语言结构之法,当包括语音结构法和语义结构法。在语言系统的第一次划分中没有通常所说的“语法”即语形结构法的位置。语形结构是语义结构的表层投射或制约,语形结构法依附于语义结构法。语言系统的音义二分以及相关研究学科,图示如下:
语音分析(生理语音学、物理语音学)
自然语音解析
语言(语音学)语音结构(音位系统学、语流节律学)
符号语形结构(语形语法学)
系统语义投影聚合性义场(词类)
(语义学)语义结构(语义语法学)
组合性义场(句模)
以往的“语音、词汇、语法”三分法,迷糊了研究者的视线。虽然语形语法研究在语言交际和语言教学中具有一定或者相当用途,但是从研究角度而言,却避开了关键的语义结构法则。
人类认知的本质是对世界图式的语义符号化,人所认识的世界就是存在于语言符号系统中的世界。语义结构网络表现为“实体范畴化”(聚合性义场)和“关系模式化”(组合性义场)的相互交错。广义语义不仅包括实体范畴化的词汇语义和关系模式化的结构语义,而且包括语境范畴化的语用语义。语法的真实本体或语法研究的切实对象应当是语义范畴及其关联模式。结构语法和生成语言的不同之处,在于前者强调“语言系统”,而后者强调“语言能力”,但其共通之处却在于皆以语义结构的虚象——语形作为研究实相,始终游离于语法真实本体之外。依据语形语法学的有限范畴和简略框架(词类划分、语形成分、短语结构、句子成分等),既难以深入分析句法结构,更不可能有效驾驭语言结构的生成机制。从表达来说,语义编码是一切语言编码的基础,要揭示语言的奥秘必须从语义入手。语形型语言(并非只有语形,而是语形隐含或遮蔽了语义语法)和语义型语言(并非没有语法,而是没有形态变化语法)的研究基础,都应是语符的语义性。语义语法学的语法观突出语义结构,表面上突出汉语的个性特征,实质上受制于人类语言的本质共性。关于语形型语言和语义型语言的大致异同,图示如下:
语形型语言:形态手段
语义范畴——语义网络(知识世界)——元语言(日常认知)
语义型语言:非形态手段好范文版权所有
人类的语言符号系统,本质上是一个意义隐喻系统。作为人类认知基本能力的隐喻,其更深层次是源于动物性感受的模仿(基于事物的相似性)与借代(基于事物的相关性)这两种认知能力。关于语言符号系统的形成大致流程,图示如下:
神经机制情绪模式
认知机制具体感受元语言(日常认知)——语义网络(知识世界)
对象世界经验框架
西方语法学源于古希腊的“语言·哲学·逻辑”混沌母体,西方哲人的逻辑研究基于思辩性语言活动。因为逻辑的基本单位是概念和命题,因此人们往往把注重语义的语法研究混同于逻辑的研究。汉语实词的义类划分不是根据逻辑意义,而是借助日常语义;汉语句读之间的语法关系不是根据逻辑关系,而是遵循事理关系。虽然逻辑规则是语法规则的部分再抽象化,但泛逻辑主义却致使人们误以为语法规则都可以逻辑化。自然语言首先具有本能传情性和日常认知性,语言结构法则主要依据广泛存在于日常生活中的事理关系。这一事理关系包括:时序先后性、空间位置性、主观因果性、主观目的性和评估好恶性等等。不是日常语法以思辩逻辑为基础,而是思辩逻辑以日常语法为基础。同样,虽然可以借用数理符号转写具有算法性的语言结构法则,但不可把语言法则混同于数理逻辑规则。
语义语法学的技术路线,是从建构现代汉语元语言系统到建构现代汉语语义网络。虽然自然语言信息处理依赖于语义结构的形式化,但是一些语言学家往往视语义研究成果为“非语法”,并且对其形式化的可能性持怀疑态度。一方面语义单元不具备语形变化的显著标记,而包含较多的意会性;另一方面语义单元并非没有范畴标准,也具有感受或认知的一致性。所谓语义的客观性和主观性就是语义的集体认同性和个人联想性,其本质是个体使用的“素单位”和集体认同的“位单位”之间的矛盾。语义语法学的研究对象首先是具有集体认同性的“义位”(标准体),然后才有可能是仅具个人使用性的“义素”(义位变体)。尽管语义单元或语元数量众多,语义结构关系复杂,但它们以潜在的元语言系统为基础。语义结构网络由语元实体和语义关系组成。同类语元之间具有聚合性语义关系,异类语元之间具有组合性语义关系。换而言之,每一语元都具有两种互相制约着的语义关系,一是同一义场内的各个“义位”之间的“义征”(语义特征)异同,一是不同义场的“义位”之间的“义联”(语义关联)异同。由此,可以依据义征和义联的异同而建立聚合性义位系统和组合性义联系统,在两者基础上在编织语义结构网络。句法结构的形式化应当是语义结构的形式化,而语义结构的形式化就是义场关联模式。
现代汉语语义语法的基础研究是建立“现代汉语元语言系统”,这一研究可比喻为“语言基因图谱分析工程”。其研究思路是:首先归纳出现代汉语词典中用于释义的最低限量词汇,以建构释义元语言系统;其次依据日常语言交际和语言教学中的用词,参照释义元语言以建立词汇元语言系统;再次抽象出义征范畴以建立析义元语言系统,完成语义标记集。在以上成果基础上,一方面可以结合认知心理学和神经语言学的成果进一步研究认知元语言系统,另一方面可以依据语言信息处理的要求,建立机用元语言系统。(李葆嘉等2002)
在现代汉语元语言系统这一基础性工作完成以后,才可以逐步建构现代汉语语义结构网络。研究程序和主要方法大致如下:1.义征对比法。依据有限网络模型,借助析义元语言系统对义元进行形式化描写即标注义征。给出义元在义场内的语义特征,其目标是建构聚合性义场。2.义联配比法。依据有限网络模式,对语义符号的配比关系进行形式化描写即标注义联,在分析和描写过程中归纳出关联性元语言系统和语义结构关联框架。语义句法的本质是相关义场之间的配比,因此义联标记体现着义场配比。给出义场之间的语义选择或语义制约规则,其目标是建立组合性义场。3.语形标记法。汉语具有词序、虚词和韵律等形式手段。韵律手段属于语音句法,可姑且不论。汉语的语形大致可以概括为两种:附着在词或词组上的词语级语形是完构成分;附着在句干上的句子级语形是完句成分。在进行汉语语形范畴化研究的同时,寻找语义关联和语形成分之间的对应性,然后对语形系统进行层级性形式化描写。4.合成建构法。在义征、义联和语形研究成果的基础上,通过相关标记的合成以建构语义结构句模系统。
“语言能力移植工程”的语言学部分主要是语义结构网络研究。通过建立形式化的计算模型,可以将语义结构网络进一步形式化、算法化和程序化。语义语法系统研究的每一结果,都可以也应当用计算机操作作为验证。以往的语法学研究,除了执著于语形研究以外,还有一个根本性的缺憾,就是不具备自然科学研究中的实验手段,因此难免经验性、臆断性和游移性等。采取计算机作为研究和验证手段,从而使语法研究具有鲜明的技术性和可证伪性。人们常说,只有学会一门外语,人们才真正了解自己的母语。与此同理,只有计算机掌握了自然语言,人类才深入揭示出自然语言的奥秘。换而言之,根据语言学习对象的不同,可能存在三种教学语法:一种是母语教学语法(着重于语形语法,因为人类对语义结构网络和语言知识库具有自建构能力),一种是对外语言教学语法(需要在语形语法的基础上增加与语言理解相关的社会文化知识,因为不同语言的语义结构网络具有不同的文化性),一种是计算机模拟语言能力的语法(需要语义语法和语言知识库,因为计算机不具备语义结构网络自建构能力以及与语言理解相关的知识系统的自学习能力)。也只有揭示出语义结构网络,语法学研究才能够在语形语法研究的基础上取得全面突破,语法形式、语形语法意义和语义语法意义,才能够全面贯通。
尽管语义研究及其形式化相当困难,但是在语义语法学理论的指导下,根据定域(语言定域)、定量(词语定量)、定性(义元定性)、定式(义联定式)的“四定”原则逐层实施,自然语言的理解与生成有可能在单句模式系统中首先实现。只要对语言本质的探索和人脑语言移植电脑的目标不变,就必须穿越语义研究的沼泽地。如果说20世纪是语形语法学的世纪,那么可以预言21世纪将是语义语法学的世纪。
六、语言科技复合型人才的培养
自然语言的计算机理解和生成已经成为国际语言学研究的聚焦,语言信息处理的技术水平已经成为当前衡量一个国家现代化水平的重要标志之一,尽快培养兼通语言学、计算机科学、数学和认知科学的复合型人才迫在眉睫。据《美国计算语言学杂志》1986年统计,全球设置计算语言学博士学位的大学已有105所,其中美国63所。在英国曼彻斯特大学已有计算语言学的学士和硕士专业。(侯敏1999,p.27)
中国的机器翻译在20世纪50年代启动,但由于反复不断的政治**停滞了近20年。1981年,成立了中文信息学会。1987年,隶属于中文信息学会的计算语言学专业委员会成立。通过计算机专家和语言学家的努力,已经取得语言信息处理的一系列成果。但迄今为止,中国大陆计算语言学方向的研究生的培养,或附属在汉语言文字学、语言学及应用语言学学位点,或附属在计算机应用等学位点,专门性的本科专业迄今尚无设置。根据目前中国高等教育学科体系,一方面,语言学和计算机科学分属不同专业,兼通语言学和计算机科学人才的培养如隔重山;另一方面,“中国语言文学”学科中,作为学术或准科学的“语言学”在前而作为艺术或教化工具的“文学”为重,两者始终捏而不合。
依据南京师范大学文学院的发展规划,2001年4月成立了语言科技研究所,6月成立了语言科学及技术系,现在正在建设一个包括教学功能、科研功能、开发功能和交流功能的语言科技实验中心。在现有专业目录内增设的汉语言专业,以“语言科技”为特色,课程设置以语言学、计算机科学、数学和认知科学为四大学科支柱,2002年开始招收首届中文信息处理方向的本科生。这一举措,为多年来倡导的文理工学科渗透,找到了一个准确的切入口。语言科技专业的培养目标是:立足当代语言科技领域,放眼未来相关科技前沿,以语言学与相关学科相的结合为导向,培养有利于促进21世纪科技进步和社会发展的复合型创新人才。通过坚持不懈的努力,南京师范大学语言学学科点拟在三五年内完善“本科生——研究生——博士后”的多层次人才培养体系,建构“教育性——科研性——开发性”的综合型高等教育基地。
面对信息科技对当代语言学的挑战,“语言科技”新思维应运而生。这是一个可以在描写语言学、理论语言学和计算语言学之间,可以在语言学和相关学科之间,充分发挥沟通作用并引发许多思考的新概念。依据这一新思维,首先建构了面向语言工程的语义语法学理论,并进一步将这一工程具体化为“语言基因图谱分析工程”和“语言能力移植工程”。当代信息科技的发展趋势表明,研究对象的语义性和研究过程及其成果的技术化将成为21世纪的语言学精神。
第二篇:下周科学语言课
语言:豆豆收藏家
活动目标
1.理解收藏的含义,感受故事所表达的小朋友对幼儿园的留恋之情。2.乐于用语言、绘画的方式与同伴交流自己内心世界的收藏。活动准备
1.课件:豆豆收藏家。2.投影仪及电脑。
3.教具——收藏盒,装有石头、树叶、画、橡皮、瓶盖等等,树木,石子,豆豆人物画。
4.学具——剪有各种形状的卡纸、笔、收藏盒与幼儿人数相同。活动过程
一、欣赏故事,理解收藏的含义。
二、结合画面,进一步理解故事。演示画面: 1.豆豆收藏了什么? 豆豆为什么要收藏石头? 2.豆豆为什么要收藏树叶? 3.豆豆为什么要收藏画?
4.等豆豆毕业了,离开幼儿园了。她看到收藏的石头树叶画,她会怎么想? 5.故事里的豆豆为什么要把幼儿园的东西当成宝贝收藏起来? 如果是你,你想收藏什么?为什么?
三、学做小小收藏家。
每位幼儿选一个自己喜欢的收藏盒,实地收藏。活动延伸 美工区提供笔、纸(若干),鼓励幼儿画画自己的收藏。2.自由活动时请你们一起与同伴交流你的收藏品。附故事:
豆 豆 收 藏 家
豆豆是个收藏家,他有很多很多收藏。
你想瞧一瞧?那就瞧一瞧吧。瓶盖,橡皮,尺子,小粘纸,玻璃球,还有好多好多呢。这些可都是豆豆的宝贝呀。
豆豆就要上小学了,可是他太喜欢幼儿园了,他想把幼儿园也收藏起来。豆豆真想收藏滑梯,滑梯上有豆豆的屁股印儿,有豆豆的笑声。滑梯下面的小石子儿还把豆豆的屁股弄得好疼好疼呢!那小石子还留在那里,光溜溜,圆乎乎,好象一颗鸟蛋,豆豆捡起小石子儿,收藏起来,以后看见小石子,豆豆就会想起幼儿园的滑梯。
幼儿园的大树,豆豆也想收藏。在这棵大树下,豆豆和小伙伴讲过许多悄悄话。树叶有多少,讲过的悄悄话就有多少。可是,留在幼儿园的弟弟妹妹,还要来这儿讲悄悄话的呀。豆豆拣起一片树叶收藏起来,只要看见树叶,豆豆就会想起幼儿园的树,想起小伙伴在一起讲悄悄话。
豆豆最想收藏的是老师,豆豆喜欢老师的声音,老师的笑,老师身上那股香香的味儿。豆豆拿出画笔,画上老师的眼睛,老师的鼻子,还有老师的嘴巴,以后,看见这张画,豆豆就象又看见了老师。
豆豆是个收藏家,他要把幼儿园好好地藏起来,一直藏下去,永远,永远。
活动反思:
语言:毕业献词
活动目标
1.理解诗歌内容,能有感情的朗诵。
2.回忆美好的幼儿园生活,表达自己对老师的感谢之情。活动准备
1.师生一起收集幼儿3年来的活动照片,布置在教室专栏中 2.录音机,录音带 活动过程
1.观看照片,帮助幼儿积极回忆在园的生活、学习、游戏。T:还记得小班、中班的情况吗?
T:小班、中班时我们怎么样?现在我们又能干些什么? T:有哪些老师教过我们?幼儿园里还有谁帮助过、关心过我们?
T:再过几天,我们就要告别幼儿园了,心情怎么样?想对大家说些什么话? T:到小学后我们准备怎样做呢? 2.欣赏和理解诗歌
(1)教师有感情的朗诵诗歌,幼儿初步理解诗歌内容(2)提问:
T:诗歌的名字是什么?
T:诗歌里对老师、叔叔、阿姨说了哪些感谢的话? T:到了小学又是怎样做的? 3.学习诗歌。
(1)欣赏配乐诗歌录音。
(2)分段学习诗歌。教师要注意帮助幼儿理解诗歌里每一段的内容,并学习朗诵,注意幼儿发音要准确。
(3)自由结合分小组练习(4)有感情的集体朗诵。
活动反思:
数学:数积木
活动目标:
1.在数积木的过程中,学习有序地观察和统计数量的方法。
2.能清晰地表达观察的内容,喜欢挑战空间逻辑游戏。
活动准备:
正方体小积木;“积木房”图片若干;记录用纸和笔
活动过程:
一、话建筑,赢积木
T:在我们居住的城市里有各种各样的老房子和新建筑,你喜欢怎样的房子,为什么呢?
T:想不想造一幢喜欢的房子?
T:今天我们就用积木来造房子!每组的桌上有几块积木呀?够不够造一幢房子?
那就请你们就分成4组在数积木游戏中赢取更多的积木。
二、争回答,数积木
(一)数数相同数量的积木房
T:听清题目哟!(出示相同数量积木建造的不同房子)
T出题:我用积木造了4幢房子,请你们用好方法数一数,每幢房子各由几块积木建成的?
形式:将答案记录在记录纸上,呈现在每幢房子的下方,答对的为本组加上一块积木。
验证:移去屋顶,拆层演示
重点提问:房子有几层?每层有几块?一共有几块?
小结:数量相同的积木能造出不同的房子,只是有的积木被其他积木挡住了,我们不容易发现,点数的时候我们可以一层一层的数清楚,不多数,也不漏数看不见的那些积木。
(二)找找躲起来的积木块
T:有的小组领先了,有的小组暂时落后,不过没关系,我又造了一幢房子,房子里有些积木很顽皮,像玩捉迷藏一样躲了起来。让我们仔细观察,把藏起来的积木找出来。
T:准备好了吗?请问这幢房子有几层?每一层有几块?共有几块积木建成?
重点:移去屋顶,拆层演示,帮助幼儿学会数隐藏起来的积木块。
小结:房子一层层往上造,如果上层有几块积木,那这些积木下一定也有几块积木
三、造房子,数“砖块”
(一)造幢房子把分数
T:经过两轮的比赛,哪一队的领先了呢?请每组朋友用你们现有的积木造一幢房子,然后我们一起来数数你们的房子由几块积木建成,共得到了几分。
(二)学做小小建筑师
T:(出示建房图纸)你们造房子、数积木的本领都那么大。那你们能不能在根据图纸上的建房要求,在5分钟内造出与图上一模一样的房子,并一层一层的数清楚他是由几块积木建成的呢?
要求:每队派一个代表挑选喜欢的图纸,用积木搭出与图中相同的房子,要造的又快又好!
重点观察:每组搭的房子是否与图纸上的一样,各组搭建、点数的方法。
验证:他们搭的房子与图纸上的一样吗?记录的对不对呢?
小结:虽然各队拿到的图纸看起来不一样,其实是同一幢房子从不同的角度拍出的照片,所以搭出的房子是相同的。
四、延伸:
T:小小建筑师们让我们回去建造更多独特的房子,考考你的好朋友们你是用几块积木建成的好不好!
活动反思:
科学: 找空气
活动目标: 1.让幼儿感知空气的存在,发现空气无处不在。2.能运用语言清楚的表达自己的发现。活动准备: 1.各种塑料袋、皮筋、气球
2.活动前与幼儿开展有关空气的谈话,了解幼儿对空气的原有经验,引发幼儿兴趣。活动过程:
1.谈话
教师出示吹好的气球,提问:“小朋友,气球娃娃来找你们玩来了,大家快跟它打个招呼吧!气球娃娃想考考你们,„我的肚子为什么是鼓鼓的?‟ 引导幼儿说出气球里是空气,教师“空气从哪里来?我们去捉空气好不好?”com,请保留此标记。)
2.找空气
请幼儿按自己想的用塑料袋去教室的各个地方找空气,说一说“你在哪儿找到了空气”。
教师指导幼儿实验,并帮助幼儿将装满空气的袋子系好。请幼儿互相介绍自己是在哪捉到空气的。
教师将幼儿的发言汇总小结,引导幼儿思考:还有哪个地方我们没有找?那里是否有空气存在?
3.吹气球
让幼儿玩吹气球的游戏,再次体验空气的存在。4.空气作用大
引导幼儿讨论空气与人类生活的密切联系 活动延伸:
在科学活动区提供有关的材料(如轮胎图片,救生圈图片等),从中发现哪些物品是利用空气原理制成的。
提供气球,让幼儿游戏。
活动反思:
第三篇:音乐与语言
音乐与语言
传统的《歌曲做法》大多很注重音乐技术层面的阐述,比如,先从音乐的主题入手,然后讲到音乐的发展,其次再讲述音乐的结构,最后讲讲音乐的体裁、前奏尾声的写作,等等。客观地讲,这种文体结构没有什么不好,问题是它具有相当大的局限性——音乐创作是一个相当复杂的精神活动,需要许多方面的共同参与才能完成。比如,一个人的艺术经历、生活阅历、音乐才能、语言修养等诸多方的层次和水平决定其音乐创作的层次和水平。因此,作为一部专门讲述歌曲创作的教课书就不能单单只讲音乐技术,而其中非常重要的、与歌曲息息相关的语言学——为歌曲创作所用的语言学就显得非常重要了。因为人的歌唱状态与人在日常生活中的语言表达是没有本质上的区别的。二者之间只是在某些方面略有不同,另外,歌曲创作也不是生活语言的简单复制与模仿,从以上两个方面可以看出语言在歌曲创作中的特殊地位。不拿出一定的章节来阐述关于语言与音乐的诸多问题的教科书——我个人认为——不能算是合格的教科书,尤其是在当
下,信息和资讯近乎爆炸的年代。
前面谈到“为歌曲创作所用的语言学”的说法,其意义就在于它有别
于一般的语言学,这种在音乐艺术中存在的“语言”。
第四篇:语言与文化
【内容摘要】:数字,是人类认知世界的发现与工具,数字符合使人类进行抽象的逻辑思维变为可能,并通过它们记载对世界的认识及人类的发展史,从数字文化背后,我们可以发现,它们折射出了各个时期的历史特点及人们的心里层面。本论文主要从数字的含义,数字的谐音,数字的成俗语几个方面对数字文化进行了浅析。
【关键词】:数字 数字文化 社会文化 谐音 成俗语
数字是文字语言中的一个奇葩,它有着独特的文化蕴含和功能,它用自己的方式记载着人类思维的变化及对世界对认识,同时它也是文化发展过程中不可缺少的因素,数字与文化有着不可分割的联系。在生活中,我们常常被数字包围着,如:身份证号码、手机号码、护照号、车牌号、生日、结婚纪念日、准考证号、门牌号、学生证号、各种银行卡号、各种节日日期等等,它们不仅仅只是一个数字,而且还是某些个体的标识,它记载着一件事情或一段故事,反映着各时期的社会文化,丰富着我们的文化生活。
一、从数字文化中透视中西文化——数字的内涵
“一”代表胜利,代表着最高,代表着万物之源,代表着前无古人,后无来者,居高临下,位居首位,是最小的自然数。无论是中国还是西方,人们都对数字“一”情有独钟,都非常崇拜它。在中国,人们注重做事的“有始有终”、“独一无二”、“一马当先”、“一日之计在于晨,一年之计在于春”,这在数字文化中表现出了对“一”的崇尚,尤其是人们对农历一月一日(大年初一)的重视。数字文化被赋予一种神圣感,老子在《道德经》中说到:“道生一,一生二,三生万物。”可见“一”是万数之母,其它自然数是“一”累加的结果,都以“一”为基础。在西方,“一”同样很受崇拜,不同与我们的是,他们对出生日是一号的比较重视,他们认为出生日是一号的那个人就会被赋予一种独立坚强的性格,敏锐的观察力,他会努力地达到自己既定地目标。从中可透视出我们中国看重事论“汉语中的数字与社会文化”
情的开头,而西方则看重人的独立。
“二”仅此于“一”之后。在中国,“二”是双,表示美满之意,是人们喜爱的数字,有大吉大利之意,如:智勇双全、双喜临门、两全其美、举世无双都是美好的含义。但是随着社会生活,社会文化的发展,“二”的含义发生了一些变化。在有些时候,我们常说“这个人好二”,这里“二”不再是美满,而是说这个人有点傻,而且傻的可爱。而在西方,“二”是一个不吉利的数字,常被视为劣根,罪恶之源。可见,中西方文化有很大的差异。
“三”表示多的意思,如:三思而后行,三人行必有我师,垂涎三尺,余音绕梁三日不绝。在西方,人们对“三”很偏爱,认为它是一个神圣的数字。
“四”从外形上看方方正正,有棱有角,所以在中国它表示四方的意思,象征平稳,如:四平八稳,有东南西北四个方向,春夏秋冬四个季节。在西方它象征着公平、正义和力量。
“五”一个神秘而又抽象的数字。五行阵、五花八门三纲五常、三年五载、三令五申、三皇五帝等等似乎“五”在中国文化中有着很深的哲学思想。而在西方人们受基督教的影响很忌讳“五”,“星期五”因为是耶稣受难日,所以被认为是很不吉利的日子。
“六”可以说是最喜庆吉祥的数字之一,表示顺利。如:六六大顺、六畜兴旺,象征吉祥如意,幸福安康。在春节,我们 常常在畜牲圈中贴上一副“六畜兴旺”的对联;在选择电话号码或汽车牌号时人们尤其钟爱尾数是“66”的数字。因为他们象征着顺利,健康和万事如意。西方则不同,他们认为“六”是一个凶数,野兽数。如:在俄罗斯,“六六六”代表的是“恶魔”,所以人们一般很忌讳。
“七”是我在十个数字中最不喜欢的一个,它代表着复杂、凌乱,如:七窍生烟、七零八落、七上八下、七拼八凑、七嘴八舌、七扭八歪等都带有贬义。给人送礼时忌七样,饭桌上的菜绝不能是七盘,人们在挑选吉日良辰时不窕七、十七、二十七,这主要与中国人崇尚偶数的心里有关。在西方,“七”却是个神圣的数字,西方人讲究七种美德,七次圣餐,人生有七个时期,七种天罪,这是因为它与神圣有关,如:上帝用七天时间完成了创造世间万物的
壮举,用七天造了亚当,取亚当七根肋骨造了夏娃,圣灵有七件礼物。在西方童话故事中又有白雪公主和七个小矮人。
“八”民曰“要得发,不离八”是发达兴旺之数,在中国文化中占有十分重要地位。八拜之交,八斗之才,八方之援,“八”已成为中国人最青睐的大吉数。在西方,“八”暗示着成功,幸福和满足。
“九”象征神圣,最至高无上。古代帝王被称作“九五之尊”,北京城有九个门,天安门城楼面阔九间,故宫房间有9999间等都体现了“九”的神圣与无尚。“九”与“久”谐音,故也常表示长久之意,在中国文化中“九”是代表最大,最深,最远的数。在西方“九”同样神圣和尊贵,天有九层,地狱有九层,可见,“九”在中西文化中特别被看重。
二、从数字文化中寻找趣味——数字的谐音
生活中,我们我们不难发现有些数字经过变调发音后会产生有趣的效果,有褒义也有贬义。随着时代的发展,数字文化慢慢地走进我们的生活。“二”的谐音“爱”,“四”的谐音“死”,“五”的谐音“我”,“八”的谐音“发”,“九”的谐音“久”。
我们在选择床位号、门牌号时常避开“14”、“54”,“14”谐音要死,“54”谐音我死都是不吉利的数字;男女双方在表达爱意时常用“520”谐音“我爱你”,“131420”谐音“一生一世爱你”,“3344587”的谐音“生生世世不变心”,“8834760”的谐音“慢慢相思只为你”,“7708801314520”的谐音“亲亲你,抱抱你,一生一世我爱你”;人们在遇到要选择数字时,常离不开“8”——“发”,如:“18”——“要发”、“168”——“一路发”、“518”——“我要发”、“888”——“发发发”,也常用“886”表示“拜拜了”;还有一些,如:“918”——“加油吧”、“282”——“饿不饿”、“70885”——“请你帮帮我”、“0487”——“你是白痴”、“786”——“吃饭了”,又如“二白五”——古代银子五百是一对,二白五十是半封,所以“二白五”谐音“半疯”表示傻气,莽撞。是不是很有趣,突然间发现数字作为一种文化也很有魅力,虽然有些数字表示的意义含糊,甚至有时误解某些数字,但也是因为这点,它给我们的生活增添了欢乐,丰富了中国文化,使之成为最深奥,最有影响的文化。
三、从数字文化中接受启发——数字的成俗语 与西方国家相比,我国的数字文化虽然直接,单一,但如果将数字与数字之间相组合,将会不同凡响,其中蕴含的哲理也较为丰富,无论是在生活中还是书本中我们都可以感受到它们存在的气息。
(一)珠算口决相关成语:①三下五除二:形容做事干脆利索。②二一添作五:指双方平分或平均承担责任或任务。③一退六二五:比喻将责任推卸干净。④三一三十一:多指平均分成三份。
(二)民间数字成语:①不三不四:形容一个不正派,一个不像样。②不管三七二十一:指做事考虑不周。③八九不离十:比喻差不多。④数九寒天:是极冷。⑤一不做,二不休:表示做事考虑不周到,做了在说。⑥十万八千里:形容距离很远。⑦九牛二虎之力:指做事不容易。⑧大小九九:某人大小算盘。
(三)书本中的成俗语:①一石二鸟:表示干事麻利。②一针见血:表示归根到底。③千载难逢:指很不容易。④九霄云外、五湖四海:比喻距离很远。⑤一日不见如隔三秋:形容思念过度。⑥信心百倍:指信心十足。⑦一杆子到底:表示做事要归根到底。⑧眼观六路,耳听八方:形容某人神通广大,办事能力很强„„
由此可见,数字文化已成为我国文化中不可缺少的一部分,它在我国文化中占有主要位置。
数字文化看起来似乎是人们司空见惯的琐事,但它却无时无刻不在规范着人们的行为。它随着人类文明的产生和发展而演变的,是人类对物质世界的认识而总结出来的。人类文明始于创造文字,而文字的源头又是数字,数字在造字史上起着基石的作用,对人类文化有着及其重要的影响。
第五篇:语言与公司
语言下的公司
公司的语言,是指一个公司的强势语言或者公司权力人群惯常使用的语言。在晋江这个地方,许多公司员工普通话、闽南话、英语都能讲个“溜溜转”,但是,强势语言最终决定公司的流行语言。一个讲普通话的到了大讲闽南语的环境,自我感觉肯定是个“异类”,他与熟悉业务同样重要的自我暗示是“赶紧学闽南语”,直至融入公司主流语言,才会有一点融入公司主流的安全感。同样,一个讲闽南话、东北话、湖南话的老总新入主异类语言的公司,多半要找一些乡亲故旧来出任公司骨干和中层、帮手压阵;而他找的这些骨干和中层同样也得找得力的乡亲故旧帮手做事。于是,不知不觉中,一个公司的流行语言就从原来的系统切换过来,新的系统慢慢形成了。
管他白猫还是黑猫,能抓住老鼠的就是好猫。天下公司的宗旨其实并无二致,无论南腔还是北调,有效就是最美的调调。生意场上,东方话、西方话、南方话、北方话都不含糊,各色公司都生龙活虎。但是,我以为,以现实的角度看,操南方话包括闽南话、粤语等地方话的公司更容易“即刻”赚钱、更直接、务实;从发展的角度看,操普通话和英语的公司更宏观一些、思辨一些、更长远一些。
地方语言是最基础的交易语言,而交易语言很直接;而普通话和英语这些近代才开始流行的普遍性的强势语言带有更多思维语言、抽象语言的质素,使用这些语言的公司和个人会比较理性一些、规范一些、更适应现代商务和管理潮流一些。
个人语言是经历的积淀、体验的积淀、文化和眼光的积淀,公司语言同样如此。无论什么样的语言都可以把生意做好,但若要把生意做大、做强,则必须超越地方语言与跨越地方业务而来。人们谈到香港的成功,都说有很多因素,但是,很少听到有人说这是香港公司粤语和英语交织运用的成功,是东方勤奋与西方管理文化交织的成功,我以为,这是一个缺憾。
说地方色彩的语言,可以做同乡的生意;说普通话的公司,可以做全中国的生意;说英语的企业,可以做国际性的生意。可以说,有什么样的语言,就有什么样的公司。