第一篇:大学生信息检索技术素质培养论文
大学生地理文献选读论文
大学生信息检索技术素质培养论文 姓名:程静
班级:
11级地理科学2班
学号:
11009110047
学院:环境科学与旅游学院 指导老师:吴旭东博士
大学生信息检索技术素质培养论文 作者:程静
摘要:本文从分析信息素质教育的内涵入手,基于信息素质教育的概念和内涵,分析了大学生信息素质现状的需要和培养高素质人才的需要,论述了开展信息素质教育的必要性及高校图书馆对大学生进行信息素质教育的优势和措施,明确大学生信息素质教育的内容,目的在于重视和加强大学生信息素质教育的培养。并结合当前大学生信息素质教育的现状,提出了提高大学生信息素质的具体途径。
关键词:大学生素质教育;信息素质教育;高校图书馆
在信息飞速发展的社会,及时获取有用的信息、知识,已成为现代人终身学习和自我发展的迫切需要。高校图书馆是文献信息收藏和服务的中心,其良好的信息环境、丰富的信息资源是大学生学习科学文化知识、掌握信息技术的主要场所,它在大学生的信息素质教育中有着重要的资源优势、技术优势和环境优势,是大学生信息素质教育的重要基地。一信息素质和信息素质教育的内涵及内容
1、信息素质教育的内涵
信息素质也称信息素养,最早是在1974年由美国信息产业协会会长波尔(Paul Zurkowski)提出的。当时他对信息素质下的定义是:利用大量的信息工具及主要信息源使问题得到解答的技术和技能。2002年美国路易斯威尔大学图书馆馆长Hannelore B.Rader说:“信息素质是判断何时需要信息,并有效地定位、获取和利用信息的一系列能力的总和。”她提出的信息素质的内涵包括图书馆素质、媒体素质、计算机素质、研究素质和批判性思考能力。我国学者黄筱玲、郑章飞认为:“信息素质是人们有目的地捕捉、选择、存储、加工利用信息的过程中所具备的一种复合品质。它是社会成员的信息意识、信息道德、信息能力、信息潜能等到多项基本素质的有机结合,也是人获取信息、利用信息的一种基本技能。” 2.信息素质教育的内容
信息素质教育是一种基础教育和终身教育,其主要包含三方面的内容:
(一)信息意识教育。信息意识是指对知识信息重要性的认识和对知识信息的敏感程度,即人们从信息的角度对社会中各种现象、行为的感受、理解和评价这种自觉的对信息的心理反应。信息意识在信息素质结构中起着先导作用,影响着人们对信息需求和对信息需求的准确表达,支配着人的信息行为。信息意识教育目的在于激发个体潜在的信息需求意识,并能充分准确地辨析和鉴定信息的价值,合理的利用信息,从而形成一种对信息敏锐的思维感知能力和对信息所特有的恒久注意力。
(二)信息能力教育。信息能力主要指获取和评价信息的能力、组织和保持信息的能力、传递和交流信息的能力、利用计算机处理信息的能力、创造性利用信息的能力,也就是终身学习的能力。它是一个人信息素质的核心所在。具体说来,其中获得、评价信息是指对信息的捕捉和发现、采集和优选;组织和保持信息是指对信息的分类和综合、查错和控制;传递和交流信息是指对信息的输出和接受与沟通;用计算机处理信息是指对信息的检索、排序、存储和变换;创造性利用信息是指有效地利用信息来解决学习、工作和生活中遇到的各种难题,并且能够利用信息不断地自我更新知识,利用新的信息创造性地提出解决问题的新方法。
(三)信息道德教育。信息道德是指在整个信息活动中,用以调节信息创造者、信息服务者、信息使用者之间相互关系的行为规范的总和。信息道德教育的目的是促使社会个体遵循一定的信息伦理与道德准则来规范自身的信息行为与活动。它是保证信息素质发展方向的指示器和调节器。主要内容包括尊重知识产权、培养信息良知,在信息活动中坚持公正、平等、真实原则,遵守有关信息活动的道德规范和法律法规的自觉性等。
二、大学生目前信息素质教育的现状 学校方面:我国的信息素质教育发端于1984年教育部颁发的在高校开设文献检索课的文件。由于该文件的规定,全国各高校有条件的才正式开设文献检索课。2002年版的普通高校图书馆规程明确了图书馆开展信息素质教育的任务,文件和规程从宏观上规定了高等院校必须开展信息素质教育。但对于信息素质教育目标、教学规划、教学要求及教学效果的评估缺乏指导性意见,各高校的文献检索课自行开设、自行选用教材。信息素质教育并没有得到与其角色相当的重视。迄今为止开设文献检索课的院校并不多。大多数院校并没有把文献检索课作为一门方法课、基础课开设并真正重视起来,往往只把它当作一门普通课程甚至选修课看待。同时,信息素质教育的师资力量不足,也难以全面的展开信息素质教育。图书馆和网络建设等信息素质教育的硬件设施有了很大进步,尤其是校园网的建设卓有成效。但利用率并不高。图书馆的主要效能还体现在提供纸质材料的查找和安静的学习环境。对于网络的运用主要体现在娱乐上,利用网络资源进行信息检索的极少。大学生方面:信息意识淡薄,对信息的重要性认识不足,对信息缺乏敏锐性。信息欲望不强,对信息素质教育的关注程度较低。信息能力有限。信息的综合利用技能较差。主要体现在搜索能力有限。表现在不能有效地将检索需求表达出来。不熟悉检索系统的检索语言、检索运算符以及相关的检索技巧;检索策略不够合理,不能及时根据检索结果有效的进行调整。搜索范围主要在国内资源上,类型多为纸质资源。具备一定的计算机检索和光盘检索能力,但网络检索能力亟待提高,极少进行国际联机数据库资源的利用。信息道德堪忧,主要表现在不尊重他人的知识产权,包括阅读不良信息等。
三、大学生信息素质教育的途径
(一)提高对信息素质教育重要性的认识。
21世纪是信息化社会,信息素质成为评价人才的重要因素,利用现代信息技术获取信息的能力,已成为一种基本生存手段和必要的技能。美国著名未来学家阿尔温托夫勒在《权力的转移》中指出:“谁掌握了知识和信息,谁就掌握了支配他人的权利”。同时,信息素质教育是一种终生教育。据统计,人的一生当中大学阶段所获得的知识只占所需知识的10%,其余的90%需要在工作中不断学习和获取,因此大学生只有通过良好的信息素质教育才能变“学会知识”到“会学知识”,才能在激烈的竞争环境中立于不败之地。
(二)改革传统教学内容和教学方式。对于信息素质教育,人们一直有一些误解。把信息素质教育理解为信息能力的教育,忽略了信息意识和信息道德教育;把信息能力教育简单等同于信息搜索能力的培养,忽略了信息的分析、组合和创新等信息综合运用能力;把文献检索看作是写论文、搞科研的前期资料准备工作,忽略了它在发现知识、生成知识方面的深层作用,未将它的全部功能和意义挖掘出来。而在实际检索当中,人们存在着重检索、轻利用的倾向,人为地将文献检索和利用隔离开来,将查找资料与后续成果隔离开来,这样对学习和全面体会文献检索的重要性起到了严重的阻碍作用。这些偏颇的认识,导致大学生的信息素质教育的缩水和抽条。
为了全面培养和提高大学生的信息素质,增强大学生的信息综合运用能力,必须对传统的教学内容和教学方式进行改革。
1.构建科学合理的教学内容体系。信息素质教育逐渐被关注是近几年的事,长期以来,其相关课程一直以来处在选修课的层次上。构建科学合理的教学内容体系必须高度重视信息素质教育,把相关的信息素质教育方面的课程设置为公共基础课。同时,在课程设置上,应综合考虑信息素质教育的内容体系,在加强信息能力教育的基础上,开设信息意识教育和信息道德教育的相关课程,全面提高大学生的信息素质。在信息能力教育上要以文献检索为基点,综合培养大学生信息的分析、利用和创新的能力。鼓励大学生通过检索到的各种可利用信息资源去开发新的知识,让其在撰写论文或专业设计当中亲身体验文献检索在科学研究中的作用与价值,从而增强和提高他们的信息素质和操作技能,使信息素质教育成为文献检索教育的更高层次,培养大学生的终生学习能力。
2.全面融入,专业教育和综合实践相结合。信息素质教育是一种终生学习能力的教育,是一种方法和工具式的教育,只有进行大量的运用练习素质才能不断地提高。因此除了专业的信息素质教育之外,还要将信息素质教育融入到学习生活中。具体说来:其一是将信息素质教育纵向贯穿于大学生学习的全过程。结合信息素质教育的内容体系和各年级大学生的实际情况,对教学内容进行合理的层次划分。低年级的大学生进行信息基础理论教育,培养信息意识和信息道德,了解院校的信息资源和使用方法技巧。高年纪的大学生进行信息能力教育,综合培养大学生的检索、分析、组合和再创能力。要通过毕业设计和论文的撰写全面锻炼和提高大学生的信息素质。其二就是将信息素质教育横向贯穿与大学生的各门课程的学习过程中。单靠开设一门信息检索课,无法实现信息素质教育的目标,必须将专业的教育融入到各门课程的学习上去。在政治思想教育中穿插信息道德的教育;在计算机相关课程教学中融入信息技术教育;在专业课的教学中要介绍本学科的文献信息及获取渠道,专业的代表著作、专业期刊、主要数据库,专业网站等信息源,介绍本专业的研究态势、发展趋势、研究成果,使大学生除了掌握专业知识外,方便大学生进行信息检索和创新,提高大学生的信息素质。
3.充分发挥图书馆的主体作用。图书馆作为院校信息素质教育的主阵地,应该加强软硬两方面的建设,充分发挥主体作用以培养兼职的信息素质教员和高信息素质的大学生。在硬件建设方面,一是要加强校园网建设,建立数字图书馆,开设公共流通系统、公共检索系统、光盘检索系统、国际联机检索系统和网上查询系统等;二是建立电子阅览室、多媒体信息中心等,提供丰富、齐全的电子出版物,提供方便的阅读、复制、打印各种文献资源的手段。在软件建设方面,一是定期开展校园信息活动,举办不同专题的信息素质教育讲座、学术研讨会等各种形式的活动;二是通过校园网设立信息素质教育主页,图书馆设立学习主页,提供一些重要的下载软件、阅读器的应用技巧和使用方法;重要数据库、著名网站等。中外文文献信息检索工具的利用、光盘数据库检索、有关搜索引擎应用和技巧等知识。同时链接一些本学校各学科专业紧密相关的网址以及网站内容的简要介绍,并不断地更新这些内容,以此来提高图书馆用户收集信息的效率和准确性,使信息素质的培养落实到大学生的思想意识和行为中。
参考文献
1.卫丽君.高校大学生信息素质教育探析.科技情报开发于经济,2006; 2.陈万忠.当代信息素质教育论析.湘潭师范学院学报(社会科学版),2005; 3.贾红英.大学生的信息素质教育问题研究.情报科学,2005; 4.赵欢乐,张海燕.对加强大学生信息素质教育的思考.内蒙古农业大学学报(社会科学版),2005;
5.许家梁.关于在高校开展信息素质教育的思考.图书馆论坛,2005。
第二篇:信息检索技术论文
近年来,计算机技术、语言学以及人工智能技术的发展促进了整个信息检索技术领域的发展。今天小编要给大家介绍的便是信息检索技术论文,欢迎阅读!
信息检索技术论文
[摘要]通过对近年来计算机科学、人工智能、专利文献加工等领域的发展进行总结,从多语言混合检索、分类检索、语义检索、图像检索以及辅助技术五个方面介绍专利文献计算机检索技术的最新发展。机器翻译技术和多边共同分类体系的完善有助于提高计算机检索效率、消除语言障碍,而语义检索、图像检索和文献自动处理技术的发展有望使面向不同层次用户的计算机智能化检索系统得以实现。
[关键词]专利文献 计算机检索 语义检索 图像检索
1、前言
近年来,计算机技术、语言学以及人工智能技术的发展促进了整个信息检索技术领域的发展,专利文献的计算机检索技术正成为情报检索领域研究的热点。下文拟从多语言混合检索、分类检索、语义检索、图像检索以及辅助技术五个方面介绍专利文献计算机检索技术的最新发展。
2、多语言混合检索
专利文献是由各国、各地区专利局或世界知识产权局出版的官方文献,因此一般以各局官方语言出版。虽然大部分专利文献是英语文献,但是仍然存在大量日文、中文、德文、法文及其他语种的文献。出版语言的多样性给专利文献的检索和利用带来了极大的障碍,要实现多语言混合检索,机器翻译是必不可少的技术。目前一些专利局在其上推出了机器翻译系统,例如我国国家知识产权局提供有汉英机器翻译,日本特许厅提供有日英机器翻译,韩国知识产权局提供有韩英机器翻译等,上述网络机器翻译系统对其他国家的用户阅读方便和使用本国专利文献起到了帮助作用。
随着计算机技术的发展,机器翻译的技术也迅速发展,从传统的基于规则的机器翻译扩展到了基于实例或模版的机器翻译、统计机器翻译等。尤其是近年来语言学和人工智能技术的发展,以语义描述或以知识描述为特征的智能机器翻译系统正逐步成为研究的热点。专利文献作为一种特殊的科技文献,由于其具有特定的句法和语言结构,同时例如权利要求书等具有法律公示性文件的作用,这对翻译的准确性提出了更高的要求,已有研究者通过在机器翻译系统内集成多个翻译引擎、对不同特点的内容使用不同引擎翻译的方式来提高翻译质量。
已有的机器翻译系统基本局限于单篇文献的机器翻译,无法实现真正的多语言混合检索。多语言混合检索系统不仅可以允许混合语言的检索式,而且同一个检索式还可以对不同语言的专利文献进行检索,其实现方式主要有如下三种:翻译检索式、翻译文献或者两者相结合的混合式。翻译检索式的工作量小,比较适合于因特网检索,但由于检索式通常缺乏语境,翻译难度较大;翻译文献的方式虽然有利于提高翻译质量,进而有利于文献检索,但存在的主要问题是翻译量太大、翻译时间长。
3、分类检索
分类号一直是专利文献检索的重要手段。目前除了基本涵盖各国专利文献的国际专利分类(IPC)之外,美国专利商标局、日本特许厅和欧洲专利局各自都有自己的分类体系,分别是UC、FI/FT和ECLA。IPC虽然通用,但存在分类标准不统一、分类条目不够完备、文献分类更新不及时等缺陷,导致使用IPC检索的效果欠佳。UC和FI/FT分别只能检索美国和日本的专利文献,ECLA虽然能够检索到多国的文献,但仍然不能有效地检索日本、韩国、中国等国的专利文献。
为改善这种局面,美国、日本和欧洲自2000年即开始了“三边分类和谐计划”,该计划旨在推进ECLA、UC和FI三个分类体系的融合以增强分类号检索的功能,同时对现有IPC分类体系提出改进建议。依据2009年召开的第27次三边会议,韩国知识产权局已经加入上述计划,而中国国家知识产权局也以观察国的身份参与这项工作。此外,近年来美国专利商标局、日本特许厅、欧洲专利局、韩国知识产权局和中国国家知识产权局五局积极开展合作,其中一个重要的合作项目是“共同的分类”。该项目的实施将有利于提高分类的一致性,扩展或细化部分技术领域的分类,进而提高检索的效率和质量。
不管是美日欧三方开展的“三边分类和谐计划”,还是五局共同开展的“共同的分类”项目,都必将推进专利文献分类体系的进一步发展,实现真正意义上的“基于检索的分类”,进一步增强分类号在专利文献计算机检索中的作用。
4、语义检索
当前专利文献检索的主要手段为关键词和分类号检索,而由于一词多义、一义多词,专利文献撰写、加工和翻译质量不一以及关键词的机械匹配等问题,本质上决定了其查全率和查准率受限制。随着计算技术、人工智能、自然语言处理等技术的发展,搜索引擎的智能化有望从根本上提高现有检索系统的检索质量。
搜索引擎的智能化具体表现为语义检索,也称为知识检索或概念检索。语义检索是对检索条件、信息组织及检索结果显示赋予一定语义成分的一种新的检索方式。语义检索的本质在于以语义为对象进行搜索,而不是对字符串进行简单的机械匹配,因此可避免关键词匹配检索中由于词和义不对应所导致的问题。
语义检索过程一般包括对被检索的文档以及输入的检索式进行语义分析和匹配处理。这种语义分析处理依赖于词汇的语义描述技术以及分别用于词义鉴别和词汇过滤的语义识别技术和词汇链算法。可以通过诸如WordNet等语义词典对词汇实现较完备的语义描述,保证人和机器对词汇的理解一致。
最新发展的潜在语义索引通过将文献搜索过程中的向量空间模型和奇异值分解相结合,可以揭示文档中的词间关系,因而适于构建专利文献搜索引擎”…。利用语义进行检索还可以将专利文献中的非技术性信息考虑在内,例如将特定的技术概念和申请人、发明人等信息进行语义联系。此外,语义检索还可以从用户角度出发,考虑用户的检索需求,从而为诸如查新、侵权等不同目的的检索提供相应的结果。
近年来国内一些开发商也纷纷提供具有语义检索功能的专利文献检索系统,例如东方灵盾开发的专利检索系统和Patenticst网站。Patentics网站除了可以实现传统的关键词检索功能,还支持语义检索,仅通过输入检索所针对的专利文献号,即可自动对其进行语义分析、文献检索,并对结果进行相关度排序。当前专利文献检索领域还未广泛应用语义检索,但随着研究的深入,相信未来的搜索引擎不仅能利用语义技术提高检索的效率,还有望能对检索结果进行分析、评价,甚至自动生成检索报告。
5、图像检索
根据对图像检索所使用方法的特征可以分为基于文本的图像检索法(TBIR)和基于内容的图像检索法(cBIR)。专利文献一般都带有大量的附图,包括机械结构或化学结构式附图、电路图、方框图、流程图或曲线图等。与传统的关键词检索和分类号检索相比,CBIR更加直观、快速,而且可以克服因文字表述差异而导致的漏检,因此它正在成为专利文献检索领域的研究热点。专利文献的附图都是黑白二元图像(本文
所称专利是指发明和实用新型专利,不包括外观设计专利),不存在颜色和纹理等特征,因此专利文献的图像检索主要是基于形状和区域的图像特征。
虽然目前还没有成熟的专利文献图像检索系统,但一些研究机构已经开发出若干可专门用于专利文献的图像检索原型系统,例如IIT Kanpur的PATseek、Informatics and Telematics Institute的PatMediat以及LTUtechnologies公司的ImageSeeker等。PATseek专门针对美国专利文献进行图像检索,而PatMedia网站上的试验系统仅针对欧洲专利局的专利文献,这两个图像检索系统都可实现直接输入待检索的图像,系统自动进行相似度匹配,直接提供专利附图,同时还可以进行基于文本的图像检索。
典型的专利图像检索系统包括专利文献处理部分和图像检索部分,如图1所示:
文献处理部分又进一步包括文献预处理和视觉、文本元数据提取和索引两部分。前者是找出文献中的图形和对应的文字描述;后者则是进一步进行图像特征分析和文本分析,分别提取基本的图像特征以及能够表示图形含义的高层语义特征的关键词,由此分别形成索引后的图形特征矢量库、图像库、文本描述关键词库和知识库。在图像检索部分,基于上述提取的元数据,进行图像相似度匹配,同时还可以基于文本进行图像检索。与一般领域的图形检索相比,由于专利文献中每幅图形一般都对应有文字描述,即使不再进行人工标注或自动标注,都能提取到较好的高层语义特征,这对提高专利文献图形检索的准确性非常有帮助。
目前,专利文献图像检索系统仅处于试验阶段,只能对数量非常少的特定专利文献进行检索,且检索结果相关度还不是很高,但由于图像检索具有其他任何检索方式都不具备的优点,相信随着人们对专利文献图像检索技术的进一步研究以及语义检索技术的进一步发展,实现高精度的图像检索必将成为现实。
6、辅助技术
高质量的专利文献是提高检索质量的基础。专利文献分类、标引和摘要改写是专利文献加工的主要内容。传统的专利文献加工方法主要依赖于人工,其成本高且速度受限制,质量不统一。随着人工智能和计算机技术的发展,开始出现对专利文献进行自动分类、自动标引、自动摘要和自动聚类。
专利文献自动分类已经在欧洲、美国、日本得到了广泛的研究和尝试。例如欧洲专利局已经利用自然语言处理的相关技术实现了专利文献的自动初分类;对日本专利文献自动分类研究表明,对于使用K临近算法进行自动分类的情况下,先将专利文献按部分结构化为语义单元可以提高74%的效率。
PATExpert代表了目前较先进的专利文献自动处理技术的发展,通过基于语义网的语义处理技术实现了面向内容的专利文献自动处理,其中的一个主要技术是利用一定的语义表示结构实现专利文献知识层面的表达。该系统可以执行的处理任务包括:专利文献内容和元数据的自动抽取;全文、图像、相关性搜索引擎;专利文献的自动分类和聚类;面向多语言的辅助理解工具;专利价值自动评估等。
国内有一些研究机构开展了大量的基于IPC体系的专利文献自动分类的研究,这些研究大部分集中在统计分类技术。近年来随着人工智能技术的兴起,基于人工智能或语义的专利文献自动分类发展迅速,例如上文提到的Patentics试验系统也开始尝试对专利文献进行自动分类。
中文专利文献的自动处理仍处于研究阶段,虽然国外专利文献自动处理已经积累了许多宝贵经验,但由于中文表述的特殊性,许多技术还待消化和开发,例如汉语词汇之间的分词技术是制约自动标引质量的一个障碍。随着信息处理自动化相关技术的发展,专利文献的自动分类、自动标引、自动聚类和自动摘要正在逐步由半自动走向全自动化,这给搜索引擎的发展带来了极大的便利。同时,利用语义技术实现基于内容的自动处理将是未来的发展主流,也是提高专利文献自动处理质量的主要手段。
7、结语
专利文献计算机检索是一个涉及了多学科的研究领域,其中以语义检索为核心的技术推动了搜索引擎、机器翻译、图像检索等相关技术的发展,而由于专利文献的特殊性,分类体系和文献自动处理技术也在其中占据了重要地位。随着研究的进一步深入,现存的语言障碍和检索效率低下等缺陷在不久的将来必将逐渐被克服,不同层次的用户有望借助于智能化的自动检索系统便利地实现专业化检索。
第三篇:信息检索技术论文
期末课程论文
论文标题:课程名称:信息检索技术课程编号:学生姓名:潘国伟学生学号:所在学院:计算机科学与工程学院学习专业:计算机科学与技术课程教师:
基于音频的信息检索
1220500 1100310220
王
冲
2013年7月3 日
引言:
进入知识经济时代,知识管理、知识服务的理念得到广泛认同,信息检索技术也由基于关键词的信息检索逐步转向针对内容的基于知识的信息检索。较之前者,其检索结果更准确,更贴近用户需求。信息检索是将信息按照一定的规律组织起来,找到所需信息的过程和技术,简单的说,就是信息的有序化识别和查找。信息检索效率就是实施识别和查找过程的效率。信息检索效率不仅是影响信息检索工具价值的重要因素,也是评价信息检索技术发展的重要指标。目前一些基于文本的Web引擎,如Google,Baidu,功能已非常强大,但还缺乏比较实用的音频搜索引擎。Internet上的多媒体流非常巨大,需要一些高效的搜索引擎从浩如烟海的数据中找出需要的信息。另外,音频检索在辅助视频检索和卡拉OK检索系统以及军事、刑侦领域方面都有巨大的应用价值和广阔的研究前景。
基于内容的音频检基索关键技术
问题:
传统的方法,其主要缺点有:
一是当数据量越来越多时,人工注释的工作量加大;
二是人对音频的感知有时难以用文字注释表达清楚,人工注释存在不完整性和主观性; 三是不能支持实时音频数据流的检索。
这里主要综述了音频检索方法,讨论了一些音频检索中的关键技术:音频特征提取、音频分类、语音识别技术等。总体介绍:
语音识别技术概述
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition, ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
语音识别技术是以语音信号处理为研究对象,让机器接收并识别、理解语音信号,并将其转换为相应数字信号的技术。让机器听懂人类的语言,这是人们长期以来梦寐以求的事情,而语音识别是一门非常复杂的交叉性学科,它涉及语音语言学、计算机科学、信号处理学、生理学、心理学等一系列学科,是模式识别的重要分支。50年代,是语音识别研究工作的开始时期,它以贝尔实验室研制成功可识别十个数字的Audry系统为标志。20世纪80年代语言识别研究进一步走向深入,基于特定人孤立语音技术的系统研制成功。在过去的30年里,隐马尔可夫模型和人工神经元网络在语音识别中得到了成功的应用。
语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。并通过算法和计算机技术相结合的方式来实现。目前,这样的系统能够做到识别理解数十万条词汇的连续语音信号。这种现代模式识别系统除了在语音领域的应用外,还可以广泛应用于信号处理和模式识别的其他领域。语音识别一般分为两个步骤:
学习和识别阶段。学习阶段的任务是建立识别基本单元的声学模型以及语言模型。识别阶段是将输入的目标语言的特征参数和模型进行比较,得到识别结果。语音识别系统本质上讲是一种模式识别系统,其原理如下图所示:
图1语音识别原理示意图
语音信号的获取
计算机声卡作为语音信号与计算机的接口卡件,其最基本的一项功能就是A/D转换。声卡是pc的一种多媒体设备,可以用windows的MCI(Media Control Interface)命令来控制声卡。
图3信号获取过程中相关函数使用流程示意图
音频检索的基本方法
音频检索第一步是建立数据库,对音频数据进行特征提取,并通过特征对数据聚类。音频检索主要采用示例查询方式(Query by example),用户通过查询界面选择一个查询例子,并设定属性值,然后提交查询。系统对用户选择的示例提取特征,结合属性值确定查询特征矢量,并对特征矢量进行模糊聚类,然后检索引擎对特征矢量与聚类参数集匹配,按相关性排序后通过查询接口返回给用户。相似音频例子检索
相似音频例子检索是指基于用户提交的查询音频,得到最相似的音频,即计算音频特征的距离。对音频数据提取特征后,假设共N个特征,则形成了一个N维特征矢量的序列。为了缩减数据量而又不失掉每个音频原来的特征,可以对N维特征矢量进行聚类,提取出固定数目的质心来表示音频,即用聚类质心来为音频建立索引。一般采用模糊聚类法,模糊聚类首先要对N维特征矢量进行归一化,一般采用高斯归一化。音频分类识别
音频分类是判断一个给定样本所在的类别,其任务是通过相似度匹配算法将相似音频归属到一类,属于模式识别的问题。首先应提供适量的训练样本,比如选取足量的音乐文件,然后提取样本特征,类似如上所述进行聚类处理,不同的是将每类的全体文件看成一个音频数据来处理,计算该类的样本模板。
判断文件的类别时,与计算音频相似度类似,计算音频的模板与各类模板间的距离,当距离小于某一阈值或为最小距离时,则此时的类即为文件所在的类。结
语
本文阐述了基于音频检索的一些常用技术及相关问题,包括音频特征提取、相似音频检索及音频分类。基于音频检索是一个涵盖十分广泛的研究领域与想好处理,人感知心理研究,语音识别等科学密切相关。为使计算机与人一样能自动对音频语义实现自动理解并根据语义高级内容进行音频检索,还要面临很大挑战。参考文献:
[1] 卢 坚, 陈毅松, 孙正兴, 等.基于隐马尔可夫模型的音频自动分类[J].软件学报, 2002, 13(8): 1 593-597.[2] 庄越挺, 潘云鹤, 吴 飞.网上多媒体信息分析与检索[M].北京:清华大学出版社,2002.[3] 李国辉,李恒峰.基于内容的音频检索:概念和方法[J].小型微型计算机系统, 2000,(11): 1 173-1 177.[4]尹江艳.基于HMM和ANN语音识别研究[J].2007.4:14 [5] 柳春 语音识别技术研究进展[J] 甘肃科技 2008/09 [6刘幺和 语音识别与控制应用技术[M] 北京科学出版社 2008
文中涉及的公式:
Em1N[x(n)]m2
频率中心 是度量声音亮度(brightness)的指标,计算公式为
WFC0F(w)wdw/E
第四篇:信息检索论文
应用化学
化学与化工信息检索论文
题目:造纸污水处理技术现状及进展
学生姓名------学号--------专业应用化学指导教师----
2010年12月 25日
造纸污水处理技术现状及进展
摘要:本文在查阅相关资料的基础上,介绍了国内外的造纸废水处理的常用方法,并对各种方法进行了评价和分析,综述了造纸废水处理研究的现状和进展。
关键词:造纸;废水处理;治理技术
随着造纸工业的迅速发展,造纸工业废水已经成为水环境的重要污染源之一。在造纸过程中,除纤维素和部分半纤维素之外的大量有机物要进入废水中,并且即使经过充分的废液回收利用,也还是或多或少地会有一些纤维素和半纤维素流失进入废水中。含有大量有机物的造纸废水排入水体,对水体会造成不同程度的污染。同时造纸过程中通常还需要加入一些必要的化学药剂和化学助剂,这些物质流失进入水体中更是加重了水体污染[1]。造纸工业的漂白工段通常是采用含氯化合物漂白,导致排出的漂白废水中含有大量的氯化有机物,其中的氯苯酚、氯化脂肪酸、氯化树脂酸、dioxin等有毒且难以处理的氯化有 机物,对环境中的生物具有强烈的毒害、致畸、致多发性脑神经病变作用[2],因此如何有效地去除造纸废 水中的含氯有机物已经成为废水处理的一大难题。本文在查阅大量文献资料的基础上主要介绍国内外处理造纸废水的方法和新技术,并就国内外治理造纸废水的现状和未来的发展前景加以评述。
1概况
据经贸委粗略估计,目前我国大小造纸厂约有近万家。造纸工业总的特点是:使用原料种类多、生产工艺类型多、中小企业多、技术装备落后者多。调查统计表明,造纸工业废水年排放总量达17亿t,占工业废 水总排放量的10以上。造 纸工业废水主要包括黑液或红液(蒸煮制浆废水)、中段废水(制浆洗涤、筛选、漂白废水)、造纸 白水(抄纸废水)三大类,其中蒸煮黑液的环境污染最为严重,占整个造纸工业污染的90%。制浆废水 BOD、COD、SS、pH、色度、浊度等均严重超标;中段废水成分与制浆废水相近,但浓度低,富含漂白工段产生的对环境危害最大的有机氯化物;抄纸废水中主要含有细小纤维、填料(高岭土等)和胶料(松香等),BOD值较低。造纸工业废水的治理是国内外造纸行业亟待解决的难题[3]。
2治理方法
2.1物理化学法
物理化学法是通过物理或者化学反应的作用来达到去除废水中的污染物的目的,主
要有以下方法:
2.1.1臭氧法
臭氧氧化技术已问世多年,近年来,由于低成本的臭氧发生装置和臭氧处理装置的出现而重新成为研究热点。臭氧(O3)是一种强氧化剂,O3作为两性离子,能选择性地分解发色基团。安郁琴[4]将经过化学混凝处理后和经过化学混凝过滤吸附处理后的麦革浆黑液利用臭氧法处理,处理 20分钟后脱色率可以达到 82.1%,但 CODCr去除率仅 15.8%,BOD5去除率为24.8%,Ff1此可见,臭氧脱色效果显著,但对 CODCr和 BOD5的去除效果不明显。臭氧在水中的溶解度较低,如何更有效地使臭氧溶解于水中从而提高其利用率已经成为该技术研究的热点。使用臭氧法也会产生其它副产物,其中最受关注的是羰基化合物中的醛类,比如甲醛、乙醛,这些物质具有急性毒性和慢性毒性,并具有一定的致畸、致癌、致突性。
2.1.2光催化氧化
光催化氧化技术是近年来比较活跃的研究领域,光催化氧化技术是在光化学氧化技术的基础上发展起来的。张志军等[5]利用中压汞灯作光源,研究了氯代二苯并一对一二哑英(CDDS、包括DCCD、PcDD和OCDD)在 TiO2催化下的光解反应,在室温下,4h内DCCD、PCDD和OCDD分别降解87.2%、84.6%和91.2%。M.Cristina Yeber等
[6]将 TiO2、Zno同定在玻璃上,对漂白废水进行了光催化氯化处理,处理 120min后,废水的色度可完全去除,总酚含量减少了85%,TOC减少了50%,处理后残留有机物的急性毒性和AOX比处理前大为减少,高分子化合物几乎全部降解。
2.1.3混凝法
混凝法是目前国内外重点研究的方向之一,该法适应性强、基建投资低、管理简单,是水处理常用的方法,在造纸行业的废水处理中使用普遍。造纸废水中由于含有大量纤维和化学药剂,所以一般在处理造纸废水时首先要用混凝法除去这些物质。张学洪、解庆林[9]等利用聚合氯化铝处理广西某造纸厂的造纸终端废水(CODcf=400mg/L),处理后可以达到国家污水排放标准(CODcf<100 mg/L)。黄国林、乐长高等[1O]利用水溶性酚醛树脂和硫酸反应得到的聚合物处理抚州某造纸厂制浆车间排污口的废水,在最佳工艺条件下反应时,CODc和ss去除率分别可以达到80%一85%和 90% 一95%,处理水可以达到排放标准。
2.2 生物法
废水的生物处理方法就是利用微生物的新陈代谢功能使废水中呈溶解状和胶体状的有机污染物被降解并转化成无害稳定的物质,使废水得到净化。生物法处理废水因其运行成本低,效果较好而在废水处理中得到了广泛应用。造纸废水中含有大量有机物质,废水的可生化性较好,可以为生物法的微生物提供大量的营养物质,从而能保证微生物的正常生长繁殖和生物法处理废水的正常运行。利用生物法对造纸废水进行二级处理可有效去除BOD、COD。造纸废水生物处理法主要有以下几种:
2.2.1好氧生物处理法
利用好氧微生物(主要为好氧菌)的新陈代谢作用来降解污染物,其中应用最多的主要是活性污泥法,我国的科研人员对活性污泥法处理造纸废水进行了大量的研究,取得了许多成功的经验。造纸废水中的木素是不易生物降解的物质,活性污泥对木素具有极好的吸附性能,通过生物降解和活性污泥吸附作用,可达到除去木素的目的,从而降低溶解木素的浓度。芬兰OULU纸浆厂[11]利用活性污泥法加污泥曝气再生处理漂白硫酸盐纸浆废水,可使BOD去除率达 90%,COD去除率达84%。活性污泥法由于其处理成本低、易于管理、处理效果较好而在废水处理中的应用越来越多。
2.2.2生物膜法
相对于活性污泥系统而言,生物膜系统具有如下显著优点:高容积负荷、更强的抗毒能力和耐负荷冲击能力、无须污泥回流且处理设施紧凑。朱光灿、吕锡武等[12]研究了采用脱木素—缺氧—好氧生物膜工艺处理造纸废水。其中的脱木素工艺可有效地将黑液中碱木素脱稳析出,并提高废水的可生化性,当废水 pH=5,绝干纤维污泥与废水 COD质量之比为 1.1,硫酸铝投加量为 160m g/L时,COD去除率大于 63%。生物法在利用微生物处理造纸废水时候,如果造纸废水中含有大量不利于微生物生长的物质时候,生物法处理效果较差,因此在制浆造纸过程中可以通过改变漂白剂的种类,提高造纸废水的可生化性,使其更利于生物法处理。
2.3 其他方法
2.3.1电化学法
利用电化学法进行废水的处理是电化学法获得应用的典型领域。通过电化学反应中的直接或者间接氧化和还原作用,可以破坏有毒或难降解有机物的结构,去除其生物毒性,提高其可生化性。电化学法处理废水一般无需加入化学药品,后处理简单,占地面积小,管理方便,被称为清洁处理法。景峰、王耀新、朱文菊等将电化学和凝聚沉淀法两种方法联合起来处理造纸废水,使造纸废水COD去除率达到55%~70%,色度去除,率达90%~95%[13]。目前关于电化学法的许多问题特别是降解机理、处理速度和经济
性问题尚未完全解决,电化学处理废水电耗较高,使该方法的工业应用受到限制。
2.3.2湿式空气氧化法
湿式空气氧化法是目前研究较多的新型处理方法,即在高温、高压下在液相中利用空气或者氧气作为氧化剂,将废水中的有机物氧化成二氧化碳和水,从而达到去除污染物的目的。国内从80年代开始进行湿式空气氧化法的研究,先后进行了造纸黑液、含硫废水、酚水及煤制气废水、农药废水、印染废水等的实验研究,目前,湿式空气氧化法在国内尚处于试验阶段。与常规方法相比,湿式空气氧化法具有适用范围广、处理效率高等优点。但由于湿式空气氧化法一般要求在高温高压的条件下进行,对设备材料的要求较高,须耐高温、高压并耐腐蚀,因此设备费用高,系统的一次性投资大,在实际推广应用方面仍存在着一定的局限性。
2.3.3超临界水氧化法
在处理难降解有机废水方面,超临界水氧化技术是目前研究较为活跃的新技术。由于超临界水气液 相界面消失.成为一均相体系,因而超临界水中的有机物反应速度极快。Model等[14]对有机炭含量达 27.33 g/L的废水进行超临界水氧化处理,在实验条件下,1分钟内就使有机氯和有机炭的去除率分别达到99.99%和99.97%。超临界水氧化技术具有良好的工业应用前景,但是由于对反应条件要求较为苛刻(高温、高压),对设备要求偏高,因此还有一些实际的技术问题需要解决。造纸废水治理技术展望
随着全球可持续发展战略的实施,循环经济和 清洁生产技术越来越受到人们的关注,造纸工业废水治理从末端治理向清洁生产工艺、物质循环利用、废水回用综合防治方向发展。未来造纸工业废水治理将突出以下几个方面:
(1)贯彻循环经济理念、重视清洁生产技术的开发与应用,提高物质的转化率和循环使用率,从源头上削减各污染物的产生量并在厂内将大量废水循环回用,实现封闭循环,结合废水综合治理,最终实现废水零排放。
(2)综合目前国内外技术发展情况,应重视开发和引进先进的治理技术:重视黑液 处理技术(主要为碱 回收 技术)、重 视 SS、BOD、COD 的去除技术及脱色技术。
(3)应重视 生物处理方法在造纸工业废水处理中的应用,生物技术具有成本低、效益高、与其他方法组合可大大提高造纸废水的处理率,随着分子生物学技术、物种微生物技术的发展和应用,具有高效、耐毒性的菌种不断培育成功,为生物技术的广泛应用提供了前提条件。
(4)人工湿地处理系统作为一种成本低廉、节能降耗、简单易行、效果显著、无二次污染的废水处理技术,是造纸废水处理的新方法[15]。
(5)废纸造纸企业均存在诸多设计、建造、管理问题,阻碍废水回用现状的进一步改善。节水空间仍然很大。生产过程中,应加强管理,培养员工节水意识。调动员工积极性,根据实际生产经验,提出合理的回改进措施[16]。
参考文献
[1] 张 珂,陈仁锐。丁明秀,等.造纸工业污染防治技术与环境管理[M].北京:轻工业出版社,1988.14-15.
[2] 谢 澄,陈中豪,疏明君,等.生物流化床~化学絮凝法处理纸浆漂白废水[J].工业用水与废
水,2002,33(I):27-30.
[3] 黄夏银,冯彬.造纸废水处理技术研究现状及展望[J].污染防治技术,2004,12:17(4):9-11.
[4] 刘全校,安郁琴.臭氧 用于治理造纸废水.纸和造纸,2000,7:44.
[5] 张志军,包志成,王克欧.二氧化钛催化下的氯代二苯并一对一二哑英光解反应[J].环境化学,1996,15(1):47.
[6] M Cfistina Yeber,Jaime Rodrlguez,Juanita Freer,et a1.Photocatalytic Degradation of
C:ellulose Bleaching Effiuent by supportedTiO2 andZ 0.C卜lEM0sPERE2000,41:1193.
[9] 张学洪,解庆林,李金城,等,造纸废水的混凝处理研究[J].桂林工学院学报,2000,(4):
189-191.
[10] 黄国林,乐长高,粱平.利用聚合物处理造纸废水的研究[J,环境科学与技术,1997,(1):
24—26.[11] 范懋功.活性 污泥法处理造纸废水….给水排水,1996,22(12):29—31.
[12] 朱光灿,吕锡武,宋海亮,等,脱木素一缺氧一好氧生物膜工艺处理造纸废水试验研究[J],给水排水,2004.30(1):56—59.
[13] 景 峰,王耀新,宋文菊,试论电化学一凝聚法处理造纸废水[J].黑龙江环境通报,2000,24(2):
81—82.
[14] Model M.Processing Methods for the Oxidation ofOrganics in Supercritical Water『P1.US
Patent:4543(9).1 985.09.24.
[15] 朱光灿,吕锡武,宋海亮,等,造纸废水治理技术研究现状及展望[J],污染防治技术,2004.17(4):14.
[16] 张金红,废纸造纸废水回用工艺现状及改造实例[J],湖北造纸,2010.3:38.
第五篇:信息检索论文
关于数字化学习资源利用的思考
人资1W 学号:10213103
姓名:陈磊 班级:10摘 要:随着教育信息化工程的整体推进,要求数字化学习资源的建设也要同步地向前发展。正确认识数字化学习资源建设的现状,并提出正确有效的举措与做法,对于数字化学习资源的建设具有重要的指导作用。
关 键 词:数字化学习资源、发展趋势、应用与开发、质量监控
一、关于数字化学习资源的内容———要关注国际上教育思想的转变
1.1在考虑数字化学习资源建设的过程中,首先应当看到,从上世纪90年代末到本世纪初这几年间,整个国际教育界的教育思想有一个大的转变。[1] 由于在网络环境下既有丰富的学习资源,又有很强的交互性,便于自主学习、自主探究,所以,随着网络的普及,在建构主义理论的支持下,基于网络的“以学生为中心”的教育思想在上世纪90年代初期、中期甚至到90年代末都一直很流行,而传统的“以教师为中心”的教育思想则受到严厉的批判。与此同时,在教学过程中教师必不可少的主导作用(如正确的启发引导、重点与难点的分析把握、促进新知与旧知之间的联系等等)也被当作糟粕扔掉了。
与国际教育界上述教育思想观念的转变相适应,数字化学习资源建设的内容也要相应地实现由支持“以教为主”或“以学为主”,转变为支持“学教并重”。1.2 支持“以教为主”的数字化学习资源,由于其主要关注点是辅助教师解决教学中的重点、难点,提高教学效率,更好地向学生传授知识(而对学生自主学习、自主探究等活动则缺乏相应的关注与支持),故其内容强调要为一线教师的学科教学提供多媒体课件、CAI课件、典型课例、教学设计方案和各类试题等资源;支持“以学为主”的数字化学习资源,由于其主要关注点是要促进学者的自主学习、自主探究活动和小组的协作学习、协作探究活动(而对如何辅助教师的“教”,则缺乏相应的关注与支持),故其内容应是能起认知探究工具作用与协作交流工具作用的数字化学习资源。
二、关于数字化学习资源的管理———要关注两个新的发展趋势
关于数字化学习资源的管理,有两个新的发展趋势值得我们关注。
2.1目前对数字化学习资源的管理,主要考虑的问题是如何通过数据库存储方式对学习资源的数据内容进行有效的管理,但管理数字化学习资源的最终目的,是为了能在教学过程中充分地利用这些资源。所以,我们在建设数字化学习资源的过程中不仅应当关注学习资源的数据内容管理,同时也应当关注(甚至更应当关注)学习资源应用环境的支持与管理。
学科群资源网站是以不同学科的数字化学习资源为核心,建设起一个集资源共建共享、在线课件开发、联机备课、学科信息发布、互动交流等功能于一体的多学科、多层次的学科网站群,目的是使数字化学习资源的利用能更加符合教师和学生的思维方式与行为习惯。
2.2目前,绝大部分省、市或地区的数字化学习资源都是分散存储于该省、市的各个学校或该地区的不同学习资源网站上,应当采用何种机制才能对分散存储的资源进行有效管理并进行共建、共享,这是数字化学习资源建设关注的焦点之一。我们认为,建立“区域内分布式资源网络管理系统”是有效解决大范围数字化学习资源整合与共享问题的较佳方案。建设区域内分布式资源网络管理系统的核心技术包括两项内容:
2.2.1对资源目录的集中管理
本地区的学习资源中心(例如省电教馆)要为广大用户提供一个能覆盖本地区所有数字化学习资源网站的资源目录管理系统,以便本地区不同学习资源网站之间的互相访问与资源共享。而且,还要有专人对该资源目录系统进行经常性维护,从而达到本地区范围内各资源站点目录的同步更新与统一管理。与此同时,系统还应提供专用的教学搜索引擎,以实现对不同资源站点上相关信息的快速查询与检索;当用户需要打开某个资源时,资源目录管理系统应提供重定向功能 2.2.2对资源数据的分布式存储
数字化学习资源网络系统是由多个资源站点组成的,资源网内每一个提供资源信息服务的站点都是资源网中的一个节点———用于存储实际的物理资源,资源节点之间基于一定的信任授权关系进行资源互访,资源元数据信息与本地区学习资源中心目录管理系统中的目录信息保持同步,因此可以实现网络系统内数字化学习资源的分布式存储和集中式管理,并在本地区范围内提供广泛的基于共享的数字化学习资源服务。
三、关于数字化学习资源的质量监控———评审机制的建立和实施
3.1当前数字化学习资源的建设呈无序状态,很多单位在组织资源建设时,只注重数量而忽视质量。应该通过建立有效的数字化学习资源评审机制,并提高评审结果的科学性和权威性来规范资源建设行为。与此同时,还应制定具有可操作性的数字化学习资源评价指标体系,这种评价指标的制定要突出数字化学习资源的教育特性和新课程标准对学习资源的要求,并要以素质教育和创新教育为基本出发点。3.2 为了保证数字化学习资源评审的科学性与有效性,应当采用专家评审与群众(用户)评价相结合的方式。
专家评审应建立包括几方面专业人员的评审小组,通常应该包括学科教学专家、教育技术专家、信息技术人员、统计人员(对资源评审结果进行统计)等。在整个评审过程中每个成员应各司其职,把好相应环节的质量关。
群众(用户)评价从时间上看,分为使用前评价和使用后评价两种。使用前评价是根据事先制定的数字化学习资源评价指标体系,为不同用户编写不同的问卷来获取评价信息及相应的得分———使用前的评价得分。使用后评价则主要依据公开发布该资源后被引用情况的统计信息(如被点击次数、被下载次数、被引用次数等)以及用户使用该资源后在网上的评论信息,把二者结合起来(即把被引用情况的统计信息和网上的评论信息结合起来)进行综合评价,才能得出相应的得分———使用后的评价得分。再对使用前评价和使用后评价所产生的两种得分作加权统计———由此即可得出群众(用户)评价的总得分。
最后,将专家评审的结果与群众(用户)评价的总得分二者结合起来,这才是能够保证数字化学习资源评审科学性与有效性的最终结果,并可以此作为确定该数字化学习资源评价等级以及收费标准的主要依据。
【参考文献】
[1]何克抗,从Blending Learning看教育技术理论的新发展[J].电化教育研究,2004,(3):1~6.2