网络信息检索技术(5篇材料)

时间:2019-05-14 20:52:58下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《网络信息检索技术》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《网络信息检索技术》。

第一篇:网络信息检索技术

网络信息检索技术

网络信息检索中,基本的检索技术有布尔逻辑检索、截词检索、位置检索、限制检索等。

一、布尔逻辑检索

逻辑检索是一种开发较早、比较成熟、在信息检索系统中广泛应用的技术。布尔逻辑检索就是采用布尔关系运算符来表达检索词与检索词之间逻辑关系的检索方法,目前最常用的布尔逻辑运算符主要包括逻辑“与”(AND)、逻辑“或”(OR)、逻辑“非”(NOT)。

(一)逻辑“与”

逻辑“与”,也称为逻辑乘,用AND表示,是用来组配不同含义检索词之间的限定关系。检索词A、B以AND(或“*”)相连,即A AND B(或A*B),表示同时包含A、B两词的文献才是命中记录,因而逻辑“与”运算用于对检索词进行限定,从而缩小检索范围,提高检索结果的查准率。

例如,要查找children education(儿童教育)方面的文献,检索逻辑式可表示为“children * education”或者“children AND education”。运算的结果是同时含有检索词children和检索词education的文献才被检索出来。

(二)逻辑“或”

逻辑“或”,也称为逻辑加,用OR或者“+”表示,是用来组配同义或者同族检索词之间的并列关系。检索词A、B若以OR或“+”相连,即A OR B(或A+B),表示只要含有A、B之一或者同时包含A、B的文献都是命中记录。因而逻辑“或”运算可用于扩大检索范围。

例如,要查找“汽车”方面的文献,因为汽车在英语中可以用car或者automobile表示,所以为了将有关汽车的文献全部检出,避免漏检,检索逻辑式就可表示为“car OR automobile”或者“car + automobile”。运算的结果是含有car或者automobile任意一个或者同时两个的文献均被检索出来。

(三)逻辑“非”

逻辑“非”用NOT或者“-”来表示,是用来组配概念的包含关系,可以从原检索范围中排除一部分,因而使用逻辑“非”运算可以缩小检索范围。检索词A、B若以NOT(或“-”)相连,即A NOT B(或A-B),表示只含有检索词A而不含有B的文献才是命中记录。逻辑“非”可用于缩小检索范围,但是不一定能提高文献命中的准确率。在使用时要注意,避免将相关的有用文献排除在外。

例如,要查找有关“energy(能源)”,但又不涉及“nuclear(核能)”方面的文献,检索逻辑式可表示为“energy NOT nuclear”“energy-nuclear”。运算的结果是含有energy,但不含有nuclear的文献将被检索出来。

这三种逻辑式的文氏图如下:

图3-1布尔逻辑文氏图

上面三种检索逻辑式是最为简单的布尔逻辑运算。在检索实践中,可以根据实际需要,组合使用多个布尔运算符,以准确表达检索主题。

布尔逻辑检索与人们的思维习惯一致,表达清晰,方便用户进行扩检和缩检,而且易于计算机实现,因此,在计算机信息检索系统中得到广泛使用。但是它无法反映检索词对于检索的重要性,无法反映概念之间内在的语义联系,因而检索结果不能按照用户定义的重要性排序输出。

使用布尔逻辑运算符的注意事项:

布尔逻辑检索在联机检索、光盘检索和网络检索中都有广泛的应用,但是不同的检索工具的布尔逻辑检索技术存在一定的差异,因此,使用布尔逻辑检索需要注意以下问题:

1、布尔逻辑检索的执行顺序。三种布尔逻辑检索运算符之间的运算顺序为NOT、AND、OR。有括号时,先执行括号内的逻辑运算。

2、不同检索工具的布尔逻辑检索有不同的表现形式和使用规则。首先,不同检索工具表示布尔逻辑关系的符号不同,有的用“+”、“-”表示AND、NOT,有的用ANDNOT代替NOT(如Excite搜索引擎),有的要求运算符必须大写,有的则要求为小写形式;其次,不同检索工具的检索词之间的默认布尔逻辑关系不同,有的检索工具检索词之间的默认关系是AND,有的检索工具的检索词之间的默认关系是OR;此外,不同检索工具支持布尔逻辑的方式不同,有的检索工具使用符号来实现布尔逻辑关系,一些检索工具则完全省略了任何符号,直接用文字和表格来体现不同的逻辑关系,如用All of These Words表示AND,用Any of These Words表示OR,用None of These Words表示NOT。

二、截词检索

截词检索是指在检索式中使用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化,用检索词的词干或不完整的词形查找信息的一种检索方法。并认为凡满足这个词局部中的所有字符的文献,都为命中的文献。在实际检索的过程中,为了减少检索词的输入量,同时又扩大检索范围,保证查全率,可以使用截词检索。

截词的方式有多种。按截断的位置来分,可分为后截断、中截断和前截断;按截断的字符数量来分,可分为有限截断和无限截断。有限截断是指说明具体截去字符的数量,通常用“?”表示;而无限截断是指不说明具体截去字符的数量,通常用“x”表示。

(一)后截断

后截断是最常用的截词检索技术,是将截词符号放置在一个字符串右方,以表示其右的有限或无限个字符将不影响该字符串的检索,是一种前方一致的检索。这种方法可以省略输入各种词尾有变化的检索词的麻烦,有助于提高查全率。

例如,输入“inform x”,则前6个字符为inform的所有词均满足条件,因而能检索出含有informant、informal、information、informative、informed、informer等词的文献。而输入“inform??”,可检索出含有inform、informal、informed、informer的文献。(二)前截断

前截断是将截词符号放置在一个字符串左方,以表示其左方的有限或无限个字符不影响该字符串检索,是一种后方一致的检索。这种检索方法在各种词头有变化的复合词的检索中应用比较多,有助于提高查全率。

例如,输入“x magnetic”,可以检索出含magnetic、electro-magnetic等词的文献。

(三)中截断

中截断是把截断符号放置在一个检索词的中间。一般地,中截断只允许有限截断。中截断主要解决一些英文单词拼写不同,单复数形式不同的词的输入。

例如,输入“c?t”,可以检索出含有词cat、cut的文献;输入“mod?ation”可以检索出含有词moderation、modernization、modification的文献。

利用截词检索技术可以减少检索词的输入量,简化检索,扩大检索范围,提高查全率。但是,不同的检索工具有不同的截词规则,使用的截词符号也没有统一的标准,如Dialog系统用“?”,BRS系统用“$”,ORBIT系统用“#”等。

三、位置检索

位置检索,也称临近检索,主要是通过位置运算符来规定和限制检索词之间的相对位置或者检索词在记录中的特定位置来实施检索的技术。这里我们只介绍位置检索中的词位置检索。

词位置检索主要是利用位置逻辑算符限定检索词之间的位置,来反映要检索的信息概念。常用的词位置算符有(W)与(nW)、(N)与(nN)以及(X)与(nX)三类。

(一)(W)算符与(nW)算符

(W)算符是Word和With的缩写,它表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或字母,且词序不能颠倒。(nW)算符的含义是允许在连接的两个词之间最多夹入n个其他单元词。

例如,“VISUAL(W)FOXPRO”可以检出

VISUALFOXPRO 或VISUAL FOXPRO;“control(1W)system”可以检出含有contro1 system、control of system和contro1 in system的文献。

(二)(N)算符与(nN)算符

(N)算符是Near的缩写,它表示在此算符两侧的检索词必须紧密相连,所连接的检索词之间不允许插入任何其他单词或字母,但词序可以颠倒。(nN)算符表示在两个检索词之间最多可以插入n个单词,且这两个检索词的词序任意。

例如,“control(1N)system”不仅可以检出含有control system、control of systcm和control in system 的文献,还可以检出含有system of control、system without control等的文献。

(三)(X)算符与(nX)算符

(X)算符要求其两侧的检索词完全一致,并以指定的顺序相邻,且中间不允许插入任何其他单词或字母。它常用来限定两个相同且必须相邻的词。(nX)算符的含义是要求其两侧的检索词完全一致,并以指定的顺序相邻,两个检索词之间最多可以插入n个单元词。

例如,“side(1X)side”可以检索到含有side by side的文献。

四、限制检索

限制检索是通过限制检索范围,从而达到约束和优化检索结果的一种方法。限制检索的方式有多种,常用的有字段限制检索和限制符限制检索。

(一)字段检索

数据库记录是由若干个字段组成的,字段检索是把检索词限定在数据库记录的特定字段中的检索方法,如果记录的相应字段中含有输入的检索词则为命中记录。字段限制检索可以缩小检索范围,提高查准率。

数据库中提供的可供检索的字段通常分为基本索引字段和辅助索引字段两大类。基本索引字段表示文献的内容特征,有TI(篇名、题目)、AB(摘要)、DE(叙词)、ID(自由标引词)等;辅助索引字段表示文献的外部特征,有AU(作者)、CS(作者单位)、JN(刊物名称)、PY(出版年份)、LA(语言)等。在检索提问式中,可以利用后缀符“/”对基本索引字段进行限制,利用前缀符“=”对辅助索引字段加以限制。例如,“(information retrieval/TI OR digital library/DE)AND PY=2006”所表达的检索要求是,查找2006年出版的关于信息检索或数字图书馆方面的文献,并要求information retrieval一词在命中文献的TI(篇名)字段中出现,digital library一词在DE(叙词)字段中出现。

(二)限制检索

限制符检索是使用AU(作者)、CS(作者单位)、JN(刊物名称)、PY(出版年份)、LA(语言)等限制符号从文献的外部特征方面限制检索范围和检索结果的一种方法。限制符的用法与后缀符相同,而它的作用则与前缀符相同。

例如,“aircraft/TI,PAT”表示检索结果只包含aircraft这一主题的专利文献。限制符还可以与前、后缀符同时使用,这时字段代码与限制符之间的关系是逻辑“与”,即最终的检索结果应同时满足字段检索和限制符检索两方面的要求。

第二篇:论网络信息检索技术

论网络信息检索技术

摘要:20世纪以来,人类创生的信息量高速增长,浩如烟波。如何从这海量的信息里找出所需信息就成为信息检索的重任。随着网络技术的飞速发展,越来越多的人把因特网作为获取日常信息的重要手段。掌握信息检索的方法与技巧是非常有必要的,人们对快速、准确、有效地获取网络信息资源的需求是急切的,人们对网络信息的检索技术及其发展趋势进行探讨和研究,也是迫切而实用的。针对网络信息检索的各种方法与技巧进行了客观的分析与思考,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。关键词:网络、信息检索、检索技术、工具

0 引言

进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。

什么是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。

信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。网络信息检索的现状以及策略

在这个高速发展的信息时代的社会,随着网络技术的飞速发展,越来越多的人把因特网作为获取日常信息的重要手段。用网络搜索一些信息,如了解时事、生活疑惑、寻医问病、自娱自乐等,通常都比较方便快捷。然而,网络信息资源相当丰富,多种多样,当人们进行专业信息检索时,结果往往不尽如人意。即便是经常上网高校的老师与学生也有常常搜索不到专业文献信息的时候。

由于信息资源数量庞大、各信息间又相互交叉渗透,使得一些科研课题资料的检索相当的有难度,因此,我们必须掌握合理的检索策略,这样才能保证我们能有满意的检索效果。所谓检索策略,就是正确的选择检索词、科学合理的提问等。首先应对要检索的内容进行细致的分析,将完整的主题分为一个个独立的检索概念,然后要注意选全、选好相关词。在检索英文资料时,还要注意英美不同的拼写形式以及检索词的单复数形式、缩写形式等,然后采用布尔逻辑的原理,将表达相关概念的各检索词组配起来,以转换成搜索引擎可以理解的信息提问式,在对其数据库进行搜索后,便可获得相应的结果。因特网上的信息浩繁庞杂,一些有价值的专业信息被大量无用信息所淹没,要想系统的、全面的、准确的获取有价值的信息,就需要学会科学的制定信息技术策略。

2网络信息检索的原理及方法

网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。

网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。

①布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。

②模糊逻辑模型——它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。

③ 概率模型——它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。

要在网上获取信息,我们就需要找到提供信息源的服务器。首先找到各个服务器在网上的地址,然后通过该地址去访问服务器提供的信息。大致有以下几种方法: 2.1漫游法

这是在因特网上发现、检索信息的原始方法。即在日常的网络阅读、漫游过程中,意外发现一些有用信息。这种方式的目的性不是很强,具不可预见性和偶然性。

用户在阅读超文本文档时,利用文档中的链接从一网页转向另一相关网页。此方法类似于传统手工检索中的追溯检索,即根据文献后所附的参考文献追溯查找相关的文献,从而不断扩大检索范围。这种方法可能在较短的时间内检出大量相关信息,也可能偏离检索目标而一无所获。2.2直接查找法

直接查找法是已经知道要查找的信息可能存在的地址,而直接在浏览器的地址栏中输入其网址进行浏览查找的方法。此方法适合于经常上网漫游的用户。其优点是节省时间、目的性强、节省费用,缺点是信息量少。2.3搜索引擎检索法

此方法是最为常规、普遍的网络信息检索方法。搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。它一般支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快、范围广,能及时获取新增信息。其缺点是:由于采用计算机软件自动进行信息的加工、处理,且检索软件的智能性不很高,造成检索的准确性不是很理想,与人们的检索需求及对检索效率的期望有一定差距。

2.4网络资源指南检索法

此方法是利用网络资源指南进行查找相关信息的方法。

网络资源指南类似于传统的文献检索工具————书目之书目或专题书目,其目的是可实现对网络信息资源的智能性查找。它们通常由专业人员在对网络信息资源进行鉴别、选择、评价、组织的基础上编制而成,对于有目的的网络信息检索具有重要的指导作用。其局限性在于:由于其管理、维护跟不上网络信息的增长速度,使得其收录范围不够全面,新颖性、及时性不够强,且用户还要受标引者分类思想的限制。2.5 在线数据库查询

利用网上的在线数据库进行查询。访问网络数据库是用户获取学术性信息的最有效方法。网上在线数据库有很多,比如:超星数字图书馆、万方数据库资源系统、中国维普数据库、CNKI中国期刊网数据库等。

3网络信息检索详论

3.1网络信息检索方式

其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式

只要能够进入html就能够通过浏览器,利用HTTP协议提供的万维网服务,浏览接触页面和通过Web页面提供的检索方式访问数据库。

(2)搜索引擎方式

搜索引擎是internet提供公共信息检索服务的Web站点,它是以一定的技术和策略在internet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以web形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。3.2网络信息检索工具

从20世纪80年代起人们就开发了诸如Archive、WAIS、Veronica等检索工具,从90年代中期起又出现了检索万维网络信息资源的搜索引擎技术,并以此构造检索所有各类网络信息资源的集成化支撑体系。据统计,各种各样的Internet网络信息检索工具已有数千个,按这些工具的检索机制、检索内容范围,以及检索工具的数量、检索资源类型,可将它们划分为以下各类:

(l)按检索机制划分

根据检索工具的数据检索机制,可将检索工具分为检索型、目录型和混合型检索工具。(2)按检索内容划分

根据检索工具的数据内容,检索工具可分为综合型、专题型和特殊检索工具书。(3)按包含检索工具数量划分 根据检索工具数量划分,检索工具可分为单独型和复合型检索工具。(4)按检索资源类型划分

根据检索工具针对的数据资源类型,可将检索工具分为万维网检索工具和非万维网检索工具。

3.3网络信息检索技巧

目前常用的信息检索方法有两种:一种是利用搜索引擎进行关键词、主题词或自然语言检索。最著名的搜索引擎有AltaVista、Excite、HotBot、Infoseek等;另一种是按主题分类指南进行检索,如Yahoo!就是按主题组织资源、逐次分类,供读者按需查词的;有的检索工具两种方式可以随时切换使用, 如Info seek。相比之下, 前者信息的获取太杂乱, 鱼龙混杂, 精确度太低, 需通过多次筛选才能找到所需信息。而后者的信息组织系统性较强,精确度较高。但主要问题在于获取率较低且很难反映信息之间的关联性。由此可见, 两种方法各有利弊, 读者要根据检索的目的来挑选和使用检索工具,同时要学习一些提高检索效果的方法和技巧。

(l)检索关键词具体化;(2)运用词组检索;

(3)巧用Boolean逻辑词:AND、OR 和NOT。

4网络信息检索的技巧

在中国,用来获取中文信息的搜索引擎,主要是扬名华人世界的百度搜索引擎和全球闻名的Google搜索引擎。Google在外文信息搜索方面有绝对的优势,并较早推出了中文信息搜索,而百度专攻中文搜索,并在汉语特点研究等方面做出来很大贡献,近几年又推出了多种特色搜索服务,从而在中文网络搜索领域占据了绝对的优势。另外,我们常见的搜索引擎还有雅虎、网易有道、百度等。掌握网络信息搜索技巧对于很好地利用这些搜索引擎很有帮助,对自己搜索信息更是简单至极。通过互联网获取信息,如何避免在浩瀚的互联网海洋中迷失方向,掌握一些基本的网上搜索技巧可以说是必需的。网上的信息搜索技术如此的多,怎样才能高效迅速地找到问题的答案呢?有几种技术可以帮助你更加快捷地找到所需网页。没有一种技术是万能的,但将几种技术巧妙地结合起来使用会大大加快网页搜索进程。

网上的内容虽然很丰富,但必须先有人放上网。搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,很可能成为漏网之鱼。所以在使用搜索引擎之前,应该先花几秒钟想一下,我要找的东西网上可能有吗?如果有,又可能在哪里?网页上会含有哪些关键字?

一次成功的搜索由两个部分组成:一个设计优秀的搜索请求和一个准确可信的搜索结果。在你点击任何一条搜索结果之前,快速地分析一下你的搜索结果的标题和网址,会帮你节省大量的时间。

比较大的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND和OR或NOT,恰当应用它们可以使搜索结果非常精确。另外,也可以使用括号将搜索词分别组合。

如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。通过添加英文双引号来搜索短语词,这一方法在查找名言警句或专有名词时显得格外有用。很多搜索引擎都支持在搜索词前冠以“+”限定搜索结果中必须包含的词汇,用“-”限定搜索结果不能包含的词汇。

在Internet上进行查询时如果能注意一些细节问题,常常能增加搜索结果的准确性,如许多搜索引擎都区分字母的大小写,因此,如果您正在搜索人名或地名等关键词,应该正确使用它们的大小写字母形式。

如果只给出一个单词进行搜索,经常会出现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND与逻辑结合起来,或者在每个词前面加上“+”,这种与逻辑技术大大地缩小了搜索结果的范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样的语法。一个带引号的词组意味着只有完全匹配该词组,包括空格的网页才是要搜索的网页。把这几种符号结合起来使用,能大大提高搜索效率。网络信息检索发展

5.1网络信息检索的现状与发展

1990年以前,网络信息检索的现状与发展没有任何人能够检索互联网上的信息。应该说,所有的网络信息检索工具都是从1990年的Alan Emtage等人发明的Archie开始的,虽然它当时只可以实现简单意义上的FTP文件检索。随着World Wide Web的出现和发展,基于网页的信息检索工具出现并迅速发展起来。1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的Eric Solberg 等发明。伴随着网络技术的发展,网络信息检索工具也取得了十足的发展。5.2 影响网络信息检索质量的因素

(l)搜索引擎在检索的实现过程中存在一些尚未解决的问题,影响检索效果(本身存在的问题)。

(2)页面的制作、组织过程中存在的欠缺会影响到被检索的信息质量。

(3)检索用户与搜索引擎的交互过程中,由于交互的背景不同,目的不同,会影响检索效果。

5.3网络信息检索工具展望

从最早的网络信息检索工具(如Archie)算起,它们作为一个整体只有不足十年的历史,而基于万维网的检索工具(如Yahoo!和AltaVista),出现的时间则更晚。可见,网络信息检索工具尚处于发展高峰期。

网络信息检索现今的主要问题是查准率太差。如今,人们正通过一些研究,设法使网络信息检索的空间在不影响查全率这一前提下,提高查准率,它们的未来充满希望。在网络信息检索环境中,检索、浏览和获取这三个过程相互交融,自由转换、合为一体,已展示出了信息检索的新趋势,为充分地利用网络信息资源创造了条件。

结语

人类已经进入了信息社会,信息社会化与社会信息化是当今重要的时代特征。信息检索作为传递、搜索信息的手段发展愈来愈快。如果不懂得信息检索,要在浩如烟海的各种信息中寻找自己需要的信息,就如同大海捞针一般困难,掌握了信息检索的方法和技巧,就可以使信息的查询过程更有条理性、计划性,避繁就简,事半功倍。所以,我们应充分利用信息资源,避免重复劳动。科学研究具有继承和创造两重性,纵观科学技术发展史,积累、继承和借鉴前人的研究成果是科技发展的重要前提。更新自身知识积累,适应社会发展需要。在信息社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。掌握信息检索的方法与技能,是形成合理知识和更新知识的重要手段。

参考文献

[1]董守武.网络信息检索[M].西安:西安电子科技大学出版社,2010.04 [2]朱红、朱敬、李淑青.网络信息检索与利用[M].北京:人民邮电出版社,2010.09 [3]高凯、郭立炜、许云峰.网络信息检索技术及搜索引擎系统开发 [M].北京:科学出版社,2010.02 [4]陈泉.网络信息资源检索与利用 [M].北京:清华大学出版社,2010.08 [5]韩圣龙.网络信息检索工具评价指标[J]情报学报,2001,(04).[6] 黄丽红.情报理论与实践,2005,(02).[7]贺晓丽.信息资源网络检索的特点、问题及对策.时代情报,2007,5.[8]邓燕萍.现代情报,2004,(04).[9] 王霞,刘萍.晋图学刊,2004,(03).

第三篇:网络信息检索技术的现状及发展趋势

网络信息检索技术的现状及发展趋势

摘要

1990年以前,网络信息检索的现状与发展没有任何人能够检索互联网上的信息。应该说,所有的网络信息检索工具都是从1990年的Alan Emtage等人发明的Archie开始的,虽然它当时只可以实现简单意义上的FTP文件检索。随着World Wide Web的出现和发展,基于网页的信息检索工具出现并迅速发展起来。1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的Eric Selberg 等发明。伴随着网络技术的发展,网络信息检索工具也取得了十足的发展,那么这些检索工具的现状和发展趋势如何呢?本文将试作以探讨。

关键词

网络;信息;检索;发展 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。

一、基于网页的网络信息检索工具的现状和发展趋势

(一)现状

网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。

但是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足。(1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受。(2)信息有用性评价困难。一些站点在网页中大量重复某些关键字,使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。(3)网络信息日新月异的变更,人们总是期望挑出最新的信息。然而网络信息时刻变动,实时搜索几乎不可能,就是刚刚浏览过的网页,也随时都有更新、过期、删除的可能。

(二)发展趋势

网络信息检索工具的发展主要体现在进一步改进、完善检索工具和检索技术,以提高检索服务质量,改变网络信息检索不尽如意的地方。主要体现在以下几个方面:

1网络检索工具开发提供商之间合作越来越紧密

过去一般网络检索工具提供商只依靠自己建立的数据库来提供检索服务,检 索范围有限,而现在某些著名的搜索引擎在购买其他公司的数据库或者技术内核,有的与其他搜索引擎建立伙伴关系,以便用户使用。比如著名雅虎现在采用的是Google的搜索内核,网易也曾经使用Google的搜索内核技术来丰富自己的搜索引擎数据库,硅谷动力、广州视窗、新浪、搜狐、Chinaren、21cn、263、Tom等搜索引擎使用融合了百度的搜索内核技术等等。

2信息检索工具专业化及服务内容深化

一些检索工具已经不再盲目追求加大收录和标引量,而更加注重突出专业特色。在lycos搜索引擎目录中,我们可以看到商业搜索引擎、IT搜索引擎、人才搜索引擎、金融搜索引擎、医学搜索引擎等专业化的网络信息检索纷纷出现,信息检索工具的专业化已经成为一种不可逆转的趋势。信息检索服务商将服务更加深化:Google推出了网页引文查询服务,通过它可以查看自己所要查询的资料被其他网站引用的情况,从而使用户更好的把握网页信息的质量;2003年8月,第三代中文搜索引擎慧聪问世,它则集“广泛的地域搜索”、“强大的行业搜索”、“完美的MP3、Flash搜索”众多搜索功能为一体,还开发了“针对内容的相关性查询”和“符合汉语特性的模糊查询”,可以实现汉语拼音查询和同音词纠错。

3网络信息工具智能化的发展趋势

(1)信息检索工具的智能化首先是网络蜘蛛的智能化。针对网络信息的动态更替性,网络蜘蛛通过启发式学习采取最有效的搜索策略,选择最佳时机获取从Internet上自动收集、整理的信息。网络蜘蛛能在网络的任何地方工作,能尽可能地挖掘和获得信息。网络蜘蛛还要有网页跟踪监测功能,如果网页出现更新、删除等情况要及时在数据库中更新。网络蜘蛛具有跨平台工作和处理多种混合文档结构的能力。(2)其次是检索软件的智能化。现在主要有智能搜索引擎、智能浏览器、智能代理。这些网络检索工具都非常重视开发实现基于自然语言形式的输入,检索者可以将自己的检索提问以及所习惯的短语、词组甚至句子等自然语言的形式输入,智能化的检索软件将能够自动分析,而后形成检索策略进行检索。比如现在的百度搜索可以在你输入关键词以后,不断提供一些相近的关键词供你选择,直至找到你所需要的结果。Google则借助于机器翻译技术,将一种自然语言转变成另外一种自然语言,使用户能够使用母语搜索非母语的网页,并以母语浏览搜索结果。尤里卡、问一问、和国外的ASK Jeeves则通过语义技术和检索技术的结合,可是实现检索工具对搜索词在语义层次上的理解,为用户提供最准确地检索服务。

二、基于FTP文件的搜索工具。

(一)现状

如前所述,搜索引擎的雏形以及最早的搜索引擎都是基于FTP文件搜索的。最早的FTP搜索引擎是基于文本显示的Archie。后来由于WEB的出现,FTP搜索引擎发展受到了一定的影响。直到基于WEB的FTP搜索引擎出现,它才越来越多受到人们的欢迎,用户量也在迅速上升,重要性也日渐显现出来。FTP搜索引擎的功能是搜集匿名FTP服务器提供的目录列表并向用户提供文件信息的查询服务。目前,国内做的最好的、规模最大的当属天网FTP文件搜索引擎,现在可以 搜索2400万个文件(数据来源于天网主页),2002年时的统计日访问量是40万次,这在世界FTP搜索引擎界也算是一个佼佼者。另外国内还有清华9#搜索引擎、西安交大思源搜索、华南木棉搜索引擎、网络指南针、中科大天狼搜索引擎以及南京理工的“一网打尽”搜索引擎等等,国外的有Philes.com、AlltheWeb.com、Filesearching.com、souborak.com和ftpfind.com等,其中ftpfind.com是目前国外最先进的,支持包括站点快照和文件分类等新兴功能,而且文件数据量非常大。

近几年来,虽然FTP搜索引擎技术发展的很快,但相对)等。另一个是元搜索引擎,用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。国外比较著名的元搜索引擎有Vivisimo、EZ2www.xiexiebang.com、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人为地限制了搜索资源的利用;(5)在检索结果上,元搜索引擎只能返回十几、数十条“相关度”较高的结果,大量可能有价值的源搜索引擎的检索结果被忽视,影响检索结果的全面性。、(二)发展趋势

这类检索工具的发展趋势主要表现在下面几个方面:(1)检索结果整理的深化。如Vivisimo、EZ2WWW、MetaCrawler等可以实现搜索结果的自动分类,用户即可以利用传统的方式浏览结果,也可以利用其同屏的分类结果提示找寻自己需要的内容。EZ2WWW高级搜索功能提供1000多种专项资源检索,可进行目录检索。SurfWax有一个其它元搜索引擎没有的独特功能,即点击每条结果左边的“网址揿钮”图标,可浏览该结果包括的任何页面,并显示搜索语句在文件中的位置,也可以把搜索结果和文件存储起来以备后用。天网搜霸已经拥有了独特的链接检测功能,在几秒钟内检查当前页面查询结果是否可以访问,如果为标注绿色,则链接可连通(目前仅检测页面内以http://和ftp://开头的链接)(2)检索界面的个性化趋势。天网搜霸和Google提供了IE浏览器的插件,安装后就会被嵌到IE的工具栏,用户不用登陆天网的主页,就可以实现检索。用户可以将自己喜欢的搜索引擎设置为主要搜索,也可以添加用户自己喜欢的搜索引擎。天网搜霸不久前刚刚推出了可以嵌在Windows系统任务栏上的插件,现在用户连打开IE 浏览器都不需要了。Mamma可以选择使用短语检索功能、设定检索时间、设定每页可显示记录数,还提供了专门检索页面文件标题的特殊检索服务,以及通过E-mail传输检索结果的特色功能。MetaCrawler可以实现搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,设定检索结果排序依据(包括相关度、域名、源搜索引擎)个性化定制保存。(3)智能化。ProFusion可以自动实现符合特殊检索语法要求的转换,如在调用Excite、InfoSeek、WebCrawler时将“NEAR”转换成“AND”,在调用GoTo、Yahoo时将“NOT”删除等;Mamma也支持常用检索语法在不同搜索引擎中的转换;C4可以支持自然语言检索,虽然它没有自己的数据库,却可以提供网上的检索结果。

结论

从网络搜索引擎查询信息的查全率、查准率及查询功能和搜索引擎的标准化、规范化等方面,分析了当前搜索引擎的现状和存在的问题。阐述了网络搜索引擎向智能化发展概况。包括权威网址的筛选技术、基于内容的检索技术和智能代理的开发与应用等。

参考文献

[1]陈远 周朴雄.网络信息服务模式的新视角[J].图书情报工作

[2]张润彤 陈惠娟.人工智能在计算机网络技术中的应用[J].互联网世界 [3]张颖 贺亚锋.网络信息检索展望[J].现代图书情报技术

第四篇:网络信息检索及其局限性(本站推荐)

【关键词】 网络信息 信息检索 搜索引擎网络信息检索简介

随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。

1.1 信息检索概念

信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。

1.2 网络信息检索的原理

网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。

① 布尔逻辑模型 这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。

② 模糊逻辑模型 它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。

③ 概率模型 它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。2 搜索引擎

搜索引擎是目前使用最为频繁的一种网络信息检索工具。与其他工具相比,它的检全率和检准率都比较高,具有很强的使用价值和广泛的应用前景。

2.1 搜索引擎的工作原理

作为一种www站点资源和其它网络资源进行组织和检索的检索工具,搜索引擎的检索机制一般包括数据采集和标引机制、数据组织机制和用户检索机制,基本构成如图1所示。① 数据采集标引机制按照一定规律和方式对网络上www站点进行搜索,并将搜索到的www页面信息存入搜索引擎的临时数据库中。

② 数据组织据组织机制的主要功能是对www页面信息进行整理以形成规范的页面索引,并建立相应的索引数据库。

③ 索引数据库是用户进行检索的基础,它的数据质量直接影响到检索效果,而搜索引擎的数据采集标和标引机制又是决定数据库质量的关键技术。

④ 用户检索机制帮助用户以一定方式检索引擎的索引数据库,以获得符合用户需要的www站点或页面。

2.2 搜索引擎的分类

按照用户查找的途径划分,可将搜索引擎分为如下几种: ① 基于关键词的搜索引擎 主要通过使用自动采集软件来对网络上的数据进行采集标引,建立成索引数据库。它主要采用自动搜索和标引方式来建立和维护其索引数据库,供用户查询使用。

② 基于分类目录的搜索引擎 一般依赖于按照某种分类标准进行人工编排的分类体系。

③ 联合式搜索引擎 是基于关键词的搜索引擎的另外一种表现形式,是后者与基于类目的搜索引擎的一种结合。2.3 搜索引擎的功能

目前Internet上的搜索引擎种类繁多,虽然各种搜索引擎都有自己的不同信息采集标引机制,在其他一些方面各具特色,但其基本功能却是相似的。

① 布尔逻辑检索 这一功能使得用户能使用AND、OR和NOT来进行关键词的搭配检索。

② 模糊检索 在用户进行检索的过程中,系统会对跟用户提供的关键词相似的词语进行检索,并返回包含关键词或是这些相似词的检索结果。

③ 截词检索 这种检索形式利用检索词的某一部分来进行检索。在搜索引擎中,用户提供包含“?”或是“*”通配符的检索项来进行检索。

④ 限定词检索 这种检索加减号检索,它用来规定检索项中必须出现或是必须不出现某些关键词。网络信息检索的局限 用户在查找网络信息资源时,不可避免的用到网络信息检索工具。检索工具的优劣很大程度的影响了用户的检索效率。虽然网络信息检索工具在最近几年有了长足的发展,但是到现在网络信息检索仍然存在着这样或是那样的局限。

3.1 文本信息检索的局限

① 网络信息标引的准确度不够 检索工具对网络信息资源的标引一般都存在着栅引准确度不够的问题,检索工具经常会在返回大量垃圾信息的同时丢失有用信息。当用户要进行特定的文献检索时,有时还会发现现存的检索工具无济于事,检索出来的数据完全被无用信息所覆盖。如想要通过搜索引擎查询清朝雍正年间李卫任浙江巡抚的资料,你只能够查到大量《李卫当官》之类无用信息。

② 搜索引擎的查全率不高 由于互联网上的信息资源以爆炸性的速度不断增长,搜索引擎采集数据的速度远远落后于信息资源的增长速度。单个搜索引擎的数据库所收集的Web页面大大不足,就是所有的搜索引擎所储存的数据也只占全球Web页面的50%强。由于这方面的原因,搜索引擎的检全率会无可避免的被降低。

③ 搜索引擎的查准率不高 一是返回的信息过多,这是现有搜索引擎检索信息的普遍现象;二是返回重复的信息,搜索引擎的检索结果中还经常重复出现同一信息源的不同部分,甚至出现不同信息源的相同内容信息。

④ 查询方式有限 目前大多数搜索引擎的查询方法比较单一,一般只提供分类查询方式和关键词查询方式。这样,一方面检索时不能从文献的多个方面对检索提问进行限制,只能就某一关键词或概念进行笼统的检索;另一方面,由于查询结果完全依赖于用户所给出的关键词,而大多数用户对他们检索的领域或索引数据库的关键词不太了解,因此使最后的查询结果相关性很差,往往是输入一个检索式,得到一大堆网址,但其中大部分是冗余信息。

⑤ 检索对象的数据结构单一 由于现在大多数网站使用的是传统的关系数据库对信息进行组织和存储,因此其使用的搜索引擎也是基于关系数据库的,这种传统的关系数据库非常擅长处理结构化的数据,但其对于非结构化的数据的处理能力则很弱。

⑥ 交互性不够 当前的搜索引擎与用户的交互性不够,与用户间缺乏足够的协作,不了解用户的情况,不记录用户提交的查询任务,不能处理用户的反馈信息,因而不能与用户进行足够好的交互以提高检索效率。3.2 多媒体信息检索的局限

到现在为止,虽然单独针对图像、视频、声音等媒体的检索技术已经出现,但还没有任何搜索引擎能够充分解决多媒体信息的检索,其主要表现在以下几个方面:

① 检索效果不够理想 目前,几乎所有的多媒体搜索引擎在多媒体信息的查准率方面都不能达到令人满意的程度,用户将在返回的几百个甚至上千个图像中筛选需要的那一幅。这是很费时和令人难以忍受的,而且有时你所用的搜索引擎根本检不出你想要的东西。归其原因,一方面是在于查询方式的单一,另一方面在于对图像的标引深度不够,这就要求完善图像检索和索引机制。

② 用户查询接口单一 理想的多媒体检索系统中,人是主动的,用户的查询接口能提供丰富的交互能力,且直观易用,使用户能够在主动交互过程中通过调整检索参数,表达对图像的语义感知,最终获取满意的结果。这就涉及到如何把用户的提问转换为可以执行检索的特征矢量、交互方式的设计,如何获取用户的内容感知等问题。目前的多媒体搜索引擎用户查询接口比较单一,大多只提供描述查询接口,即关键词提问框。

③ 图像特征信息的表示与检索不够完善 基于内容的图像检索,实质上就是进行图像特征相似度的比较,但目前这一技术还存在许多问题。

④ 信息的自动加工与人工标引不够 目前文本搜索引擎在这方面的发展正日趋完善,而多媒体搜索引擎的研究刚刚起步,尤其是图像信息的加工,图像不同于文本,文本自身就能说明要讲的内容,而图像内容却需要加入人的理解和描述,人工干预虽能提高查准率,但一方面能被人工标引的是极其有限的;另一方面由于人工标引劳动强度大而限制了检索的范围,如何对图像信息进行快速标引和准确分类是急待解决的主要问题。

另外,目前基于内容的检索技术多应用于对静态图像的检索,对动态图像的检索还没有多少行之有效的方法。但随着宽带网络的逐步实现,动态多媒体信息在网络中将会越来越多。参考文献】

张杰.浅论网络信息检索.江西图书馆学刊,2002年增刊.董慧.网络信息资源开发与利用.武汉:武汉大学出版社,2001.卢小宾.信息检索.北京:科学出版社,2003.李勇先,郑文良.人工智能在网络信息检索中的应用.图书馆建设,2003(4),4:81~83.焦玉英,符绍宏,何绍华.信息检索.武汉:武汉大学出版社,2001.

第五篇:网络信息检索实验报告

网络信息检索的应用和发展趋势

09软件1 W班09144136张越

摘要:随着信息时代的到来,网上信息资源的数量、种类不断增加,电子信息资源日益丰富,互联网技术也日新月异、层出不穷,人们通过网络能够获取大量所需信息,如何在信息的海洋中快捷、准确地找出所需信息,网络搜索引擎就像图书馆目录能指引读者迅速找到所需图书一样,为人们在网络信息海洋中导航。而面对日益丰富的电子信息资源,如何有效的利用网络资源查找自己需要的信息,并对其进行熟练、灵活、有效地运用,已经被越来越多的人重视。

关键字:搜索引擎 信息检索 网络 发展趋势

随着信息技术的飞速发展,因特网已经继报纸、期刊、广播、电视等,成为当代信息存储与传播的主要媒介之一。因特网有着极其丰富的信息资源,但是浩如烟海的信息资源往往让信息使用者眼花缭乱。人们总是不能在最短的时间内找到自己需要的最有用的资源。因此,我们需要通过信息检索来解决这个问题。信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。信息检索分为两种,即广义信息检索和狭义信息检索。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻。本文主要研究的就是狭义的信息检索中出现的问题及解决策略。

一、搜索引擎及其基本原理

搜索引擎是Internet上具有查询功能的网页的统称,是获取知识信息的工具。随着网络技术的发展,搜索技术逐渐完善,搜索引擎已广为人们使用。任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以及预期的用户群指向。它是一些网络服务商为网络用户提供的检索站点,它收集了网上的各种资源,然后根据一种固定的规律进行分类,提供给用户进行检索。

搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间进行搜索,搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法,通常根据网页中关键词的匹配程度,出现的位置、频次,链接质量等计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。

二、网络信息检索技巧

3.1加强对因特网的管理

从以上问题,我们可以看出,因特网存在着问题,很大一部分是因为网络监管的不利造成的。因此,国家要加强宏观政策调控,并制定相应的法律法规政策,以法律条文的形式强制性规范网络,从而维持因特网秩序,保护网络环境。同时我们也应该加强公民的思想道德教育,将以德治网和以法治网有机地结合在一起,不断促进网络安全的发展,进一步减少网络诈骗等事件的发生。

3.2选择合适的搜索引擎及关键词

因为每个用户的需求不同,所以在选择搜索引擎时要综合考虑自己的需求,不能盲目地选择。如前文所说,搜索引擎分为关键词搜索引擎和目录搜索引擎。而信息检索最基本的要求就是选择合适的关键词,尤其是在使用关键词搜索引擎的时候。如果输入的关键词和用户所需要的准确信息联系不大,则用户很难迅速地找到自己需要的信息。所以这需要用户选择 富有特色的、合适的关键词,不能使用太过宽泛的词,尽量接近自己需要的信息,同时也应尽量避免拼写错误等低级错误。

3.3提高使用者检索专业水平及选择适合的数据库

要提高使用者的检索专业水平,就要对使用者进行相关信息检索的专业培训。培训的目的主要在于让使用者跳出传统的检索思维范畴,熟悉并能熟练运用新的检索技术,不断满足使用者日益增长的信息检索需要。同时使用者对于检索的范围等要有一个大概的了解,如果搜索出来的结果较多,则要适当减小范围;如果检索结果很少,则适当增大范围,对自己的检索策略做出及时调整。另外,根据检索的内容的范畴来选择合适的数据库是很重要的环节。而现有的数据库种类繁多,这也需要用户进行合适的选择,并迅速地找到主题分类目录,进而更准确地进行检索。

三、在实践中充分利用丰富的网络信息资源

搜索前,首先要分析一下自己的搜索需求,然后再选择关键字。在搜索过程中,关键字的选择充满着反复性,在搜索的过程中,切不可急躁,应该不断的筛选,分析所选择的关键字,直到找到满意的关键字为止。在搜索收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。如果搜索都能做到这样,搜索效率会不断的提高,网络信息资源会得到更多和更好的利用。此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录,就是要分门别类地存放在相应的目录中,用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索。总之,在网络信息资源检索的过程中,要耐心、细致、多角度思考,不忽略每一个检索点,只有这样,才能圆满完成检索任务。

四、网络信息检索的发展趋势

(1)信息检索的多样化。其具体趋势表现为:网络检索信息的形态多种多样;多媒体信息检索变得普遍;网上检索工具向其他服务范畴扩展,以各种形式满足大众的信息需要。

(2)信息检索的智能化。智能化信息检索是当今信息检索技术研究的热点问题之一,也是未来信息检索主要的发展方向。可以使用户得到能够直接加以利用的信息,它是建立在一个或多个专家系统基础上的信息检索系统。

(3)信息检索的专业化。专业化信息检索是指面向某一特定专业或学科领域,提供高质量的专业信息的检索。可以提高检索速度,和信息专指度,加大检索深度、力度,从而提高全=面和准确。

参考文献:

[1]鄢百其等,网络信息检索技巧及析疑[J].武汉科技大学学报(社会科

学版),2008,10(2).[2]李秀芹,葛永亮.略论网络信息检索[J].科技信息,2007(15):325.[3]黄如花,张春蕾.网络信息检索的发展趋势[J].图书情报知识,2002(4):48-50.[4]杨海涛.网络信息检索的困境及发展趋势[J].科技情报开发与经济,2008(11):13-14.

下载网络信息检索技术(5篇材料)word格式文档
下载网络信息检索技术(5篇材料).doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    网络信息检索论文

    网络时代新特征 ——读《理解媒介:论人的延伸》有感由于没读《世界是平的》,所以谈谈读《理解媒介:论人的延伸》对网络时代新特征的理解。 加拿大传播学巨匠麦克卢汉的著作《理......

    关于网络信息检索论文

    信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。下面小编为大家搜索整理了关于网络信息检索论文,希望对大家有所帮助。浅谈网络信息......

    信息检索技术论文

    近年来,计算机技术、语言学以及人工智能技术的发展促进了整个信息检索技术领域的发展。今天小编要给大家介绍的便是信息检索技术论文,欢迎阅读!信息检索技术论文[摘要]通过对近......

    WEB全文信息检索技术

    WEB全文信息检索技术 摘要:本文探索了在INTERNET网上实现全文检索的技术。计论了从网上信息的标引、分类等预处理到组织信息检索的过程,并就智能检索技术的发展进行了阐述。......

    网络信息检索期末作业

    期末作业一、 读书心得 1、 结合《世界是平的》、《理解媒介》,谈谈有关网络新时代特征的看法。 小谈网络新时代特征 今时不同往日,今天的世界是以往的人类所不能想象的,就像我......

    网络信息检索考察题

    《网络信息检索》考察题 2010年6月8日一、 问答题1. 2. 3. 4. 5. 6. 7. 信息素养主要有哪些要素? 什么是信息检索?信息检索有哪些途径? 什么是布尔逻辑检索?它包括哪三种基本运......

    山东大学网络教育学院 现代信息检索技术1doc 答案

    现代信息检索技术模拟题 一、 填空 1. 信息按出版类型分为___科技图书、科技期刊、科技报告、会议文献、专利文献、学位论文、标准文献、政府出版物、产品样本、技术档案、......

    山东大学网络教育学院 现代信息检索技术3 答案

    《现代信息检索技术》模拟题 一、 填空 1. 信息按出版类型分为___科技图书、科技期刊、科技报告、会议文献、专利文献、学位论文、标准文献、政府出版物、产品样本、技术档......