网络信息检索技术的现状及发展趋势

时间:2019-05-14 02:19:36下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《网络信息检索技术的现状及发展趋势》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《网络信息检索技术的现状及发展趋势》。

第一篇:网络信息检索技术的现状及发展趋势

网络信息检索技术的现状及发展趋势

摘要

1990年以前,网络信息检索的现状与发展没有任何人能够检索互联网上的信息。应该说,所有的网络信息检索工具都是从1990年的Alan Emtage等人发明的Archie开始的,虽然它当时只可以实现简单意义上的FTP文件检索。随着World Wide Web的出现和发展,基于网页的信息检索工具出现并迅速发展起来。1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的Eric Selberg 等发明。伴随着网络技术的发展,网络信息检索工具也取得了十足的发展,那么这些检索工具的现状和发展趋势如何呢?本文将试作以探讨。

关键词

网络;信息;检索;发展 近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。

一、基于网页的网络信息检索工具的现状和发展趋势

(一)现状

网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。

但是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足。(1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受。(2)信息有用性评价困难。一些站点在网页中大量重复某些关键字,使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。(3)网络信息日新月异的变更,人们总是期望挑出最新的信息。然而网络信息时刻变动,实时搜索几乎不可能,就是刚刚浏览过的网页,也随时都有更新、过期、删除的可能。

(二)发展趋势

网络信息检索工具的发展主要体现在进一步改进、完善检索工具和检索技术,以提高检索服务质量,改变网络信息检索不尽如意的地方。主要体现在以下几个方面:

1网络检索工具开发提供商之间合作越来越紧密

过去一般网络检索工具提供商只依靠自己建立的数据库来提供检索服务,检 索范围有限,而现在某些著名的搜索引擎在购买其他公司的数据库或者技术内核,有的与其他搜索引擎建立伙伴关系,以便用户使用。比如著名雅虎现在采用的是Google的搜索内核,网易也曾经使用Google的搜索内核技术来丰富自己的搜索引擎数据库,硅谷动力、广州视窗、新浪、搜狐、Chinaren、21cn、263、Tom等搜索引擎使用融合了百度的搜索内核技术等等。

2信息检索工具专业化及服务内容深化

一些检索工具已经不再盲目追求加大收录和标引量,而更加注重突出专业特色。在lycos搜索引擎目录中,我们可以看到商业搜索引擎、IT搜索引擎、人才搜索引擎、金融搜索引擎、医学搜索引擎等专业化的网络信息检索纷纷出现,信息检索工具的专业化已经成为一种不可逆转的趋势。信息检索服务商将服务更加深化:Google推出了网页引文查询服务,通过它可以查看自己所要查询的资料被其他网站引用的情况,从而使用户更好的把握网页信息的质量;2003年8月,第三代中文搜索引擎慧聪问世,它则集“广泛的地域搜索”、“强大的行业搜索”、“完美的MP3、Flash搜索”众多搜索功能为一体,还开发了“针对内容的相关性查询”和“符合汉语特性的模糊查询”,可以实现汉语拼音查询和同音词纠错。

3网络信息工具智能化的发展趋势

(1)信息检索工具的智能化首先是网络蜘蛛的智能化。针对网络信息的动态更替性,网络蜘蛛通过启发式学习采取最有效的搜索策略,选择最佳时机获取从Internet上自动收集、整理的信息。网络蜘蛛能在网络的任何地方工作,能尽可能地挖掘和获得信息。网络蜘蛛还要有网页跟踪监测功能,如果网页出现更新、删除等情况要及时在数据库中更新。网络蜘蛛具有跨平台工作和处理多种混合文档结构的能力。(2)其次是检索软件的智能化。现在主要有智能搜索引擎、智能浏览器、智能代理。这些网络检索工具都非常重视开发实现基于自然语言形式的输入,检索者可以将自己的检索提问以及所习惯的短语、词组甚至句子等自然语言的形式输入,智能化的检索软件将能够自动分析,而后形成检索策略进行检索。比如现在的百度搜索可以在你输入关键词以后,不断提供一些相近的关键词供你选择,直至找到你所需要的结果。Google则借助于机器翻译技术,将一种自然语言转变成另外一种自然语言,使用户能够使用母语搜索非母语的网页,并以母语浏览搜索结果。尤里卡、问一问、和国外的ASK Jeeves则通过语义技术和检索技术的结合,可是实现检索工具对搜索词在语义层次上的理解,为用户提供最准确地检索服务。

二、基于FTP文件的搜索工具。

(一)现状

如前所述,搜索引擎的雏形以及最早的搜索引擎都是基于FTP文件搜索的。最早的FTP搜索引擎是基于文本显示的Archie。后来由于WEB的出现,FTP搜索引擎发展受到了一定的影响。直到基于WEB的FTP搜索引擎出现,它才越来越多受到人们的欢迎,用户量也在迅速上升,重要性也日渐显现出来。FTP搜索引擎的功能是搜集匿名FTP服务器提供的目录列表并向用户提供文件信息的查询服务。目前,国内做的最好的、规模最大的当属天网FTP文件搜索引擎,现在可以 搜索2400万个文件(数据来源于天网主页),2002年时的统计日访问量是40万次,这在世界FTP搜索引擎界也算是一个佼佼者。另外国内还有清华9#搜索引擎、西安交大思源搜索、华南木棉搜索引擎、网络指南针、中科大天狼搜索引擎以及南京理工的“一网打尽”搜索引擎等等,国外的有Philes.com、AlltheWeb.com、Filesearching.com、souborak.com和ftpfind.com等,其中ftpfind.com是目前国外最先进的,支持包括站点快照和文件分类等新兴功能,而且文件数据量非常大。

近几年来,虽然FTP搜索引擎技术发展的很快,但相对)等。另一个是元搜索引擎,用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。国外比较著名的元搜索引擎有Vivisimo、EZ2www.xiexiebang.com、Yahoo!、Infoseek、Lycos等常用的搜索引擎,一些大型搜索引擎如NorthernLight、HotBot等被排除在外,人为地限制了搜索资源的利用;(5)在检索结果上,元搜索引擎只能返回十几、数十条“相关度”较高的结果,大量可能有价值的源搜索引擎的检索结果被忽视,影响检索结果的全面性。、(二)发展趋势

这类检索工具的发展趋势主要表现在下面几个方面:(1)检索结果整理的深化。如Vivisimo、EZ2WWW、MetaCrawler等可以实现搜索结果的自动分类,用户即可以利用传统的方式浏览结果,也可以利用其同屏的分类结果提示找寻自己需要的内容。EZ2WWW高级搜索功能提供1000多种专项资源检索,可进行目录检索。SurfWax有一个其它元搜索引擎没有的独特功能,即点击每条结果左边的“网址揿钮”图标,可浏览该结果包括的任何页面,并显示搜索语句在文件中的位置,也可以把搜索结果和文件存储起来以备后用。天网搜霸已经拥有了独特的链接检测功能,在几秒钟内检查当前页面查询结果是否可以访问,如果为标注绿色,则链接可连通(目前仅检测页面内以http://和ftp://开头的链接)(2)检索界面的个性化趋势。天网搜霸和Google提供了IE浏览器的插件,安装后就会被嵌到IE的工具栏,用户不用登陆天网的主页,就可以实现检索。用户可以将自己喜欢的搜索引擎设置为主要搜索,也可以添加用户自己喜欢的搜索引擎。天网搜霸不久前刚刚推出了可以嵌在Windows系统任务栏上的插件,现在用户连打开IE 浏览器都不需要了。Mamma可以选择使用短语检索功能、设定检索时间、设定每页可显示记录数,还提供了专门检索页面文件标题的特殊检索服务,以及通过E-mail传输检索结果的特色功能。MetaCrawler可以实现搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,设定检索结果排序依据(包括相关度、域名、源搜索引擎)个性化定制保存。(3)智能化。ProFusion可以自动实现符合特殊检索语法要求的转换,如在调用Excite、InfoSeek、WebCrawler时将“NEAR”转换成“AND”,在调用GoTo、Yahoo时将“NOT”删除等;Mamma也支持常用检索语法在不同搜索引擎中的转换;C4可以支持自然语言检索,虽然它没有自己的数据库,却可以提供网上的检索结果。

结论

从网络搜索引擎查询信息的查全率、查准率及查询功能和搜索引擎的标准化、规范化等方面,分析了当前搜索引擎的现状和存在的问题。阐述了网络搜索引擎向智能化发展概况。包括权威网址的筛选技术、基于内容的检索技术和智能代理的开发与应用等。

参考文献

[1]陈远 周朴雄.网络信息服务模式的新视角[J].图书情报工作

[2]张润彤 陈惠娟.人工智能在计算机网络技术中的应用[J].互联网世界 [3]张颖 贺亚锋.网络信息检索展望[J].现代图书情报技术

第二篇:网络信息检索技术

网络信息检索技术

网络信息检索中,基本的检索技术有布尔逻辑检索、截词检索、位置检索、限制检索等。

一、布尔逻辑检索

逻辑检索是一种开发较早、比较成熟、在信息检索系统中广泛应用的技术。布尔逻辑检索就是采用布尔关系运算符来表达检索词与检索词之间逻辑关系的检索方法,目前最常用的布尔逻辑运算符主要包括逻辑“与”(AND)、逻辑“或”(OR)、逻辑“非”(NOT)。

(一)逻辑“与”

逻辑“与”,也称为逻辑乘,用AND表示,是用来组配不同含义检索词之间的限定关系。检索词A、B以AND(或“*”)相连,即A AND B(或A*B),表示同时包含A、B两词的文献才是命中记录,因而逻辑“与”运算用于对检索词进行限定,从而缩小检索范围,提高检索结果的查准率。

例如,要查找children education(儿童教育)方面的文献,检索逻辑式可表示为“children * education”或者“children AND education”。运算的结果是同时含有检索词children和检索词education的文献才被检索出来。

(二)逻辑“或”

逻辑“或”,也称为逻辑加,用OR或者“+”表示,是用来组配同义或者同族检索词之间的并列关系。检索词A、B若以OR或“+”相连,即A OR B(或A+B),表示只要含有A、B之一或者同时包含A、B的文献都是命中记录。因而逻辑“或”运算可用于扩大检索范围。

例如,要查找“汽车”方面的文献,因为汽车在英语中可以用car或者automobile表示,所以为了将有关汽车的文献全部检出,避免漏检,检索逻辑式就可表示为“car OR automobile”或者“car + automobile”。运算的结果是含有car或者automobile任意一个或者同时两个的文献均被检索出来。

(三)逻辑“非”

逻辑“非”用NOT或者“-”来表示,是用来组配概念的包含关系,可以从原检索范围中排除一部分,因而使用逻辑“非”运算可以缩小检索范围。检索词A、B若以NOT(或“-”)相连,即A NOT B(或A-B),表示只含有检索词A而不含有B的文献才是命中记录。逻辑“非”可用于缩小检索范围,但是不一定能提高文献命中的准确率。在使用时要注意,避免将相关的有用文献排除在外。

例如,要查找有关“energy(能源)”,但又不涉及“nuclear(核能)”方面的文献,检索逻辑式可表示为“energy NOT nuclear”“energy-nuclear”。运算的结果是含有energy,但不含有nuclear的文献将被检索出来。

这三种逻辑式的文氏图如下:

图3-1布尔逻辑文氏图

上面三种检索逻辑式是最为简单的布尔逻辑运算。在检索实践中,可以根据实际需要,组合使用多个布尔运算符,以准确表达检索主题。

布尔逻辑检索与人们的思维习惯一致,表达清晰,方便用户进行扩检和缩检,而且易于计算机实现,因此,在计算机信息检索系统中得到广泛使用。但是它无法反映检索词对于检索的重要性,无法反映概念之间内在的语义联系,因而检索结果不能按照用户定义的重要性排序输出。

使用布尔逻辑运算符的注意事项:

布尔逻辑检索在联机检索、光盘检索和网络检索中都有广泛的应用,但是不同的检索工具的布尔逻辑检索技术存在一定的差异,因此,使用布尔逻辑检索需要注意以下问题:

1、布尔逻辑检索的执行顺序。三种布尔逻辑检索运算符之间的运算顺序为NOT、AND、OR。有括号时,先执行括号内的逻辑运算。

2、不同检索工具的布尔逻辑检索有不同的表现形式和使用规则。首先,不同检索工具表示布尔逻辑关系的符号不同,有的用“+”、“-”表示AND、NOT,有的用ANDNOT代替NOT(如Excite搜索引擎),有的要求运算符必须大写,有的则要求为小写形式;其次,不同检索工具的检索词之间的默认布尔逻辑关系不同,有的检索工具检索词之间的默认关系是AND,有的检索工具的检索词之间的默认关系是OR;此外,不同检索工具支持布尔逻辑的方式不同,有的检索工具使用符号来实现布尔逻辑关系,一些检索工具则完全省略了任何符号,直接用文字和表格来体现不同的逻辑关系,如用All of These Words表示AND,用Any of These Words表示OR,用None of These Words表示NOT。

二、截词检索

截词检索是指在检索式中使用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化,用检索词的词干或不完整的词形查找信息的一种检索方法。并认为凡满足这个词局部中的所有字符的文献,都为命中的文献。在实际检索的过程中,为了减少检索词的输入量,同时又扩大检索范围,保证查全率,可以使用截词检索。

截词的方式有多种。按截断的位置来分,可分为后截断、中截断和前截断;按截断的字符数量来分,可分为有限截断和无限截断。有限截断是指说明具体截去字符的数量,通常用“?”表示;而无限截断是指不说明具体截去字符的数量,通常用“x”表示。

(一)后截断

后截断是最常用的截词检索技术,是将截词符号放置在一个字符串右方,以表示其右的有限或无限个字符将不影响该字符串的检索,是一种前方一致的检索。这种方法可以省略输入各种词尾有变化的检索词的麻烦,有助于提高查全率。

例如,输入“inform x”,则前6个字符为inform的所有词均满足条件,因而能检索出含有informant、informal、information、informative、informed、informer等词的文献。而输入“inform??”,可检索出含有inform、informal、informed、informer的文献。(二)前截断

前截断是将截词符号放置在一个字符串左方,以表示其左方的有限或无限个字符不影响该字符串检索,是一种后方一致的检索。这种检索方法在各种词头有变化的复合词的检索中应用比较多,有助于提高查全率。

例如,输入“x magnetic”,可以检索出含magnetic、electro-magnetic等词的文献。

(三)中截断

中截断是把截断符号放置在一个检索词的中间。一般地,中截断只允许有限截断。中截断主要解决一些英文单词拼写不同,单复数形式不同的词的输入。

例如,输入“c?t”,可以检索出含有词cat、cut的文献;输入“mod?ation”可以检索出含有词moderation、modernization、modification的文献。

利用截词检索技术可以减少检索词的输入量,简化检索,扩大检索范围,提高查全率。但是,不同的检索工具有不同的截词规则,使用的截词符号也没有统一的标准,如Dialog系统用“?”,BRS系统用“$”,ORBIT系统用“#”等。

三、位置检索

位置检索,也称临近检索,主要是通过位置运算符来规定和限制检索词之间的相对位置或者检索词在记录中的特定位置来实施检索的技术。这里我们只介绍位置检索中的词位置检索。

词位置检索主要是利用位置逻辑算符限定检索词之间的位置,来反映要检索的信息概念。常用的词位置算符有(W)与(nW)、(N)与(nN)以及(X)与(nX)三类。

(一)(W)算符与(nW)算符

(W)算符是Word和With的缩写,它表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除可以有一个空格、一个标点符号或一个连接号外,不得夹有任何其他单词或字母,且词序不能颠倒。(nW)算符的含义是允许在连接的两个词之间最多夹入n个其他单元词。

例如,“VISUAL(W)FOXPRO”可以检出

VISUALFOXPRO 或VISUAL FOXPRO;“control(1W)system”可以检出含有contro1 system、control of system和contro1 in system的文献。

(二)(N)算符与(nN)算符

(N)算符是Near的缩写,它表示在此算符两侧的检索词必须紧密相连,所连接的检索词之间不允许插入任何其他单词或字母,但词序可以颠倒。(nN)算符表示在两个检索词之间最多可以插入n个单词,且这两个检索词的词序任意。

例如,“control(1N)system”不仅可以检出含有control system、control of systcm和control in system 的文献,还可以检出含有system of control、system without control等的文献。

(三)(X)算符与(nX)算符

(X)算符要求其两侧的检索词完全一致,并以指定的顺序相邻,且中间不允许插入任何其他单词或字母。它常用来限定两个相同且必须相邻的词。(nX)算符的含义是要求其两侧的检索词完全一致,并以指定的顺序相邻,两个检索词之间最多可以插入n个单元词。

例如,“side(1X)side”可以检索到含有side by side的文献。

四、限制检索

限制检索是通过限制检索范围,从而达到约束和优化检索结果的一种方法。限制检索的方式有多种,常用的有字段限制检索和限制符限制检索。

(一)字段检索

数据库记录是由若干个字段组成的,字段检索是把检索词限定在数据库记录的特定字段中的检索方法,如果记录的相应字段中含有输入的检索词则为命中记录。字段限制检索可以缩小检索范围,提高查准率。

数据库中提供的可供检索的字段通常分为基本索引字段和辅助索引字段两大类。基本索引字段表示文献的内容特征,有TI(篇名、题目)、AB(摘要)、DE(叙词)、ID(自由标引词)等;辅助索引字段表示文献的外部特征,有AU(作者)、CS(作者单位)、JN(刊物名称)、PY(出版年份)、LA(语言)等。在检索提问式中,可以利用后缀符“/”对基本索引字段进行限制,利用前缀符“=”对辅助索引字段加以限制。例如,“(information retrieval/TI OR digital library/DE)AND PY=2006”所表达的检索要求是,查找2006年出版的关于信息检索或数字图书馆方面的文献,并要求information retrieval一词在命中文献的TI(篇名)字段中出现,digital library一词在DE(叙词)字段中出现。

(二)限制检索

限制符检索是使用AU(作者)、CS(作者单位)、JN(刊物名称)、PY(出版年份)、LA(语言)等限制符号从文献的外部特征方面限制检索范围和检索结果的一种方法。限制符的用法与后缀符相同,而它的作用则与前缀符相同。

例如,“aircraft/TI,PAT”表示检索结果只包含aircraft这一主题的专利文献。限制符还可以与前、后缀符同时使用,这时字段代码与限制符之间的关系是逻辑“与”,即最终的检索结果应同时满足字段检索和限制符检索两方面的要求。

第三篇:论网络信息检索技术

论网络信息检索技术

摘要:20世纪以来,人类创生的信息量高速增长,浩如烟波。如何从这海量的信息里找出所需信息就成为信息检索的重任。随着网络技术的飞速发展,越来越多的人把因特网作为获取日常信息的重要手段。掌握信息检索的方法与技巧是非常有必要的,人们对快速、准确、有效地获取网络信息资源的需求是急切的,人们对网络信息的检索技术及其发展趋势进行探讨和研究,也是迫切而实用的。针对网络信息检索的各种方法与技巧进行了客观的分析与思考,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。关键词:网络、信息检索、检索技术、工具

0 引言

进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。

什么是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。

信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。网络信息检索的现状以及策略

在这个高速发展的信息时代的社会,随着网络技术的飞速发展,越来越多的人把因特网作为获取日常信息的重要手段。用网络搜索一些信息,如了解时事、生活疑惑、寻医问病、自娱自乐等,通常都比较方便快捷。然而,网络信息资源相当丰富,多种多样,当人们进行专业信息检索时,结果往往不尽如人意。即便是经常上网高校的老师与学生也有常常搜索不到专业文献信息的时候。

由于信息资源数量庞大、各信息间又相互交叉渗透,使得一些科研课题资料的检索相当的有难度,因此,我们必须掌握合理的检索策略,这样才能保证我们能有满意的检索效果。所谓检索策略,就是正确的选择检索词、科学合理的提问等。首先应对要检索的内容进行细致的分析,将完整的主题分为一个个独立的检索概念,然后要注意选全、选好相关词。在检索英文资料时,还要注意英美不同的拼写形式以及检索词的单复数形式、缩写形式等,然后采用布尔逻辑的原理,将表达相关概念的各检索词组配起来,以转换成搜索引擎可以理解的信息提问式,在对其数据库进行搜索后,便可获得相应的结果。因特网上的信息浩繁庞杂,一些有价值的专业信息被大量无用信息所淹没,要想系统的、全面的、准确的获取有价值的信息,就需要学会科学的制定信息技术策略。

2网络信息检索的原理及方法

网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。

网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。

①布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。

②模糊逻辑模型——它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。

③ 概率模型——它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。

要在网上获取信息,我们就需要找到提供信息源的服务器。首先找到各个服务器在网上的地址,然后通过该地址去访问服务器提供的信息。大致有以下几种方法: 2.1漫游法

这是在因特网上发现、检索信息的原始方法。即在日常的网络阅读、漫游过程中,意外发现一些有用信息。这种方式的目的性不是很强,具不可预见性和偶然性。

用户在阅读超文本文档时,利用文档中的链接从一网页转向另一相关网页。此方法类似于传统手工检索中的追溯检索,即根据文献后所附的参考文献追溯查找相关的文献,从而不断扩大检索范围。这种方法可能在较短的时间内检出大量相关信息,也可能偏离检索目标而一无所获。2.2直接查找法

直接查找法是已经知道要查找的信息可能存在的地址,而直接在浏览器的地址栏中输入其网址进行浏览查找的方法。此方法适合于经常上网漫游的用户。其优点是节省时间、目的性强、节省费用,缺点是信息量少。2.3搜索引擎检索法

此方法是最为常规、普遍的网络信息检索方法。搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具。用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果提供给用户。它一般支持布尔检索、词组检索、截词检索、字段检索等功能。利用搜索引擎进行检索的优点是:省时省力,简单方便,检索速度快、范围广,能及时获取新增信息。其缺点是:由于采用计算机软件自动进行信息的加工、处理,且检索软件的智能性不很高,造成检索的准确性不是很理想,与人们的检索需求及对检索效率的期望有一定差距。

2.4网络资源指南检索法

此方法是利用网络资源指南进行查找相关信息的方法。

网络资源指南类似于传统的文献检索工具————书目之书目或专题书目,其目的是可实现对网络信息资源的智能性查找。它们通常由专业人员在对网络信息资源进行鉴别、选择、评价、组织的基础上编制而成,对于有目的的网络信息检索具有重要的指导作用。其局限性在于:由于其管理、维护跟不上网络信息的增长速度,使得其收录范围不够全面,新颖性、及时性不够强,且用户还要受标引者分类思想的限制。2.5 在线数据库查询

利用网上的在线数据库进行查询。访问网络数据库是用户获取学术性信息的最有效方法。网上在线数据库有很多,比如:超星数字图书馆、万方数据库资源系统、中国维普数据库、CNKI中国期刊网数据库等。

3网络信息检索详论

3.1网络信息检索方式

其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式

只要能够进入html就能够通过浏览器,利用HTTP协议提供的万维网服务,浏览接触页面和通过Web页面提供的检索方式访问数据库。

(2)搜索引擎方式

搜索引擎是internet提供公共信息检索服务的Web站点,它是以一定的技术和策略在internet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以web形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。3.2网络信息检索工具

从20世纪80年代起人们就开发了诸如Archive、WAIS、Veronica等检索工具,从90年代中期起又出现了检索万维网络信息资源的搜索引擎技术,并以此构造检索所有各类网络信息资源的集成化支撑体系。据统计,各种各样的Internet网络信息检索工具已有数千个,按这些工具的检索机制、检索内容范围,以及检索工具的数量、检索资源类型,可将它们划分为以下各类:

(l)按检索机制划分

根据检索工具的数据检索机制,可将检索工具分为检索型、目录型和混合型检索工具。(2)按检索内容划分

根据检索工具的数据内容,检索工具可分为综合型、专题型和特殊检索工具书。(3)按包含检索工具数量划分 根据检索工具数量划分,检索工具可分为单独型和复合型检索工具。(4)按检索资源类型划分

根据检索工具针对的数据资源类型,可将检索工具分为万维网检索工具和非万维网检索工具。

3.3网络信息检索技巧

目前常用的信息检索方法有两种:一种是利用搜索引擎进行关键词、主题词或自然语言检索。最著名的搜索引擎有AltaVista、Excite、HotBot、Infoseek等;另一种是按主题分类指南进行检索,如Yahoo!就是按主题组织资源、逐次分类,供读者按需查词的;有的检索工具两种方式可以随时切换使用, 如Info seek。相比之下, 前者信息的获取太杂乱, 鱼龙混杂, 精确度太低, 需通过多次筛选才能找到所需信息。而后者的信息组织系统性较强,精确度较高。但主要问题在于获取率较低且很难反映信息之间的关联性。由此可见, 两种方法各有利弊, 读者要根据检索的目的来挑选和使用检索工具,同时要学习一些提高检索效果的方法和技巧。

(l)检索关键词具体化;(2)运用词组检索;

(3)巧用Boolean逻辑词:AND、OR 和NOT。

4网络信息检索的技巧

在中国,用来获取中文信息的搜索引擎,主要是扬名华人世界的百度搜索引擎和全球闻名的Google搜索引擎。Google在外文信息搜索方面有绝对的优势,并较早推出了中文信息搜索,而百度专攻中文搜索,并在汉语特点研究等方面做出来很大贡献,近几年又推出了多种特色搜索服务,从而在中文网络搜索领域占据了绝对的优势。另外,我们常见的搜索引擎还有雅虎、网易有道、百度等。掌握网络信息搜索技巧对于很好地利用这些搜索引擎很有帮助,对自己搜索信息更是简单至极。通过互联网获取信息,如何避免在浩瀚的互联网海洋中迷失方向,掌握一些基本的网上搜索技巧可以说是必需的。网上的信息搜索技术如此的多,怎样才能高效迅速地找到问题的答案呢?有几种技术可以帮助你更加快捷地找到所需网页。没有一种技术是万能的,但将几种技术巧妙地结合起来使用会大大加快网页搜索进程。

网上的内容虽然很丰富,但必须先有人放上网。搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,很可能成为漏网之鱼。所以在使用搜索引擎之前,应该先花几秒钟想一下,我要找的东西网上可能有吗?如果有,又可能在哪里?网页上会含有哪些关键字?

一次成功的搜索由两个部分组成:一个设计优秀的搜索请求和一个准确可信的搜索结果。在你点击任何一条搜索结果之前,快速地分析一下你的搜索结果的标题和网址,会帮你节省大量的时间。

比较大的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND和OR或NOT,恰当应用它们可以使搜索结果非常精确。另外,也可以使用括号将搜索词分别组合。

如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。通过添加英文双引号来搜索短语词,这一方法在查找名言警句或专有名词时显得格外有用。很多搜索引擎都支持在搜索词前冠以“+”限定搜索结果中必须包含的词汇,用“-”限定搜索结果不能包含的词汇。

在Internet上进行查询时如果能注意一些细节问题,常常能增加搜索结果的准确性,如许多搜索引擎都区分字母的大小写,因此,如果您正在搜索人名或地名等关键词,应该正确使用它们的大小写字母形式。

如果只给出一个单词进行搜索,经常会出现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND与逻辑结合起来,或者在每个词前面加上“+”,这种与逻辑技术大大地缩小了搜索结果的范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样的语法。一个带引号的词组意味着只有完全匹配该词组,包括空格的网页才是要搜索的网页。把这几种符号结合起来使用,能大大提高搜索效率。网络信息检索发展

5.1网络信息检索的现状与发展

1990年以前,网络信息检索的现状与发展没有任何人能够检索互联网上的信息。应该说,所有的网络信息检索工具都是从1990年的Alan Emtage等人发明的Archie开始的,虽然它当时只可以实现简单意义上的FTP文件检索。随着World Wide Web的出现和发展,基于网页的信息检索工具出现并迅速发展起来。1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的Eric Solberg 等发明。伴随着网络技术的发展,网络信息检索工具也取得了十足的发展。5.2 影响网络信息检索质量的因素

(l)搜索引擎在检索的实现过程中存在一些尚未解决的问题,影响检索效果(本身存在的问题)。

(2)页面的制作、组织过程中存在的欠缺会影响到被检索的信息质量。

(3)检索用户与搜索引擎的交互过程中,由于交互的背景不同,目的不同,会影响检索效果。

5.3网络信息检索工具展望

从最早的网络信息检索工具(如Archie)算起,它们作为一个整体只有不足十年的历史,而基于万维网的检索工具(如Yahoo!和AltaVista),出现的时间则更晚。可见,网络信息检索工具尚处于发展高峰期。

网络信息检索现今的主要问题是查准率太差。如今,人们正通过一些研究,设法使网络信息检索的空间在不影响查全率这一前提下,提高查准率,它们的未来充满希望。在网络信息检索环境中,检索、浏览和获取这三个过程相互交融,自由转换、合为一体,已展示出了信息检索的新趋势,为充分地利用网络信息资源创造了条件。

结语

人类已经进入了信息社会,信息社会化与社会信息化是当今重要的时代特征。信息检索作为传递、搜索信息的手段发展愈来愈快。如果不懂得信息检索,要在浩如烟海的各种信息中寻找自己需要的信息,就如同大海捞针一般困难,掌握了信息检索的方法和技巧,就可以使信息的查询过程更有条理性、计划性,避繁就简,事半功倍。所以,我们应充分利用信息资源,避免重复劳动。科学研究具有继承和创造两重性,纵观科学技术发展史,积累、继承和借鉴前人的研究成果是科技发展的重要前提。更新自身知识积累,适应社会发展需要。在信息社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。掌握信息检索的方法与技能,是形成合理知识和更新知识的重要手段。

参考文献

[1]董守武.网络信息检索[M].西安:西安电子科技大学出版社,2010.04 [2]朱红、朱敬、李淑青.网络信息检索与利用[M].北京:人民邮电出版社,2010.09 [3]高凯、郭立炜、许云峰.网络信息检索技术及搜索引擎系统开发 [M].北京:科学出版社,2010.02 [4]陈泉.网络信息资源检索与利用 [M].北京:清华大学出版社,2010.08 [5]韩圣龙.网络信息检索工具评价指标[J]情报学报,2001,(04).[6] 黄丽红.情报理论与实践,2005,(02).[7]贺晓丽.信息资源网络检索的特点、问题及对策.时代情报,2007,5.[8]邓燕萍.现代情报,2004,(04).[9] 王霞,刘萍.晋图学刊,2004,(03).

第四篇:浅谈钻井技术现状及发展趋势

浅谈钻井技术现状及发展趋势

【摘要】随着油田的深入开发,钻井技术有了质的发展,钻井工艺技术研究、破岩机理研究、固控技术研究、钻井仪表技术研究、保护油气层钻井完井液技术研究以及三次采油钻井技术等都取得了科研成果,施工技术逐渐多样化,目前已在水平井、径向水平井、小井眼钻井、套管开窗侧钻井、欠平衡压力钻井等方面获得了突破。一些先进的钻井技术走出国门,走向世界,如:计算机控制下套管技术、套管试压技术、随钻测斜技术、密闭取心技术、固控装备、钻井仪表、钻井液监测技术、MTC固井技术及化学堵漏技术等,本文就国内钻井技术的现状及发展趋势进行分析。

【关键词】钻井技术;发展趋势;油田开发

引言

通过钻井技术及管理人员的不懈努力,钻井硬件设施已经比较完善,很多钻井公司配备了先进的钻井工艺实验室、固控设备实验室、钻井仪表实验室、油田化学实验室、高分子材料试验车间、全尺寸科学实验井等,这些硬件设施满足了各种钻井工程技术开发与应用的需要。钻井技术也有了长足发展,具备了世界先进水平,钻井技术的进步为油田科技事业的发展做出了积极的贡献,并取得了良好的经济效益和社会效益,如TZC系列钻井参数仪作为技术产品曾多次参与国内重点探井及涉外钻井工程技术服务,并受到外方的认可。多年来,由于不断进行技术攻关研究与新技术的推广应用,水平井钻井技术迅速提高。水平钻进技术是在定向井技术基础上发展起来的一项钻进新技术,其特点是能扩大油气层裸露面积、显著提高油气采收率及单井油气产量。对于薄油层高压低渗油藏以及井间剩余油等特殊油气藏,水平井技术更具有明显的优势。

1、钻井技术发展现状

从世界能源消耗趋势看,还是以油气为主,在未来能源消耗趋势中,天然气的消耗增加较快,但是在我国仍然以石油、煤炭作为主要能源。尽管如此,我国的油气缺口仍然很大,供需矛盾很突出,60%石油需要进口,从钻井的历史看,我国古代钻井创造了辉煌历史,近代钻井由领先沦为落后,现代钻井奋起直追,逐步缩小差距,21世纪钻井技术有希望第二次走向辉煌。随着钻进区域的不断扩大及钻井难度的不断增加,各种新的钻井技术不断出现,目前,水平井钻井技术逐渐成为提高油气勘探开发最有效的手段之一。各种先进的钻井技术在油田开发中显示出了其优越性,新技术、新工艺日益得到重视和推广应用。例如:旋转钻井技术,是目前世界上主要的钻井技术,旋转钻井方式有以下几种:转盘(或顶驱)驱动旋转钻井方式、井下动力与钻柱复合驱动旋转钻井方式(双驱)、井下动力钻具旋转钻井方式、特殊工艺旋转钻井方式:欠平衡钻井、套管钻井、连续管钻井、膨胀管钻井等、冲旋钻井方式(空气锤钻井等)。其中,冲击旋转钻井就是在普通旋转钻井钻头上部接一个冲击器。冲击器(有液动冲击器,气动锤等)是一种井底动力机械,依靠高压钻井流体,推动其活塞冲锤上下运动,撞击铁砧,并通过滑接套传递给钻头,钻头在冲击动载和静压回转的联合作用下破碎岩石。冲击力不同于静压力,它是一种加载速度极大的动载荷,作用时间极短,岩石中的接触应力瞬时可达最大值并引起应力集中,岩石不易产生塑性变形,表现为脆性增加,岩石易形成大体积破碎,提高钻井速度。从破岩机理来看,空气锤钻井主要依靠空气锤活塞对钻头的高频冲击作用破岩,而不需要采用大钻压迫使钻头吃入地层破岩。因此,钻井作业中,空气锤钻井技术是采用低转速(20~30rpm)、小钻压(5~10kN)及高频震击破岩方式的钻进技术,既能有效满足井斜控制要求,又能大幅度提高机械钻速,是一种比较理想的防斜打快钻井技术。

2、与钻井技术相关难题分析

(1)针对我国复杂深井和超深井钻井工程中面临的严重井斜和低效率等技术难题,应积极组织优势力量,从客观(地层各向异性)和主观(垂钻系统)两个方面进行技术攻关研究,以期尽快获得具有自主知识产权的先进控制工具、科学计算软件及智能钻井系统等。随着材料、信息、测量与控制等相关学科领域的发展,钻井与油气井工程技术不断朝着信息化、智能化及自动化的方向发展,如旋转导向钻井系统、智能完井等。应积极发展膨胀管技术,以便彻底革新井身结构,推动油气井工程的技术革命。这不仅能够大幅度提高石油工程效率和效益,而且能够为不断创造人类“入地、下海”的新纪录提供高技术支持。

(2)复杂结构井、深井超深井、高危气井及特殊工艺钻井等技术系列,在20世纪90年代已得到迅速发展与应用。进入21世纪后,这些技术系列仍是油气资源勘探与开发所需要的关键技术系列,并将得到进一步发展与提高。与国外先进水平相比,我国在这些技术方面整体上仍存在较大的差距。国外先进的自动垂钻系统,虽然可以在昂贵的复杂深井和超深井垂直钻井工程中发挥有效作用,但目前的技术水平仍在使用条件上具有一定的局限性,在实际工作中应注意对其进行科学评估与合理选用。

(3)钻井逐渐与录井、测井及地震等信息技术融为一体,以有效地解决钻井过程中的不确定性问题,从而可提高油气钻探与开发的效果和效益,如LWD和SWD等技术即为典型例证。

3、油气钻井技术发展趋势

油气井包括普通结构井和复杂结构井。复杂结构井包括多分支井、大位移井、水平井、复杂地条件下的深井超深井、高危气井、高温高压气井等。地下环境的复杂性及其不确定性(地应力、地层压力、各向异性、可钻性、理化特性、不稳定性等地层特性十分复杂和异常)给油气钻探造成极大困难:钻井事故多、速度慢、质量差、效益低(成本高),严重制约了油气勘探开发的步伐。目前,钻井复杂深井油气钻探难度很大,钻井技术正在根据实际需求,不断攻克难关,未来钻井技术的发展趋势:大位移井技术在我国逐步应用,采用大位移井技术已经开发了南海西江24-1油田和流花11-1油田;欠平衡钻井技术正在各大油田推广应用;国外已经成熟的CTD(连续管钻井)技术,我国也逐渐开始常识应用;膨胀管钻井技术和套管钻井技术也有了实质性发展;旋转导向钻井技术正在研制中;钻井向地球的更深处钻探、井身结构有重大革新、挑战大位移井延伸极限、钻井的信息化与智能化发展、井下测量与可视化计算。

结束语

经过历代钻井人员的努力,国内各油田钻井队伍不断壮大,钻井装备水平逐渐提高,生产管理水平实现现代化,众多先进钻井技术已经达到世界先进水平。但是,随着油田开发的不断深入,油田开采难度逐渐加大,勘探开发有了更高的要求,这给钻井技术带来了新的挑战,钻井难度不断加大。相信在钻井人员在苦难面前一定能够正确面对,一定能够不断的进行技术创新和技术进步,一定能够不断解决世界性难题,为油田勘探开发打下良好的基础作用。

参考文献

[1]沈忠厚,黄洪春,高德利.世界钻井技术新进展及发展趋势分析[J].中国石油大学学报(自然科学版),2009年04期

[2]李东方.我国石油钻井技术现状及发展趋势初探[J].化工管理,2014年08期

第五篇:网络信息检索及其局限性(本站推荐)

【关键词】 网络信息 信息检索 搜索引擎网络信息检索简介

随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。

1.1 信息检索概念

信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。

1.2 网络信息检索的原理

网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。

① 布尔逻辑模型 这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。

② 模糊逻辑模型 它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。

③ 概率模型 它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。2 搜索引擎

搜索引擎是目前使用最为频繁的一种网络信息检索工具。与其他工具相比,它的检全率和检准率都比较高,具有很强的使用价值和广泛的应用前景。

2.1 搜索引擎的工作原理

作为一种www站点资源和其它网络资源进行组织和检索的检索工具,搜索引擎的检索机制一般包括数据采集和标引机制、数据组织机制和用户检索机制,基本构成如图1所示。① 数据采集标引机制按照一定规律和方式对网络上www站点进行搜索,并将搜索到的www页面信息存入搜索引擎的临时数据库中。

② 数据组织据组织机制的主要功能是对www页面信息进行整理以形成规范的页面索引,并建立相应的索引数据库。

③ 索引数据库是用户进行检索的基础,它的数据质量直接影响到检索效果,而搜索引擎的数据采集标和标引机制又是决定数据库质量的关键技术。

④ 用户检索机制帮助用户以一定方式检索引擎的索引数据库,以获得符合用户需要的www站点或页面。

2.2 搜索引擎的分类

按照用户查找的途径划分,可将搜索引擎分为如下几种: ① 基于关键词的搜索引擎 主要通过使用自动采集软件来对网络上的数据进行采集标引,建立成索引数据库。它主要采用自动搜索和标引方式来建立和维护其索引数据库,供用户查询使用。

② 基于分类目录的搜索引擎 一般依赖于按照某种分类标准进行人工编排的分类体系。

③ 联合式搜索引擎 是基于关键词的搜索引擎的另外一种表现形式,是后者与基于类目的搜索引擎的一种结合。2.3 搜索引擎的功能

目前Internet上的搜索引擎种类繁多,虽然各种搜索引擎都有自己的不同信息采集标引机制,在其他一些方面各具特色,但其基本功能却是相似的。

① 布尔逻辑检索 这一功能使得用户能使用AND、OR和NOT来进行关键词的搭配检索。

② 模糊检索 在用户进行检索的过程中,系统会对跟用户提供的关键词相似的词语进行检索,并返回包含关键词或是这些相似词的检索结果。

③ 截词检索 这种检索形式利用检索词的某一部分来进行检索。在搜索引擎中,用户提供包含“?”或是“*”通配符的检索项来进行检索。

④ 限定词检索 这种检索加减号检索,它用来规定检索项中必须出现或是必须不出现某些关键词。网络信息检索的局限 用户在查找网络信息资源时,不可避免的用到网络信息检索工具。检索工具的优劣很大程度的影响了用户的检索效率。虽然网络信息检索工具在最近几年有了长足的发展,但是到现在网络信息检索仍然存在着这样或是那样的局限。

3.1 文本信息检索的局限

① 网络信息标引的准确度不够 检索工具对网络信息资源的标引一般都存在着栅引准确度不够的问题,检索工具经常会在返回大量垃圾信息的同时丢失有用信息。当用户要进行特定的文献检索时,有时还会发现现存的检索工具无济于事,检索出来的数据完全被无用信息所覆盖。如想要通过搜索引擎查询清朝雍正年间李卫任浙江巡抚的资料,你只能够查到大量《李卫当官》之类无用信息。

② 搜索引擎的查全率不高 由于互联网上的信息资源以爆炸性的速度不断增长,搜索引擎采集数据的速度远远落后于信息资源的增长速度。单个搜索引擎的数据库所收集的Web页面大大不足,就是所有的搜索引擎所储存的数据也只占全球Web页面的50%强。由于这方面的原因,搜索引擎的检全率会无可避免的被降低。

③ 搜索引擎的查准率不高 一是返回的信息过多,这是现有搜索引擎检索信息的普遍现象;二是返回重复的信息,搜索引擎的检索结果中还经常重复出现同一信息源的不同部分,甚至出现不同信息源的相同内容信息。

④ 查询方式有限 目前大多数搜索引擎的查询方法比较单一,一般只提供分类查询方式和关键词查询方式。这样,一方面检索时不能从文献的多个方面对检索提问进行限制,只能就某一关键词或概念进行笼统的检索;另一方面,由于查询结果完全依赖于用户所给出的关键词,而大多数用户对他们检索的领域或索引数据库的关键词不太了解,因此使最后的查询结果相关性很差,往往是输入一个检索式,得到一大堆网址,但其中大部分是冗余信息。

⑤ 检索对象的数据结构单一 由于现在大多数网站使用的是传统的关系数据库对信息进行组织和存储,因此其使用的搜索引擎也是基于关系数据库的,这种传统的关系数据库非常擅长处理结构化的数据,但其对于非结构化的数据的处理能力则很弱。

⑥ 交互性不够 当前的搜索引擎与用户的交互性不够,与用户间缺乏足够的协作,不了解用户的情况,不记录用户提交的查询任务,不能处理用户的反馈信息,因而不能与用户进行足够好的交互以提高检索效率。3.2 多媒体信息检索的局限

到现在为止,虽然单独针对图像、视频、声音等媒体的检索技术已经出现,但还没有任何搜索引擎能够充分解决多媒体信息的检索,其主要表现在以下几个方面:

① 检索效果不够理想 目前,几乎所有的多媒体搜索引擎在多媒体信息的查准率方面都不能达到令人满意的程度,用户将在返回的几百个甚至上千个图像中筛选需要的那一幅。这是很费时和令人难以忍受的,而且有时你所用的搜索引擎根本检不出你想要的东西。归其原因,一方面是在于查询方式的单一,另一方面在于对图像的标引深度不够,这就要求完善图像检索和索引机制。

② 用户查询接口单一 理想的多媒体检索系统中,人是主动的,用户的查询接口能提供丰富的交互能力,且直观易用,使用户能够在主动交互过程中通过调整检索参数,表达对图像的语义感知,最终获取满意的结果。这就涉及到如何把用户的提问转换为可以执行检索的特征矢量、交互方式的设计,如何获取用户的内容感知等问题。目前的多媒体搜索引擎用户查询接口比较单一,大多只提供描述查询接口,即关键词提问框。

③ 图像特征信息的表示与检索不够完善 基于内容的图像检索,实质上就是进行图像特征相似度的比较,但目前这一技术还存在许多问题。

④ 信息的自动加工与人工标引不够 目前文本搜索引擎在这方面的发展正日趋完善,而多媒体搜索引擎的研究刚刚起步,尤其是图像信息的加工,图像不同于文本,文本自身就能说明要讲的内容,而图像内容却需要加入人的理解和描述,人工干预虽能提高查准率,但一方面能被人工标引的是极其有限的;另一方面由于人工标引劳动强度大而限制了检索的范围,如何对图像信息进行快速标引和准确分类是急待解决的主要问题。

另外,目前基于内容的检索技术多应用于对静态图像的检索,对动态图像的检索还没有多少行之有效的方法。但随着宽带网络的逐步实现,动态多媒体信息在网络中将会越来越多。参考文献】

张杰.浅论网络信息检索.江西图书馆学刊,2002年增刊.董慧.网络信息资源开发与利用.武汉:武汉大学出版社,2001.卢小宾.信息检索.北京:科学出版社,2003.李勇先,郑文良.人工智能在网络信息检索中的应用.图书馆建设,2003(4),4:81~83.焦玉英,符绍宏,何绍华.信息检索.武汉:武汉大学出版社,2001.

下载网络信息检索技术的现状及发展趋势word格式文档
下载网络信息检索技术的现状及发展趋势.doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    网络信息检索实验报告

    网络信息检索的应用和发展趋势09软件1 W班09144136张越摘要:随着信息时代的到来,网上信息资源的数量、种类不断增加,电子信息资源日益丰富,互联网技术也日新月异、层出不穷,人们......

    网络信息检索论文

    网络时代新特征 ——读《理解媒介:论人的延伸》有感由于没读《世界是平的》,所以谈谈读《理解媒介:论人的延伸》对网络时代新特征的理解。 加拿大传播学巨匠麦克卢汉的著作《理......

    关于网络信息检索论文

    信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。下面小编为大家搜索整理了关于网络信息检索论文,希望对大家有所帮助。浅谈网络信息......

    信息检索技术论文

    近年来,计算机技术、语言学以及人工智能技术的发展促进了整个信息检索技术领域的发展。今天小编要给大家介绍的便是信息检索技术论文,欢迎阅读!信息检索技术论文[摘要]通过对近......

    WEB全文信息检索技术

    WEB全文信息检索技术 摘要:本文探索了在INTERNET网上实现全文检索的技术。计论了从网上信息的标引、分类等预处理到组织信息检索的过程,并就智能检索技术的发展进行了阐述。......

    论网络教育现状及发展趋势

    论网络教育现状及发展趋势 鲍志莹(天津师范大学经济学院) 网络教育是运用多媒体、数据库、网络等现代信息技术手段,建立在Internet基础上的远程教育。网络教育是日益增长的......

    汽油发动机技术现状及发展趋势

    汽油机控制技术发展现状及趋势分析 内燃机的发明,带动了汽车的发展,给世人在“行”上带来极大的便利,使得窨距离缩小,人们的工作速度得以提高。近年来随着电子技术的发展,又使汽......

    天然气管道技术现状及发展趋势

    天然气管道技术现状及发展趋势 1 世界天然气管道技术现状 (1)长运距、大管径和高压力管道是当今世界天然气管道发展主流 自20 世纪70 年代以来,世界上新开发的大型气田多远离......