第一篇:网络信息检索及其前沿技术的发展范文
目 录
摘要......................................................................................................................................(1)1因特网信息检索概述.............................................................................................(1)2因特网信息检索的方法.......................................................................................(2)
2.1因特网信息检索的一般方法........................................................................(2)
2.1.1网上漫游..................................................................................................(2)2.1.2顺“链”浏览.........................................................................................(2)2.1.3 利用搜索引擎进行信息检索..........................................................(2)
3因特网信息检索的特点.....................................................................................(3)
3.1超文本检索..........................................................................................................(3)
4网络信息检索遇到的挑战..................................................................................(3)5网络信息检索的前沿发展技术及展望........................................................(4)
5.1智能化信息检索.................................................................................................(5)5.2 可视化信息检索.............................................................................................(6)5.3 一站式信息检索.............................................................................................(7)5.4 个性化信息检索.............................................................................................(7)
6致谢.......................................................................................................................................(8)
参 考 文 献........................................................................................................................(9)
Abstract ···························································································································(10)
网络信息检索及其前沿技术的发展
作 者:1111 指导教师:11111
摘要:现代信息检索技术经历了由低级到高级的发展过程。目前正朝着多元化的方向发展。本文主要从信息检索的智能化、专业化、可视化、一站式及基于网格的5个方面来介绍现代信息检索技术的发展趋势。因为随着信息技术的发展和用户检索需求的变化,现代信息检索技术在理念、人性化、智能化等方面发生了全面突破。本文探讨了现代信息检索技术发展趋势,从智能化、个性化、一站式、可视化四个方面进行了分析,对检索技术发展趋势展开了一定的探讨。
关键词:因特网; 信息检索; 前沿技术 ;搜索引擎
1因特网信息检索概述
因特网信息检索是现代网络技术带来的必然课题,当网络成为信息世界中的一种无所不在的承载体,每一个检索者都可以随时随地截取和输送最新的各种信 ,面对这样一个庞大无比、动态变化的网络信息 , 要想获得某个用户所需特定信息 , 必然还要依赖于因特网上的信息检索。因特网信息检索是由众多站点、浏览器和搜索引擎及网络支撑组成的三角结构。其中的核心部分,不是众多站点,而是网络浏览器和具有收集、检索功能的搜索引擎。
众多站点、网页上的信息是因特网上信息的基本组成部分。在因特网发展初期,浏览器和简单的搜索引擎即可帮助人们检索所需的文献信息。浏览器 ,相当于提供了一个信息总目次 ,提供读者和用户对一个又一个网站进行直接地点击、浏 ,通过超文本链接 ,选择自己所需的信息。浏览虽然方法简易、直接,但随机性强,耗时量大,对于搜索因特网上的信息来讲时间和费用较高,因此更科学的方法是要借助搜索引擎。搜索引擎是因特网信息的网上检索工,它可以帮助用户快速搜索所需信息及其相关信息。搜索引擎是因特网上设立的一种特殊类型的站点,通过用户输入所需信息的关键词, 经由检索服务器处理内部数据库,找到相关资料并整理后送出,通过网络传给用户使用的主机,即可以通过下图所示的简单流程图来表示。这是就其检索功能而言,对因特网上的信息检索来说,它也离不开数据库的支持,而因
第1页(共10页)特网上数据库的收集、整理,是搜索引擎具备的另外一部分功能。
2因特网信息检索的方法
2.1因特网信息检索的一般方法
如果用户要在因特网上获取信息,就必须能够找到提供信息的服务器。所以,首先以找到服务器在网上的地址(URL)为目标 , 然后通过该地址去访问服务器提供的信息,它的检索方法一般来说有以下几种。2.1.1网上漫游
这是在因特网上发现、检索信息的原始方法。即在日常的网络阅读、漫游过程中,意外发现一些有用信息。这种方式的目的性不是很强 , 其不可预见性、偶然性使检索过程具有某种探索宝藏的意味,也许会充满乐趣 , 但也可能一无所获。2.1.2顺“链”浏览
指用户在阅读超文本文档时, 利用文档中的链接从一个网页转向另一个相关网页。有些类似于传统文献检索中的“追溯检索” , 即根据文献后所附的参考文献目录去追溯相关文献,一轮一轮地不断扩大检索范围。这种方式可以在很短的时间内获得大量相关信息 , 但也可能在“顺链检索”中偏离了检索目标,或迷失于网络信息空间中 , 而且找到合适的检索起点也并不容易。
通过网络资源指南(res ource guide)来查找信息为了对因特网这个无序的信息世界加以组织、管理 ,使大量有价值的信息纳入一个有序的组织体系,专业人员做了许多努力和开发。也就是基于专业人员对网络信息资源的产生、传递与利用机制的广泛了解和对网络信息资源分布状况的熟悉 , 以及对各种网络信息资源的采集、组织、评价、过滤、控制、检索等手段的全面把握而开发出的可供浏览和检索的网络资源主题指南。综合性的主题分类树体系的网络资源指南 , 如 Y ahoo 等。而专业性的网络资源指南就更多了 , 几乎一学科专业、重要课题、研究领域的网络资源指南都可在因特网上找到。
2.1.3 利用搜索引擎进行信息检索
它是较为常规普遍的网络信息检索方式。搜索引擎是提供给用户进行关键词、词组或自然语言的检索工具。用户提出检索要求 , 搜索引擎代替用
第2页(共10页)户在数据库中进行检索 ,并将检索结果提供给用户。它一般支持布尔检索、词组检索等功能。利用搜索引擎进行检索的优点是: 省时省力,简单方便,检索速度快、范围 ,能及时获取新增信息。其缺点是:由于采用计算机软件自动进行信息的加工、处理 , 且检索软件的智能化不是很高,造成检索的准确性不是很理想 ,与人们的检索要求及对检索效率的期望有一定的差距。目前在因特网上的搜索引擎层出不穷,比较有影响的英文搜索Y ahoo , AltaVista 等;比较有影响的中文搜索引擎有网易、搜狐、新浪等。
3因特网信息检索的特点
检索范围大 ,因特网是一个全球性的网络 , 信息资源分布在世界各地的服务器上 , 可供检索的资源包括大量的主页、多种报纸、全文期刊、各种组织机构发布的信息用户新闻以及原始技术报告等。3.1超文本检索
因特网检索的结果是完全可以直接阅读和利用的 Web页面文献全文。而且只需要简单地用鼠标点击 , 即可随意浏览。在多媒体的超文本中 , 不但有文字、图片 ,还可以有声音、动画、影视等形式的信息内容。界面友好 , Web信息检索工具界面丰富友好 , 使用户的检索相当方便 , 十分易于操作。Web 信息检索途径较多甚至还可按相关性程度对检索结果进行排序输出。检索时 , 只需按一定规则输入检索式 , 在发出检索命令后即可获得检索结果 , 通常检索结果包括文献页面的题名、内容简介、URL 地址等 ,并可据此获得更详细的超文本页面。良好的反馈能力和快速响应能力 , Web信息检索工具通常采用全文单词标引的方式 ,将因特网上的文本页面进行全文单词的自动倒排,建立庞大的索引数据库。这些Web信息检索的索引数据库 , 常常 24 小时就更新,大量的基于全文的单词倒排工作,通常是借助于有关的程序软件自动运行的 ,因而具有良好的信息反馈功能和快速响应功能。
4网络信息检索遇到的挑战
网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检
第3页(共10页)索工具发展的最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。
网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。但是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足。(1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受。(2)信息有用性评价困难。一些站点在网页中大量重复某些关键字,使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。(3)网络信息日新月异的变更,人们总是期望挑出最新的信息。然而网络信息时刻变动,实时搜索几乎不可能,就是刚刚浏览过的网页,也随时都有更新、过期、删除的可能。
5网络信息检索的前沿发展技术及展望
现代信息检索技术经历了由低级到高级的发展过程。目前正朝着多元化的方向发展。主要从信息检索的智能化、专业化、可视化、一站式及基于网格的5个方面来介绍现代信息检索技术的发展趋势。
随着信息技术的发展和用户检索需求的变化,现代信息检索技术在理念、人性化、智能化等方面发生了全面突破。本文探讨了现代信息检索技术发展趋势,从智能化、个性化、一站式、可视化四个方面进行了分析,对检索技术发展趋势展开了一定的探讨。
信息检索技术经过先组式索引检索、穿孔卡片检索、缩微胶卷检索、脱机批处理检索发展到今天的联机检索、光盘检索、网络检索等。其发展经历了由低级到高级的过程、传统的线性检索向超文本支持的非线性检索
第4页(共10页)发展。这主要依赖于信息技术的发展和信息用户的信息检索需求。这些始终是推动现代信息检索理论与技术发展的重要动力。那么,现代信息检索技术的发展趋势将来如何呢?而要对信息检索技术的发展作出成功的预测是十分困难的。但是可以在广泛调研、比较、分析的基础上把握其某些发展动态,发现一些影响现代信息检索技术发展的新变化、新技术、新理念。5.1智能化信息检索
智能化信息检索是人们把人工智能与信息检索技术结合起来应用于信息存取领域的成果。近年来Internet上不断涌现的人工智能产品。比如智能搜索引擎、智能浏览器、智能代理、知识共享智能体等。都将大大提高信息存取系统的智能化程度。智能化信息检索是当今信息检索技术研究的热点问题之一。也是未来信息检索主要的发展方向。智能化信息检索是基于自然语言的检索形式.机器根据用户所提供的自然语言表述的检索要求进行分析,而后形成检索策略进行搜索,它能够代替或辅助用户完成诸如选词、选库、构造检索式。甚至在数据库中进行自动推理查找等功能;系统对知识库检索推理的结果。可以使用户得到能够直接加以利用的信息,它是建立在一个或多个专家系统基础上的信息存取系统。用户所需要做的仅仅是告诉计算机想做什么,至于怎样实现则无须人工干预.这意味着用户将彻底从繁琐的规则中解脱出来。它是人工智能与检索技术的有机结合。检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。IBM的最新研究的检索系统Piquant能够基于对问题回答来完成用户的检索要求。Piquant能分析文章的语义结构,并揭示其没有显示的表现出来的知识。IBM研究人员演示了在Pinquant中提问“谁是加拿大总理?”,系统准确地找到了回答这个问题的文章,虽然在这篇文章中没有显示的提到我们提问中的单词。
提高信息检索的智能化是信息检索所致力于实现的一个重要特征,它包含2个方面的含义:一是用户检索需求理解的智能化。比如AskJeeve,AnswerBus(http://www.xiexiebang.comprehensive breakthrough occurred.This article discusses the trend of the development of modern information retrieval technology, intelligent, personalized, one-stop, visualize, four aspects has carried on the analysis of the retrieval technology development trend is discussed.Key words: the Internet;Information retrieval;Cutting-edge technology;The search engine
第9页(共10页)
第二篇:网络信息检索及其局限性(本站推荐)
【关键词】 网络信息 信息检索 搜索引擎网络信息检索简介
随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。
1.1 信息检索概念
信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。
1.2 网络信息检索的原理
网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。
① 布尔逻辑模型 这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。
② 模糊逻辑模型 它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。
③ 概率模型 它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。2 搜索引擎
搜索引擎是目前使用最为频繁的一种网络信息检索工具。与其他工具相比,它的检全率和检准率都比较高,具有很强的使用价值和广泛的应用前景。
2.1 搜索引擎的工作原理
作为一种www站点资源和其它网络资源进行组织和检索的检索工具,搜索引擎的检索机制一般包括数据采集和标引机制、数据组织机制和用户检索机制,基本构成如图1所示。① 数据采集标引机制按照一定规律和方式对网络上www站点进行搜索,并将搜索到的www页面信息存入搜索引擎的临时数据库中。
② 数据组织据组织机制的主要功能是对www页面信息进行整理以形成规范的页面索引,并建立相应的索引数据库。
③ 索引数据库是用户进行检索的基础,它的数据质量直接影响到检索效果,而搜索引擎的数据采集标和标引机制又是决定数据库质量的关键技术。
④ 用户检索机制帮助用户以一定方式检索引擎的索引数据库,以获得符合用户需要的www站点或页面。
2.2 搜索引擎的分类
按照用户查找的途径划分,可将搜索引擎分为如下几种: ① 基于关键词的搜索引擎 主要通过使用自动采集软件来对网络上的数据进行采集标引,建立成索引数据库。它主要采用自动搜索和标引方式来建立和维护其索引数据库,供用户查询使用。
② 基于分类目录的搜索引擎 一般依赖于按照某种分类标准进行人工编排的分类体系。
③ 联合式搜索引擎 是基于关键词的搜索引擎的另外一种表现形式,是后者与基于类目的搜索引擎的一种结合。2.3 搜索引擎的功能
目前Internet上的搜索引擎种类繁多,虽然各种搜索引擎都有自己的不同信息采集标引机制,在其他一些方面各具特色,但其基本功能却是相似的。
① 布尔逻辑检索 这一功能使得用户能使用AND、OR和NOT来进行关键词的搭配检索。
② 模糊检索 在用户进行检索的过程中,系统会对跟用户提供的关键词相似的词语进行检索,并返回包含关键词或是这些相似词的检索结果。
③ 截词检索 这种检索形式利用检索词的某一部分来进行检索。在搜索引擎中,用户提供包含“?”或是“*”通配符的检索项来进行检索。
④ 限定词检索 这种检索加减号检索,它用来规定检索项中必须出现或是必须不出现某些关键词。网络信息检索的局限 用户在查找网络信息资源时,不可避免的用到网络信息检索工具。检索工具的优劣很大程度的影响了用户的检索效率。虽然网络信息检索工具在最近几年有了长足的发展,但是到现在网络信息检索仍然存在着这样或是那样的局限。
3.1 文本信息检索的局限
① 网络信息标引的准确度不够 检索工具对网络信息资源的标引一般都存在着栅引准确度不够的问题,检索工具经常会在返回大量垃圾信息的同时丢失有用信息。当用户要进行特定的文献检索时,有时还会发现现存的检索工具无济于事,检索出来的数据完全被无用信息所覆盖。如想要通过搜索引擎查询清朝雍正年间李卫任浙江巡抚的资料,你只能够查到大量《李卫当官》之类无用信息。
② 搜索引擎的查全率不高 由于互联网上的信息资源以爆炸性的速度不断增长,搜索引擎采集数据的速度远远落后于信息资源的增长速度。单个搜索引擎的数据库所收集的Web页面大大不足,就是所有的搜索引擎所储存的数据也只占全球Web页面的50%强。由于这方面的原因,搜索引擎的检全率会无可避免的被降低。
③ 搜索引擎的查准率不高 一是返回的信息过多,这是现有搜索引擎检索信息的普遍现象;二是返回重复的信息,搜索引擎的检索结果中还经常重复出现同一信息源的不同部分,甚至出现不同信息源的相同内容信息。
④ 查询方式有限 目前大多数搜索引擎的查询方法比较单一,一般只提供分类查询方式和关键词查询方式。这样,一方面检索时不能从文献的多个方面对检索提问进行限制,只能就某一关键词或概念进行笼统的检索;另一方面,由于查询结果完全依赖于用户所给出的关键词,而大多数用户对他们检索的领域或索引数据库的关键词不太了解,因此使最后的查询结果相关性很差,往往是输入一个检索式,得到一大堆网址,但其中大部分是冗余信息。
⑤ 检索对象的数据结构单一 由于现在大多数网站使用的是传统的关系数据库对信息进行组织和存储,因此其使用的搜索引擎也是基于关系数据库的,这种传统的关系数据库非常擅长处理结构化的数据,但其对于非结构化的数据的处理能力则很弱。
⑥ 交互性不够 当前的搜索引擎与用户的交互性不够,与用户间缺乏足够的协作,不了解用户的情况,不记录用户提交的查询任务,不能处理用户的反馈信息,因而不能与用户进行足够好的交互以提高检索效率。3.2 多媒体信息检索的局限
到现在为止,虽然单独针对图像、视频、声音等媒体的检索技术已经出现,但还没有任何搜索引擎能够充分解决多媒体信息的检索,其主要表现在以下几个方面:
① 检索效果不够理想 目前,几乎所有的多媒体搜索引擎在多媒体信息的查准率方面都不能达到令人满意的程度,用户将在返回的几百个甚至上千个图像中筛选需要的那一幅。这是很费时和令人难以忍受的,而且有时你所用的搜索引擎根本检不出你想要的东西。归其原因,一方面是在于查询方式的单一,另一方面在于对图像的标引深度不够,这就要求完善图像检索和索引机制。
② 用户查询接口单一 理想的多媒体检索系统中,人是主动的,用户的查询接口能提供丰富的交互能力,且直观易用,使用户能够在主动交互过程中通过调整检索参数,表达对图像的语义感知,最终获取满意的结果。这就涉及到如何把用户的提问转换为可以执行检索的特征矢量、交互方式的设计,如何获取用户的内容感知等问题。目前的多媒体搜索引擎用户查询接口比较单一,大多只提供描述查询接口,即关键词提问框。
③ 图像特征信息的表示与检索不够完善 基于内容的图像检索,实质上就是进行图像特征相似度的比较,但目前这一技术还存在许多问题。
④ 信息的自动加工与人工标引不够 目前文本搜索引擎在这方面的发展正日趋完善,而多媒体搜索引擎的研究刚刚起步,尤其是图像信息的加工,图像不同于文本,文本自身就能说明要讲的内容,而图像内容却需要加入人的理解和描述,人工干预虽能提高查准率,但一方面能被人工标引的是极其有限的;另一方面由于人工标引劳动强度大而限制了检索的范围,如何对图像信息进行快速标引和准确分类是急待解决的主要问题。
另外,目前基于内容的检索技术多应用于对静态图像的检索,对动态图像的检索还没有多少行之有效的方法。但随着宽带网络的逐步实现,动态多媒体信息在网络中将会越来越多。参考文献】
张杰.浅论网络信息检索.江西图书馆学刊,2002年增刊.董慧.网络信息资源开发与利用.武汉:武汉大学出版社,2001.卢小宾.信息检索.北京:科学出版社,2003.李勇先,郑文良.人工智能在网络信息检索中的应用.图书馆建设,2003(4),4:81~83.焦玉英,符绍宏,何绍华.信息检索.武汉:武汉大学出版社,2001.
第三篇:网络信息检索实验报告
网络信息检索的应用和发展趋势
09软件1 W班09144136张越
摘要:随着信息时代的到来,网上信息资源的数量、种类不断增加,电子信息资源日益丰富,互联网技术也日新月异、层出不穷,人们通过网络能够获取大量所需信息,如何在信息的海洋中快捷、准确地找出所需信息,网络搜索引擎就像图书馆目录能指引读者迅速找到所需图书一样,为人们在网络信息海洋中导航。而面对日益丰富的电子信息资源,如何有效的利用网络资源查找自己需要的信息,并对其进行熟练、灵活、有效地运用,已经被越来越多的人重视。
关键字:搜索引擎 信息检索 网络 发展趋势
随着信息技术的飞速发展,因特网已经继报纸、期刊、广播、电视等,成为当代信息存储与传播的主要媒介之一。因特网有着极其丰富的信息资源,但是浩如烟海的信息资源往往让信息使用者眼花缭乱。人们总是不能在最短的时间内找到自己需要的最有用的资源。因此,我们需要通过信息检索来解决这个问题。信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。信息检索分为两种,即广义信息检索和狭义信息检索。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻。本文主要研究的就是狭义的信息检索中出现的问题及解决策略。
一、搜索引擎及其基本原理
搜索引擎是Internet上具有查询功能的网页的统称,是获取知识信息的工具。随着网络技术的发展,搜索技术逐渐完善,搜索引擎已广为人们使用。任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以及预期的用户群指向。它是一些网络服务商为网络用户提供的检索站点,它收集了网上的各种资源,然后根据一种固定的规律进行分类,提供给用户进行检索。
搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间进行搜索,搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法,通常根据网页中关键词的匹配程度,出现的位置、频次,链接质量等计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
二、网络信息检索技巧
3.1加强对因特网的管理
从以上问题,我们可以看出,因特网存在着问题,很大一部分是因为网络监管的不利造成的。因此,国家要加强宏观政策调控,并制定相应的法律法规政策,以法律条文的形式强制性规范网络,从而维持因特网秩序,保护网络环境。同时我们也应该加强公民的思想道德教育,将以德治网和以法治网有机地结合在一起,不断促进网络安全的发展,进一步减少网络诈骗等事件的发生。
3.2选择合适的搜索引擎及关键词
因为每个用户的需求不同,所以在选择搜索引擎时要综合考虑自己的需求,不能盲目地选择。如前文所说,搜索引擎分为关键词搜索引擎和目录搜索引擎。而信息检索最基本的要求就是选择合适的关键词,尤其是在使用关键词搜索引擎的时候。如果输入的关键词和用户所需要的准确信息联系不大,则用户很难迅速地找到自己需要的信息。所以这需要用户选择 富有特色的、合适的关键词,不能使用太过宽泛的词,尽量接近自己需要的信息,同时也应尽量避免拼写错误等低级错误。
3.3提高使用者检索专业水平及选择适合的数据库
要提高使用者的检索专业水平,就要对使用者进行相关信息检索的专业培训。培训的目的主要在于让使用者跳出传统的检索思维范畴,熟悉并能熟练运用新的检索技术,不断满足使用者日益增长的信息检索需要。同时使用者对于检索的范围等要有一个大概的了解,如果搜索出来的结果较多,则要适当减小范围;如果检索结果很少,则适当增大范围,对自己的检索策略做出及时调整。另外,根据检索的内容的范畴来选择合适的数据库是很重要的环节。而现有的数据库种类繁多,这也需要用户进行合适的选择,并迅速地找到主题分类目录,进而更准确地进行检索。
三、在实践中充分利用丰富的网络信息资源
搜索前,首先要分析一下自己的搜索需求,然后再选择关键字。在搜索过程中,关键字的选择充满着反复性,在搜索的过程中,切不可急躁,应该不断的筛选,分析所选择的关键字,直到找到满意的关键字为止。在搜索收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。如果搜索都能做到这样,搜索效率会不断的提高,网络信息资源会得到更多和更好的利用。此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录,就是要分门别类地存放在相应的目录中,用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索。总之,在网络信息资源检索的过程中,要耐心、细致、多角度思考,不忽略每一个检索点,只有这样,才能圆满完成检索任务。
四、网络信息检索的发展趋势
(1)信息检索的多样化。其具体趋势表现为:网络检索信息的形态多种多样;多媒体信息检索变得普遍;网上检索工具向其他服务范畴扩展,以各种形式满足大众的信息需要。
(2)信息检索的智能化。智能化信息检索是当今信息检索技术研究的热点问题之一,也是未来信息检索主要的发展方向。可以使用户得到能够直接加以利用的信息,它是建立在一个或多个专家系统基础上的信息检索系统。
(3)信息检索的专业化。专业化信息检索是指面向某一特定专业或学科领域,提供高质量的专业信息的检索。可以提高检索速度,和信息专指度,加大检索深度、力度,从而提高全=面和准确。
参考文献:
[1]鄢百其等,网络信息检索技巧及析疑[J].武汉科技大学学报(社会科
学版),2008,10(2).[2]李秀芹,葛永亮.略论网络信息检索[J].科技信息,2007(15):325.[3]黄如花,张春蕾.网络信息检索的发展趋势[J].图书情报知识,2002(4):48-50.[4]杨海涛.网络信息检索的困境及发展趋势[J].科技情报开发与经济,2008(11):13-14.
第四篇:网络信息检索论文
网络时代新特征
——读《理解媒介:论人的延伸》有感
由于没读《世界是平的》,所以谈谈读《理解媒介:论人的延伸》对网络时代新特征的理解。加拿大传播学巨匠麦克卢汉的著作《理解媒介》中阐述的主要观点是:“媒介是人的延伸,思维的延伸。人类的思维交流从面对面,到了电话,到了网络,不断将世界拉近。” 的确,媒介的变化和改进深深地影响着人类社会的方方面面,甚至影响到社会的变革。麦克卢汉在1964年预言:随着电子媒介的发展,世界日益成为一个地球村。他认为人类社会的发展经历了一个部落化——非部落化——重新部落化的过程,最终整个世界成为一个新的“地球村”。在原始社会,口语是主要的传播媒介,由于听力有限,人们必须生活在小空间的部落群体之中,相互保持近距离的密切关系。文字和印刷媒介产生之后,人咧可以分散到广阔的地域,部落神会便发生了解体。电子媒介的普及再次改变了这种状况,谈们的床不速度和实时性再次将遥远的世界拉得很近,人与人的距离大大“缩小”,于是重新“部落化”,形成“地球村”。在电子媒介刚出现时,大多数人并不相信他的这一预言,但事实是新媒介正逐渐将这一预言实现。电子化的、通过电线、光纤、无线电等技术传送信息的网络使得任何种类的信息都可以突破时空的限制自由的传送。
当今,互联网的浪潮正以难以想象的速度和不可阻挡的势头席卷全球。我觉得甚至可以这样理解,第三次科技革命就是信息传播媒介的革命,网络计算机技术改变最深刻的就是传播和人们交流信息的方式。一方面,从传统的印刷技术到现代的数字化的通讯技术和通讯网络,信息传播的方式突飞猛进;另一方面,信息传播方式的革命正在改变经济增长方式以及世界经济格局,是企业进入数字经济时代。信息传播方式的革命促使人类的一切都可以虚拟化。逐渐出现的虚拟办公、虚拟企业、虚拟学校、虚拟图书馆、虚拟商城等,将改变人类经济与社会活动方式。甚至可以说,这种革命会影响到政治、文化等更生层次的领域。
麦克卢汉还认为,这种变化不仅仅是社会整体层面的变化,更是其组成单位——人的个体的变化。麦克卢汉说印刷媒介时代的人是割裂的、残缺不全的人,他认为是印刷文字的语法把人类分裂为相互独立的自私自利的派别,分裂为种和民族,分裂为情感的派别。他也相信,电子传播中网络那种统一的力量又可能使人类重新回到整合统一的状态。我觉得这种观点很有深度,也很有远见。
在互联网上,世界正在变成一个没有时差,没有距离的整体,变成一个超越传统是空的“网络时空”。在网络时空中,人们可以更多的利用网络娱乐,包括收听、下载音乐,观看电影,人们可以利用网络购物,订票,订酒店等等,网络承担起人类娱乐、休闲新载体的任务。另外,在网络时空中,人们还可以通过虚拟图书馆、博物馆、艺术馆等来收集需要的信息,在网络上学习,工作。
非常佩服麦克卢汉在40多年前就能做出这样的预言,正是互联网这种麦克卢汉所预言的新媒介深刻的改变着世界,在经济全球化的进程中,世界不断在变小,有人说互联网既是新媒介也是新市场,我们需要通过互联网来了解网络时代的新特征,更好的利用互联网。
第五篇:关于网络信息检索论文
信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。下面小编为大家搜索整理了关于网络信息检索论文,希望对大家有所帮助。
浅谈网络信息检索的现状及其发展趋势
【摘要】随着计算机技术及网络技术的发展,网络信息检索显得越发重要。本文主要综述了网络信息检索的全文数据库、搜索引擎、互联网“超链接”等现行检索模式及它的智能化、一站式化、可视化等发展趋势。
【关键词】网络信息检索;现状;发展趋势
1、信息检索概述
信息检索(Information Retrieval)是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要指出其中相关信息的过程,因此它的全称叫“信息存储与检索”。
随着互联网的发展,人类社会的信息化、网络化进程大大加快。当今出现的一系列新型检索模式,包括网络信息规范控制标准等为网络检索技术的未来展现了新希望,与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。
2、网络信息检索的现状
对大多数读者而言,检索并不意味着发现,而是获得。人们希望不仅仅是提供宽泛的检索结果,而应该是计算机能试图理解用户提问的意图,并对检索结果进行适当的分类和排序。但是,现有的搜索引擎大多是基于简单的关键词匹配,不能真正理解用户的检索意图;各个搜索引擎的信息搜集和索引建立有很大的不同,每个搜索引擎平均只能涉及到整个网上资源的30%~50%,而其中真正有用的信息也只占很小的比例,这就意味着使用任何一个搜索引擎都只能检索到网络中的部分资源。目前网络检索面临一系列的挑战,网络信息量迅猛增加,人工已经无法对它们进行有效的分类、索引和利用;简单的关键词搜索,返回的信息量过大,已经让用户无法承担;网络信息组织的无序性;信息有用性评价困难;网络信息日新月异的更变;信息媒体的多样化;带宽等其它因素的制约,这些都给因特网信息的获取造成了极大的阻碍。这样就造成了要求智能化、专业化、多元化、多媒体化的网络信息检索工具出现的呼声越来越高,并且有更多的人参与到其中来。如此种种,给当今的网络信息检索研究带来了发展机遇,也给了它无限的发展空间。
3、网络信息检索的现行模式
3.1 网络全文数据库检索
网络全文数据库是以全文数据为数据库对象,并在网上提供全文检索服务的数据库。按数据库的生产机构分类,可分为出版商全文期刊数据库和生产商全文期刊数据库。前者主要是那些期刊出版单位在其出版的印刷期刊基础上建立的网络电子期刊全文数据库。而后者则是由数据库生产商根据一定的主题或一定的收录范围整合一定数量的期刊出版物而产生的全文数据库。国内全文数据库主要有中国学术期刊全文数据库。
3.2 网络搜索引擎检索
搜索引擎是一个专门的系统,它可以对互联网信息资源进行搜索整理和分类,并将其储存在网络数据库中供用户查询。搜索引擎包括搜集信息、分类和用户查询等三大部分。目前流行的搜索引擎有两大类:关键词全文检索式搜索引擎和分类目录式搜索引擎。
关键词全文检索式搜索引擎主要利用其内部的搜索机器人和蜘蛛程序,自动搜索来自互联网上的各种内容,在每一个关键词和所有相关的网页之间按照网页相关性原理建立一个对应关系,储存在其网络服务器的数据库中。用户只要输入关键词就可以找到符合该关键词特征的所有被索引的网页,搜索结果以超链接的方式列表,搜索结果有简单介绍,用户点击相应的链接就可以进入相应的网络资源网站,从而找到所需信息。用这种方式搜索到的结果通常数以百万计,但是相关性越高的信息,在搜索结果列表中的位置越靠前。分类目录式搜索引擎将互联网信息按照一定的标准进行收集和分类,并编入相应目录,以层级和逐次分项的方式管理目录,查找信息可以按照分类目录一层层进入,最终找到所要的信息。
3.3 互联网“超链接”搜索
Web信息以超文本链接方式组织,基本组织单元是信息节点而不是字符串,信息节点之间通过链接进行联系。超链接是网页必不可少的一个元素,同一主题或相关的信息因超链接构成了信息网。超文本信息检索技术,以超文本信息节点之间的多种链接关系为基础,根据思维联想或查找信息的需要,通过链接从一个信息节点转到另一个信息节点。
4、网络信息检索的未来发展趋势
网络技术的发展,给网络信息检索及信息的网络化带来的极大的便利,进一步推动了网络信息检索理论和技术的快速发展。怎样为网络用户提供高质量、高效率的检索方式是网络信息检索研究者的努力方向。信息检索的对象已从传统的文本信息扩展到如今开放、动态、分布广泛的多媒体信息。那么,网络信息检索的发展趋势如何呢?
4.1 智能化信息检索
智能化信息检索是基于自然语言处理的检索形式。检索工具是对用户提供的以自然语言表达的检索要求进行分析,从而形成检索策略进行检索。检索工具智能化的内涵在于检索工具具有学习、分析、辨别和推理的能力。近年来,因特网上不断涌现的人工智能产品,如智能搜索引擎、智能浏览器、智能代理等,它们将提高网络信息检索的智能化程度,促进智能信息检索的发展。
网络中的智能代理通常是一个专家系统、一个过程、一个模块或一个求解单元。智能代理可以获得用户的信息需求,自动检索信息和推送检索结果信息。多智能代理系统还具有信息发现、信息筛选、信息推送和信息导航功能,可满足专业研究人员的特定需求,实现网络信息检索与服务的智能化。
4.2 一站式信息检索
一站式(One Stop)信息检索是指用户通过一个检索工具能满足自己所有的信息检索需求。一站式信息检索将是网络信息检索服务的一种发展模式。一站式检索服务是人性化服务的重要体现,它将大量节约用户的检索时间。全球最大的搜索引擎Google正在朝着一站式服务的方向发展。2004年12月,Google宣布与纽约公共图书馆和包括哈佛大学图书馆在内的4个主要图书馆合作,将这些图书馆的大约1500万册藏书扫描进自己的数据主库以提供网络用户检索。目前,Google已经为其用户提供了某种程度上的一站式的检索服务了。而其他越来越多的检索服务提供商将向一站式检索方向发展。
4.3 可视化
可视化指的是运用计算机图形学和图像处理技术,将数据转换为图形或图像在屏幕上显示出来,并进行交互处理的理论、方法和技术。据统计,获取信息有70%~80%靠视觉,20%靠听觉,10%靠触觉。用图像取代文字帮助人们检索的优点在于:图像的表达更生动、结束语形象、准确,效率更高,具有交互性、多维性、可视性等特点,可以大大加快检索速度,使时刻都在产生的海量数据得到有效利用。
4.4 商业化
目前网络信息检索系统已成为新的投资热点,网络信息检索系统不再仅仅是一种检索工具,而且是一种商业产品。2001年10月,全球最大的中文搜索引擎提供商百度联合新浪等多家中文门户网站,共同推广“搜索引擎竞价排名”全新网络商业服务模式。网络信息检索的商业化还体现在联机和光盘检索逐渐进入网络环境。由于目前网络信息检索的检准率低,联网的收费联机和光盘检索依旧受到青睐,如世界著名的联机信息系统DIALOG、OCLC、EBSCO、Silverplatter,国内的万方数据资源系统、中国学术期刊光盘、重庆维普公司系列光盘等都纷纷在网上设立自己的网络检索入口。许多著名科技期刊的上网丰富了网络资源,它们大多数都是在提供印刷版的同时提供期刊的网上服务,包括收费检索。
5、小结
在的网络信息资源中寻找自己所需要的信息资源是一件极具挑战性的工作。为此,许多信息专家正在积极地研究探索,并且取得了不少成果。我们相信随着科学技术的进步,网络信息检索发展会越来越快,人们所利用的检索工具和手段的更替会更加频繁。
参考文献
[1]黄静.网络信息检索发展方向展望[J].Journal of Library and Information Sciences in Agriculture,2008(1):15-19.[2]霍小梅,王小兰.网络信息检索的现状及发展趋势[J].图书馆论坛,2004(4):180-182.[3]戴莉.网络信息检索的发展趋势[J].情报探索,2005(2):52-54.[4]徐谦.网络信息检索的智能化趋势[J].图书馆理论与实践,2006(2):63-65.[5]谢新洲.网络信息检索技术与案例[M].北京:北京图书馆出版社,2005:9.[6]易向军.网络信息检索现状及未来[J].合肥学院学报,2007(7):90-92.