第一篇:网络信息检索考察题
《网络信息检索》考察题
2010年6月8日
一、问答题
1.2.3.4.5.6.7.信息素养主要有哪些要素? 什么是信息检索?信息检索有哪些途径? 什么是布尔逻辑检索?它包括哪三种基本运算? 什么是搜索引擎?举出国内外常用搜索引擎各3个。温州大学图书馆有哪些电子图书数据库?其中,读秀提供了多少种电子图书? CNKI的英文全称是什么?其数据库收录了哪些资源?其中包括多少种国内期刊? 温州大学图书馆拥有国外全文综合数据库有哪些?全文专业数据库有哪些?二次信息库有哪些?
8.温州大学图书馆有哪些音像资源?我馆购买的“网上报告厅”中,有哪些学术报告类目?有哪些学术鉴赏类目?KUKE数字音乐图书馆收录了多少曲目?新东方多媒体学习库包括哪四个类目?
9.CASHL的英文全称和中文名称是什么?其人文社会科学外文资源涉及哪些学科领域?
10.NSTL的英文全称和中文名称是什么?其资源建设的近期目标是什么?
11.CALIS的英文全称和中文名称是什么?在其发展目标中,准备为中国高等学校建立哪六大数字服务环境
12.学术论文的特点是什么? 学术论文一般有哪些部分组成?
二、操作题
1.通过CNKI文献出版报表功能,查看您所学专业(如数学),有多少电子期刊、博士论文和硕士论文。
2.用万方数据库的快速检索功能,自拟一个您所学专业相关检索词,进行知识脉络检索,在检索结果中选择2-5个主题进行比较分析。将比较分析结果拷贝到试卷。
3.在中国经济信息网检索一篇篇名中含有低碳的文章,并复制一段文字到试卷。
4.在EBSCO数据库中,检索题名中包含“信息”并含有全文的期刊文献,并记录检索结果。
5.在Elsevier中,检索标题中包含Political Geography、发表时间是2005年至今的期刊论文,并挑选一篇,以PDF格式打开进行阅读。此外,记录此文的文章题目、表格图片数量以及参考文献数量。
6.在 Emerald中,用高级检索模式检索我馆购买的期刊文献,文章标题中含有political power。记录检索结果数量。
7.在新东方多媒体学习库 “四六级”模式下浏览“新四级基础深度精讲”,下载讲义。将讲义中的前两行拷贝到本题答案位置。
8.检索于丹的《论语》感悟并播放,浏览作者于丹的简介并将其拷贝到本题答案位置。
三、综合题
1.利用综合信息检索知识,检索并参考数字图书、纸质图书、期刊、学位论文、免费网络资源等,架构一篇学术论文。(论文主题自拟,最好和自己的学科相关,可以是自己的毕业论文)。具体要求:
⑴ 描述通过信息检索获得论题思路的过程
⑵ 列出论文提纲(论文标题及两级标题,可对提纲内容进行简短介绍)
⑶ 按照中华人民共和国国家标准(GB/T 7714-2005)” 所规定的文后参考文献著录规则,列出主要参考文献
2.试述学习网络信息检索课的认识、收获、体会,并提出对本课内容或方法上的建议。
第二篇:信息检索题
1、所在核心期刊:1.软件学报2.计算机学报3.自动化学报4.计算机工程5.控制与决策
6.控制理论与应用 7.计算机应用研究 8.计算机科学9.计算机工程与设计10.计算机研究与发展11计算机工程与科学
2、《中文核心期刊目录总览》由中国知网、中国学术期刊网和北京大学图书馆期刊工作研究会联合发布中文核心期刊目录。
第三篇:网络信息检索与利用考察课
1、你如何认识“信息爆炸”和“信息污染”?
参考答案:信息几何级数递增,有用与高值信息被大量低值与无用信息和负值信息(如黄色信息,危害党和国家的言论,虚假信息等)掩盖,再者众多信息(尤其是网络信息)的无序化导致检索使用困难。
2、简述信息资源的定义及特征。
参考答案:定义:信息资源是指人类社会中经过加工处理的大量有序化信息的集合。特征:共享性、非稀缺性、动态性、对象的选择性、时效性等等。
3、网络信息的主要传播渠道有哪些?
答案要点:电子邮件,Usenet(网络新闻),FTP(文件传送),Gopher(信息检索),www.xiexiebang.com)
7、《高校图书馆信息化建设与创新型人才培养》作者:侯占奎罗玉英张立秋
8、《浅论图书馆服务特点从传统到现代的转变》作者:王现则
9、《管理元素之影响图书馆效能》作者:田发银
10、杨福云.试论高校图书馆在学生素质教育中的作用[J].福建农业大学学报(社会科学版),2001-04-05,4(2):89-91.11、刘家丰.素质教育概论[M].北京:中国档案出版社,2001:86.12、孙曙明.关于开展对大学生信息素质教育的思考[J].教育与职业,2006(35):183-184.13、张俊玲.论数字图书馆员的信息素质[J].图书馆,2007(2):88-89.14、卢培文.学科图书馆员在信息素养教育的作用[c]∥胡越.图书馆学科化、个性化国际学术研讨会文集.北京:首都师范大学出版社,2008:266-269.
第四篇:网络信息检索及其局限性(本站推荐)
【关键词】 网络信息 信息检索 搜索引擎网络信息检索简介
随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。
1.1 信息检索概念
信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。
1.2 网络信息检索的原理
网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。
① 布尔逻辑模型 这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。
② 模糊逻辑模型 它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。
③ 概率模型 它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。2 搜索引擎
搜索引擎是目前使用最为频繁的一种网络信息检索工具。与其他工具相比,它的检全率和检准率都比较高,具有很强的使用价值和广泛的应用前景。
2.1 搜索引擎的工作原理
作为一种www站点资源和其它网络资源进行组织和检索的检索工具,搜索引擎的检索机制一般包括数据采集和标引机制、数据组织机制和用户检索机制,基本构成如图1所示。① 数据采集标引机制按照一定规律和方式对网络上www站点进行搜索,并将搜索到的www页面信息存入搜索引擎的临时数据库中。
② 数据组织据组织机制的主要功能是对www页面信息进行整理以形成规范的页面索引,并建立相应的索引数据库。
③ 索引数据库是用户进行检索的基础,它的数据质量直接影响到检索效果,而搜索引擎的数据采集标和标引机制又是决定数据库质量的关键技术。
④ 用户检索机制帮助用户以一定方式检索引擎的索引数据库,以获得符合用户需要的www站点或页面。
2.2 搜索引擎的分类
按照用户查找的途径划分,可将搜索引擎分为如下几种: ① 基于关键词的搜索引擎 主要通过使用自动采集软件来对网络上的数据进行采集标引,建立成索引数据库。它主要采用自动搜索和标引方式来建立和维护其索引数据库,供用户查询使用。
② 基于分类目录的搜索引擎 一般依赖于按照某种分类标准进行人工编排的分类体系。
③ 联合式搜索引擎 是基于关键词的搜索引擎的另外一种表现形式,是后者与基于类目的搜索引擎的一种结合。2.3 搜索引擎的功能
目前Internet上的搜索引擎种类繁多,虽然各种搜索引擎都有自己的不同信息采集标引机制,在其他一些方面各具特色,但其基本功能却是相似的。
① 布尔逻辑检索 这一功能使得用户能使用AND、OR和NOT来进行关键词的搭配检索。
② 模糊检索 在用户进行检索的过程中,系统会对跟用户提供的关键词相似的词语进行检索,并返回包含关键词或是这些相似词的检索结果。
③ 截词检索 这种检索形式利用检索词的某一部分来进行检索。在搜索引擎中,用户提供包含“?”或是“*”通配符的检索项来进行检索。
④ 限定词检索 这种检索加减号检索,它用来规定检索项中必须出现或是必须不出现某些关键词。网络信息检索的局限 用户在查找网络信息资源时,不可避免的用到网络信息检索工具。检索工具的优劣很大程度的影响了用户的检索效率。虽然网络信息检索工具在最近几年有了长足的发展,但是到现在网络信息检索仍然存在着这样或是那样的局限。
3.1 文本信息检索的局限
① 网络信息标引的准确度不够 检索工具对网络信息资源的标引一般都存在着栅引准确度不够的问题,检索工具经常会在返回大量垃圾信息的同时丢失有用信息。当用户要进行特定的文献检索时,有时还会发现现存的检索工具无济于事,检索出来的数据完全被无用信息所覆盖。如想要通过搜索引擎查询清朝雍正年间李卫任浙江巡抚的资料,你只能够查到大量《李卫当官》之类无用信息。
② 搜索引擎的查全率不高 由于互联网上的信息资源以爆炸性的速度不断增长,搜索引擎采集数据的速度远远落后于信息资源的增长速度。单个搜索引擎的数据库所收集的Web页面大大不足,就是所有的搜索引擎所储存的数据也只占全球Web页面的50%强。由于这方面的原因,搜索引擎的检全率会无可避免的被降低。
③ 搜索引擎的查准率不高 一是返回的信息过多,这是现有搜索引擎检索信息的普遍现象;二是返回重复的信息,搜索引擎的检索结果中还经常重复出现同一信息源的不同部分,甚至出现不同信息源的相同内容信息。
④ 查询方式有限 目前大多数搜索引擎的查询方法比较单一,一般只提供分类查询方式和关键词查询方式。这样,一方面检索时不能从文献的多个方面对检索提问进行限制,只能就某一关键词或概念进行笼统的检索;另一方面,由于查询结果完全依赖于用户所给出的关键词,而大多数用户对他们检索的领域或索引数据库的关键词不太了解,因此使最后的查询结果相关性很差,往往是输入一个检索式,得到一大堆网址,但其中大部分是冗余信息。
⑤ 检索对象的数据结构单一 由于现在大多数网站使用的是传统的关系数据库对信息进行组织和存储,因此其使用的搜索引擎也是基于关系数据库的,这种传统的关系数据库非常擅长处理结构化的数据,但其对于非结构化的数据的处理能力则很弱。
⑥ 交互性不够 当前的搜索引擎与用户的交互性不够,与用户间缺乏足够的协作,不了解用户的情况,不记录用户提交的查询任务,不能处理用户的反馈信息,因而不能与用户进行足够好的交互以提高检索效率。3.2 多媒体信息检索的局限
到现在为止,虽然单独针对图像、视频、声音等媒体的检索技术已经出现,但还没有任何搜索引擎能够充分解决多媒体信息的检索,其主要表现在以下几个方面:
① 检索效果不够理想 目前,几乎所有的多媒体搜索引擎在多媒体信息的查准率方面都不能达到令人满意的程度,用户将在返回的几百个甚至上千个图像中筛选需要的那一幅。这是很费时和令人难以忍受的,而且有时你所用的搜索引擎根本检不出你想要的东西。归其原因,一方面是在于查询方式的单一,另一方面在于对图像的标引深度不够,这就要求完善图像检索和索引机制。
② 用户查询接口单一 理想的多媒体检索系统中,人是主动的,用户的查询接口能提供丰富的交互能力,且直观易用,使用户能够在主动交互过程中通过调整检索参数,表达对图像的语义感知,最终获取满意的结果。这就涉及到如何把用户的提问转换为可以执行检索的特征矢量、交互方式的设计,如何获取用户的内容感知等问题。目前的多媒体搜索引擎用户查询接口比较单一,大多只提供描述查询接口,即关键词提问框。
③ 图像特征信息的表示与检索不够完善 基于内容的图像检索,实质上就是进行图像特征相似度的比较,但目前这一技术还存在许多问题。
④ 信息的自动加工与人工标引不够 目前文本搜索引擎在这方面的发展正日趋完善,而多媒体搜索引擎的研究刚刚起步,尤其是图像信息的加工,图像不同于文本,文本自身就能说明要讲的内容,而图像内容却需要加入人的理解和描述,人工干预虽能提高查准率,但一方面能被人工标引的是极其有限的;另一方面由于人工标引劳动强度大而限制了检索的范围,如何对图像信息进行快速标引和准确分类是急待解决的主要问题。
另外,目前基于内容的检索技术多应用于对静态图像的检索,对动态图像的检索还没有多少行之有效的方法。但随着宽带网络的逐步实现,动态多媒体信息在网络中将会越来越多。参考文献】
张杰.浅论网络信息检索.江西图书馆学刊,2002年增刊.董慧.网络信息资源开发与利用.武汉:武汉大学出版社,2001.卢小宾.信息检索.北京:科学出版社,2003.李勇先,郑文良.人工智能在网络信息检索中的应用.图书馆建设,2003(4),4:81~83.焦玉英,符绍宏,何绍华.信息检索.武汉:武汉大学出版社,2001.
第五篇:网络信息检索实验报告
网络信息检索的应用和发展趋势
09软件1 W班09144136张越
摘要:随着信息时代的到来,网上信息资源的数量、种类不断增加,电子信息资源日益丰富,互联网技术也日新月异、层出不穷,人们通过网络能够获取大量所需信息,如何在信息的海洋中快捷、准确地找出所需信息,网络搜索引擎就像图书馆目录能指引读者迅速找到所需图书一样,为人们在网络信息海洋中导航。而面对日益丰富的电子信息资源,如何有效的利用网络资源查找自己需要的信息,并对其进行熟练、灵活、有效地运用,已经被越来越多的人重视。
关键字:搜索引擎 信息检索 网络 发展趋势
随着信息技术的飞速发展,因特网已经继报纸、期刊、广播、电视等,成为当代信息存储与传播的主要媒介之一。因特网有着极其丰富的信息资源,但是浩如烟海的信息资源往往让信息使用者眼花缭乱。人们总是不能在最短的时间内找到自己需要的最有用的资源。因此,我们需要通过信息检索来解决这个问题。信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。信息检索分为两种,即广义信息检索和狭义信息检索。狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻。本文主要研究的就是狭义的信息检索中出现的问题及解决策略。
一、搜索引擎及其基本原理
搜索引擎是Internet上具有查询功能的网页的统称,是获取知识信息的工具。随着网络技术的发展,搜索技术逐渐完善,搜索引擎已广为人们使用。任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能和使用方法,以及预期的用户群指向。它是一些网络服务商为网络用户提供的检索站点,它收集了网上的各种资源,然后根据一种固定的规律进行分类,提供给用户进行检索。
搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间进行搜索,搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法,通常根据网页中关键词的匹配程度,出现的位置、频次,链接质量等计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
二、网络信息检索技巧
3.1加强对因特网的管理
从以上问题,我们可以看出,因特网存在着问题,很大一部分是因为网络监管的不利造成的。因此,国家要加强宏观政策调控,并制定相应的法律法规政策,以法律条文的形式强制性规范网络,从而维持因特网秩序,保护网络环境。同时我们也应该加强公民的思想道德教育,将以德治网和以法治网有机地结合在一起,不断促进网络安全的发展,进一步减少网络诈骗等事件的发生。
3.2选择合适的搜索引擎及关键词
因为每个用户的需求不同,所以在选择搜索引擎时要综合考虑自己的需求,不能盲目地选择。如前文所说,搜索引擎分为关键词搜索引擎和目录搜索引擎。而信息检索最基本的要求就是选择合适的关键词,尤其是在使用关键词搜索引擎的时候。如果输入的关键词和用户所需要的准确信息联系不大,则用户很难迅速地找到自己需要的信息。所以这需要用户选择 富有特色的、合适的关键词,不能使用太过宽泛的词,尽量接近自己需要的信息,同时也应尽量避免拼写错误等低级错误。
3.3提高使用者检索专业水平及选择适合的数据库
要提高使用者的检索专业水平,就要对使用者进行相关信息检索的专业培训。培训的目的主要在于让使用者跳出传统的检索思维范畴,熟悉并能熟练运用新的检索技术,不断满足使用者日益增长的信息检索需要。同时使用者对于检索的范围等要有一个大概的了解,如果搜索出来的结果较多,则要适当减小范围;如果检索结果很少,则适当增大范围,对自己的检索策略做出及时调整。另外,根据检索的内容的范畴来选择合适的数据库是很重要的环节。而现有的数据库种类繁多,这也需要用户进行合适的选择,并迅速地找到主题分类目录,进而更准确地进行检索。
三、在实践中充分利用丰富的网络信息资源
搜索前,首先要分析一下自己的搜索需求,然后再选择关键字。在搜索过程中,关键字的选择充满着反复性,在搜索的过程中,切不可急躁,应该不断的筛选,分析所选择的关键字,直到找到满意的关键字为止。在搜索收录网站时,只要网站本身没有违反有关的规则,一般都能登录成功。如果搜索都能做到这样,搜索效率会不断的提高,网络信息资源会得到更多和更好的利用。此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录,就是要分门别类地存放在相应的目录中,用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索。总之,在网络信息资源检索的过程中,要耐心、细致、多角度思考,不忽略每一个检索点,只有这样,才能圆满完成检索任务。
四、网络信息检索的发展趋势
(1)信息检索的多样化。其具体趋势表现为:网络检索信息的形态多种多样;多媒体信息检索变得普遍;网上检索工具向其他服务范畴扩展,以各种形式满足大众的信息需要。
(2)信息检索的智能化。智能化信息检索是当今信息检索技术研究的热点问题之一,也是未来信息检索主要的发展方向。可以使用户得到能够直接加以利用的信息,它是建立在一个或多个专家系统基础上的信息检索系统。
(3)信息检索的专业化。专业化信息检索是指面向某一特定专业或学科领域,提供高质量的专业信息的检索。可以提高检索速度,和信息专指度,加大检索深度、力度,从而提高全=面和准确。
参考文献:
[1]鄢百其等,网络信息检索技巧及析疑[J].武汉科技大学学报(社会科
学版),2008,10(2).[2]李秀芹,葛永亮.略论网络信息检索[J].科技信息,2007(15):325.[3]黄如花,张春蕾.网络信息检索的发展趋势[J].图书情报知识,2002(4):48-50.[4]杨海涛.网络信息检索的困境及发展趋势[J].科技情报开发与经济,2008(11):13-14.