【云南大学】信息检索期末复习重点

时间:2019-05-14 20:52:58下载本文作者:会员上传
简介:写写帮文库小编为你整理了多篇相关的《【云南大学】信息检索期末复习重点》,但愿对你工作学习有帮助,当然你在写写帮文库还可以找到更多《【云南大学】信息检索期末复习重点》。

第一篇:【云南大学】信息检索期末复习重点

云南大学信息检索重点

第一章

一、检索策略

定义:在处理信息需求提问实质的基础上确定检索途径、检索词语并明确各词语之间的逻辑关系,查找步骤、系统输出顺序等方面的科学安排,与检索效果密切相关。

二、检全率与检准率

1.检全率及其影响:检全率=(检出的相关信息数/信息库中相关信息总数)x100% 2.检准率及其影响:检准率=(检出的相关信息数/检出的信息总数)x100% 影响检出文献的检索效果的质量。

三、检索模型

1.布尔检索模型

(1)定义:布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表达用户提问,通过对文献表示与提问式的逻辑运算来检索文献。

(2)优点:简单、易理解、易实现、能处理结构化提问

(3)缺点:A.布尔检索式的非友善性,即构建一个好的检索式是不容易的。尤其是对复杂的检索课题,不易套用布尔检索模型。B.易造成零输出或过量输出。检索输出完全依赖布尔提问式与系统倒排挡中的文献匹配情况,输出量较难控制。

C.无差别的组配元,不能区分各组配元的重要程度。

D.匹配标准存在某些不合理的地方。由于匹配标准是有或无,因此,对于文献中表因此的数量没有评判,都一视同仁。

E.检索结果不能按照重要性排序输出。2.向量检索模型

(1)定义:向量检索是以向量的方式确定检索内容的方法,系统中的每一篇文献和每个提问均用等长的向量表示。

(2)优点:A.采用自动标引技术维文献提供标引词

B.改变了布尔检索非“1”即“0”的简单判断,标引词和文献的相关程度可在【0,1】闭区间中取值,使标引和检索者都可比较灵活地定义组配元(标引词)与文献的关系深度,改变了布尔检索模型僵化的特点。

C.由于以其相似的程度作为检索的标准,可从量的角度判断文献命中与否,从而使检索更趋于合理。

D.检索结果可按提问的相关度排序输出便于用户通过相关反馈技术修正提问,控制检索量。E.布尔模型的逻辑关系依然可以使用,保留了直观性和方便性。

(3)缺点:A.如检索过程转化为向量的计算方法,不能反映出文献之间的复杂关系

B.由于对任何一个提问都需要计算全部文献库中的每一篇文献,因此,计算量大、算法复杂度高。

C.由于标引加权和检索加权是分离的,因此,随意性较大,难以保证质量。3.概率检索模型

4.扩展布尔逻辑检索模型 5.相关反馈模型

四、信息检索的步骤

1.分析研究课题,明确查找要求 2.选择检索工具 3.制定检索策略、途径和方法 4.根据文献线索,查阅原始文献

五.信息检索的方法

1.布尔检索

与(AND *):A*B,表明一篇文献中A和B同时存在

或(OR +):A+B,表明一篇文献中A或B必须存在,也包含同时存在 非(NOT-):A-B,表明一篇文献中包含A但不包含B 2.截词检索(1)类型

A.按截断位置:后截断、前截断、中截断; B.截断的字符数量:有限截断、无限截断。(2)实施

A.后截断:将截词符号放在字符串右方,保持词的前方一致。computer*computerise/computers B.前截断:将截词放在字符串左方,保持词的后方一致。*computermicrocomputer/minicomputer

C.前后同时截断:*computer* D.中截断:又称通用字符法,将截词放在检索词的中间,主要解决一个词的英、美不同拼法及有些词的单复数问题。

organi?ationorganisation/organization 3.限制检索

4.全文位置检索 5.加权检索 6.多媒体检索

第二章

一.基本概念

1.书目数据库

(1)定义:书目数据库是指存储某个领域的三次文献(如文摘、题录、目录等)书目数据的一类数据库,属于参考性数据库中的一种。(2)类型

A.文摘、索引数据库:与书本式文摘、索引相同,提供确定的文献来源信息 B.图书馆目录库(3)特点

A.历史悠久,是机读数据库发展的先驱;

B.文献数据量大,连续性累积性强;文献类型齐全,语种多 C.使用上没有限制,开放性好 D.记录结构简单固定;

E.更新周期长,生产费用低;

F.数据及主题词规范性好,索引系统完备。

2.全文数据库:其记录不仅包括原始文献的目录,而且收录了原始文献的全文。

3.一次文献:一次文献又称为原始文献。它指作者以本人的研究成果为基本素材创作而成的文献。包括阅读性图书、期刊论文、科技报告、会议论文、专利说明书、技术标准、学术论文、实验记录、日记、备忘录、内部报告、技术档案、信件等公开或不公开发表的文献。译文一般也归入一次文献。

4.二次文献:指文献工作者对分散的、无组织的一次文献进行加工、提炼和浓缩之后得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性的文献。一般包括:目录、题名、文摘、索引。

5.三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究之后综合概括而成的产物。如评述、综述、进展报告、百科辞典、名录、指南、手册。

6.核心期刊:在某一学科中,少数期刊覆盖了该学科的大部分最有参考价值的文献,而多数期刊仅包含该学科的少量最有参考价值的文献,这少数期刊就是该学科的核心期刊。

7.灰色文献:非正式出版物又叫零次文献、灰色文献,是指非正式出版物或非正式渠道交流的文献,未公开于社会,只是为个人或某一团体所用。如手稿、私人笔记,信件等。

二.特种文献

1.定义

特种文献是一种介于图书与期刊之间的似书非书、似刊非刊的文献类型,通常在出版发行方面或获取途径方面比较特殊,因此称为特种文献。它包括了除图书、期刊之外的所有其他类型的文献,如会议文献、学位论文、专利文献、标准文献、政府出版物、科技报告、产品样本和产品目录以及档案等。2.类型

(1)会议文献

检索系统:OCLC-Papers-First、OCLC-Proceeding(2)学位论文 A.定义:是高等学校或研究机构学生为获得某红学位二撰写的科学论文。一般分为学士论文、硕士论文和博士论文。

B.检索系统:ProQuest Digital Diseertations;ProQuest博士论文全文数据库;中国学位论文数据库;中国优秀博硕士学位论文全文数据库;Calis高校学位论文库。(3)专利文献

A.检索系统:专利局;中国专利信息检索系统;世界知识产权组织网站专利数据库 B.专利分类法 a.原则:行业分类原则:根据发明的用途或应用领域分类;功能分类原则:根据发明的“直接功能、效用或产品”分类,即以装置、物质或工艺的本质效用作为分类依据。b.IPC:InternationalClassfication of Patent for Invention 《国际专利分类表》 原则:功能分类与行业分类相结合,功能分类优先为原则 分类:IPC按照五个等级分类,部(Section)、大类(Class)、小类(Subclass)、主组(Main Group)、分组(Group),其中部是分类表中最高等级的分类层,按照领域不同,分为八个大部,用一位的英文字母标记,分别是A-H,分部不设类号。因此,一个完整的IPC分类号由代表部、大类、小类、大组或小组的符号共同组成。一个完整的IPC分类号:F04D29/30 F(部)04(类)D(小类)29(主组)/30(分组)(4)标准文献

A.定义:指按规定程序制定,经公认权威机构批准的一整套在特定范围(领域)内必须执行的规格、规则、技术要求等规范性文献。

B.检索系统:ISO;中国标准咨询网;万方数据资源系统中的标准库;NSSN(5)科技报告:科技报告是报道研究工作和开发调查工作的额成果或进展情况的一种文献类型。美国四大报告(AD报告、PB报告、NASA报告和DOE报告)是世界上出版量最大、影响最广的科技报告。第三章

一.百科全书

定义:是荟萃人类一切门类或某一类完整知识,概要加以叙述并有序编排的工具书。

二.类书

1.定义:是摘录、汇集多种文献中的原文,按类目或按韵部编排而成的工具书。2.举例:《太平御览》《永乐大典》《古今图书集成》

三.政书

1.定义:是记述历代或某一朝代的典章制度的沿革及政治、经济、军事、文化制度等方面史料的工具书。2.三通:《通典》《通志》《文献通志》 3.十通:《通典》《通志》《文献通考》《续通典》《续通志》《续文献通考》《清朝通典》《清朝文献通考》《清朝文献续通考》

四.类书和百科全书的区别

1.编撰方式的不同

类书是原始资料的汇集,百科全书是对已有知识的加工、整理和浓缩。2.编排方式不同

类书是根据原始资料分类或音韵进行编排,百科全书则是以条目的字顺进行编排。3.内容有别

类书一般侧重于文史资料,而百科全书以反应人类全部知识力为己任,对自然科学方面的知识更为重视。4.后期工作不同

类书很少补充或者修订,百科全书有连续修订制度。5.检索体系有无

百科全书有完备的索引体系,部分条目有参考书目,指引读者进一步阅读等,类书不具备。

五.工具书的类型、各自的特点、编排及功能

1.书目

(1)定义:书目是揭示与记录一批相关文献,并按一定次序编排而成的检索工具(2)编排

书目的正文;有的书目还有文献的提要或注释书目记录可根据不同的需要另多种编排方式;书目正文后一般附有辅助索引。(3)功能

是进行出版物等级、统计报告、指导阅读和科学管理图书的工具。也是“辨章学术、考镜源流”,鉴别图书真伪异同的重要工具。2.索引

(1)定义:又名“引得Index”,原有面检、备检、韵编之称。索引是将书、刊或其他文献中重要的或有意义的信息摘录下俩,按一定方式顺次编排,并注明出处的检索工具。

(2)编排:索引正文的结构是款目的有序编排;款目由标目、说明语和出处构成;款目依字顺、分类等方式编排;独立式索引多附有辅助索引。

(3)功能:提供文摘索引;指引篇名、文句、语词与专题论述的出处;增加检索途径;比书目能进一步细致地揭示图书报刊的内容;可分析某一文献的主题内容以及关于某一学科或课题的最新观点和发展趋势。从词句索引可研究作者写作分割,寻找特定语句出处,还可供寻章揽句、采撷辞藻。3.文摘(1)定义:文摘是将文献的主要内容简要确切地加以描述,并注明出处,以一定的方法编排的检索工具。(2)编排

每一款目分两部分,一部是对文献的内在特征和外在特征的描述,另一部分是关于文献内容的概括。款目一般按分类编排;有些文摘还附有辅助索引。(3)功能

通报最新的科学文献;深入揭示文献内容,吸引读者阅读原文;节约阅读时间;确定原文与检索需要的相关程度,决定取舍;帮助读者克服语言上的障碍。

六.常用排检法

1.字顺法:形序法部首、笔画字顺法

号码法四角号码、中国字庋撷、起笔笔形法 音序法汉语拼音、注音字母法、韵部排列法 2.分类法学科系统排列法(中图法等)

事物性质排列法、四部分类法、自编分类体系 3.主题法索引

4.时序法年表、历表

5.地序法地方志、地图、地名录

七.图情专业期刊

中国图书馆学报、大学图书馆学报、图书情报知识、图书情报工作、图书馆杂志、图书馆建设、图书与情报、情报学报

八.图情常用资源

1.文摘数据库

LISA:Library&information science Abstracts 图书馆与信息科学文摘 LISAT:Library,information science and technology abstracts 2.全文数据库

Library Literature and information science full text ACM digital library ASIST digital Library’ Emerald E线图情

国道特色数据库 3.网络资源

书社会:图书馆和图书馆员的沙龙 ODLIS(图情在线辞典)4.常用图情机构网站 IFLA UNESCO Libraries Portal ALA PLA 中国图书馆学会

第五章

一.文摘索引型检索工具/数据库

1.SCI:Science Citation Index 自然科学方面的《科学引文索引》 2.SSCI:Social Science Citation Index 社会科学方面的《社会科学引文索引》 3.EI:Engineering Index 工程技术信息的《工程索引》 4.BP:BIOSIS Preview 生物科学方面的《生物学文摘》 5.MEDLINE 医学信息

6.CA:Chemical Abstracts《化学文摘》 6.中文社会科学:《全国报刊索引》、《报刊资料索引》

二.电子期刊

1.英文电子期刊全文数据库:Springer Link;2.中文电子期刊:中国期刊全文数据库、中文科技期刊数据库、万方数字化期刊

三.电子图书和报纸

1.免费:Project Gutenberg古腾堡计划;e书时空

2.收费:超星数字图书馆、书生之家、中国数字图书馆、方正Apabi数字图书馆

第六章

一.JSR指数

期刊引文分析报告是综合了解学术期刊的评价性工具,利用JSR了解学术期刊的重要性。

二.H指数

1.定义:一个人在其所有学术文章中有N篇论文分别被引用了至少N次,他的H指数就是N。2.确定某人的H指数

(1)将其发表的所有SCI论文按被引次数从高到低排列;

(2)从前往后查找排序后的列表,直到某篇论文的序号大于论文被引次数。所得序号减一即为H指数。

三.CSCD 中国科学引文数据库,收录学科为理工农医,可查询各学科领域最重要的核心文献,共645种来源期刊。可通过论文产出量和被引量的统计分析,进行科学评价。四.WOK构成

1.SCI:Science Citation Index科学引文索引

2.SSCI:Social Science Citation Index社会科学引文索引

3.A&HCI:Arts & Humanities Citation Index艺术与人文科学索引

四.影响因子

1.计算方法

影响因子 = 期刊前两年发表论文在当年被引用的次数/该期刊前两年发表论文总数 2.查阅途径(1)查询外文期刊影响因子,可使用外文数据库Web of Science中的JCR(Journal of Reports),其中JCR Science Edition 用于查询自然科学类期刊,JCR Social Sciences Edition用于查询人文社会科学类期刊。

(2)查询中文期刊的影响因子,可使用中国学术期刊(光盘版)电子杂志社和中国科学文献计量评价中心联合推出的《中国学术期刊综合引证报告》(万锦堃主编,科学出版社);CNKI的跨库检索页面点击“文献来源列表”即可看到权威的学术期刊影响因子列表 3.作用及意义

(1)是评价科技期刊的最重要的量化指标之一

(2)影响因子的高低较客观地反映了期刊和编辑吸引较好论文的能力

第十一章 一.OA:Open Access。文献的开放存取意味着用户通过互联网可以免费阅读、下载、复制、传播、打印和检索作品,或者实现对作品全文的链接、为作品建立索引和将作品作为数据传递给相应的软件,或者进行任何其他处于合法目的的使用。

二.EndNote:EndNote是目前世界上广泛使用的个人文献信息管理软件之一,它的主要功能包括:维护书目文献数据库;从其他数据库中下载书目文献;为写作产生合适的书目文献格式;帮助用户完成科技论文写作。

三.NoteExpress:NoteExpress一款专业级别的文献检索与管理系统,其核心功能涵盖“知识采集,管理,应用,挖掘”的知识管理的所有环节,是学术研究,知识管理的必备工具,发表论文的好帮手。四.书目管理软件

选择课题并形成检索策略?

一.分析研究课题,明确查找要求 1.明确检索目的

2.检索内容所涉及的学科主题淋雨

3.明确所需信息的数量、语种、年代范围、文献类型等。二.选择检索工具(资源参考)1.按检索内容的类型

一、图书/专著书目(一)中文

(1)本校的图书馆联机公共检索目录(2)中国国家图书馆联机公共检索目录(3)中国国家书目(纸本)(4)卓越亚马逊的图书搜索(二)西文

(1)美国国会图书馆联机公共检索目录(2)WorldCat---OCLC世界图书馆书目(3)CALIS联合书目数据库

二、图书/专著电子版(查全文数据库)(一)中文

(1)超星读秀(2)北大方正(3)书生之家

(4)CNKI工具书在线(查定义)(5)辞海(纸本)

(6)中国大百科全书(纸本或电子本)

(二)西文

(1)Google book(2)Project Gutenberg(3)Wikipedia

三、期刊论文

(一)中文

(1)万方数据资源系统(2)中国期刊网全文数据库CNKI(3)中文社会科学引文索引

(4)全国报刊索引(社科版)印刷本或网络版

(5)人民大学书报资料中心复印报刊资料索引总汇数据库(6)中文科技期刊数据库(维普全文电子期刊)(7)内部资料索引(纸本)

(二)西文

(1)Academic Source Premier---EBSCOhost学术期刊集成全文数据库(2)Academic Research Library---UMI学术期刊图书馆数据库(3)CALIS西文期刊目次数据库(4)OCLC FirstSearch数据库系统(5)Elsevier电子期刊(6)Kluwer(7)ERIC(8)Google学术搜索

三、学位论文

(一)中文

(1)中国知网学位论文数据库(2)CALIS高校学位论文库

(二)西文

(1)PQDT---Proquest博硕士论文数据库(2)NDLTD

四、其他

(一)开放资源

(二)网络资源导航

(三)整合平台

2.按数据库类型(常用)(1)书目数据库

A.本馆馆藏目录数据库 B.Calis联合书目数据库

C.中国国家图书馆联机公共目录馆藏查询 D.超星数字图书馆; E.worldcat(2)全文数据库

中文:中国期刊全文数据库、中文科技期刊数据库、万方系统的数字化期刊全文数据库;人大复印资料全文数据库;

英文:ProQuest博硕士论文全文数据库;Elsevier期刊数据库;(3)事实型数据库 万方数据;

(4)数值型数据库(5)多媒体数据库

三.制定检索策略、途径和方法 1.检索表达式

2.检索表达式的调整(1)扩检

A.使用截词技术

B.用OR链接同义词、近义词

C.位置算符采用精度较低的方式:从(w)到(n)到(s)D.选择上位词、相关词、降低专指度 C.删去不重要的词,调节网罗度。(2)缩检

限制检索词出现的字段

四.根据文献线索,查阅原始文献

第二篇:信息检索与利用复习重点

一、工具书

概念:根据一定的查阅需要,系统汇集有关的知识资料,以特定的编排方式和检索方法,为人们迅速提供知识信息或资料线索,专供查阅的图书(文献)。工具书的特点:①信息密集 ②资料性强 ③查考为主 ④方便检索 工具书类型:1 检索工具书又称线索性工具书,主要提供查找文献的线索:书目、索引、文摘。2 参考工具书主要向读者提供可资参考的知识内容,如数据、史实、结论、定义、人物简介等数据和事实信息:字典、词典、百科全书、年鉴、手册、名录、数表统计资料、表谱、图录等类型。3 边缘工具书——形式上不是工具书但具有查考检索作用的图书。丛书、总集、汇编、综述、史志、学科史及要籍等。工具书的结构:①序、跋②凡例③目录 ④正文 ⑤辅助索引 ⑥附录、参考文献 工具书的鉴别与选择原则:1)看其主流,考察内容材料,看内容是否完备、材料新颖可靠,解释引证准确2)客观、正确,有无立场、观点问题3)了解编制体例,编排方式、检索方法、印刷规则、文体。4)同一种工具书的不同版本。鉴别与选择的方法1)查考编辑者与出版者 2)编纂和出版的年代、审察版本 3)查考序跋、凡例和目次 4)辨别正文——选条试查、定条比较 5)参阅书评

二、机器检索及光盘、联机与网络检索

计算机检索:人们在计算机或计算机检索网络终端机上,使用特定检索指令、检索词和检索策略,从计算机检索系统数据库中检索出需要的信息,继而再有终端设备显示或打印的过程。

信息检索工具:指用以报道、存储和查找文献线索的工具。它是附有检索标识的某一范围文献条目的集合,是二次文献,如书目数据库、搜索引擎、索引、文摘。检索工具的分类:1)(文献检索工具)提供线索的指示型检索工具(二次文献):书目、馆藏目录;索引;文摘;工具书指南 2)(事实与数据检索工具)提供具体信息的参考工具(三次文献):1词典2类书、政书、百科全书

3、年鉴4传记资料5表谱、图录

6、政府文献7名录、手册8数表、统计集9丛集汇要10地理资料 信息检索途径:1)外部特征途径:题名途径,著者途径,序号途径2)文献内容特征途径:分类途径,主题途径,关键词途径,分类主题途径,其他途径。信息检索步骤:1)分析检索课题,明确检索要求(2)制定检索策略:确定检索工具、方法、途径、用词及逻辑关系、位置关系(3)实验性查找,调整检索策略,正式查找;(4)辅助性查找(最新期刊、年鉴);(5)整理答案或索取原文。信息检索步骤:1)分析检索课题,明确检索要求2)制定检索策略:确定检索工具、方法、途径、用词及逻辑、位置关系3)实验性查找,调整检索策略4)辅助性查找(最新期刊、年鉴及百科类工具书、教科书5)整理答案或索取原文。光盘检索系统:单机或脱机检索系统的一种主要方式。

服务模式:单机模式和网络模式。应用:只读光盘CD-ROM,DVD-ROM 典型的光盘数据库检索系统:DIALOG-OnDisc,《SCI》光盘数据库,《中文科技期刊》光盘数据库(重庆维普资讯公司出版),《中国专利文摘》光盘数据库 联机检索系统,是检索终端通过通信线路与系统主机连接,在中央处理机控制下查询系统的几十甚至上百数据库,并通过与系统实时对话,随时调整检索策略。联机检索系统的类型l商业联机数据库:DIALOG、STN、Questel-ORBIT(轨道系统)、ESAIRS(欧航系统)2)基于互联网的免费数据库:文献数据库、招聘求职库、公司名录库、专利库、标准库等。联机计算机图书馆中心OCLC。

三.网络信息检索

网络搜索工具-搜索引擎:根据一定的策略,运用特定的计算机程序从互联网上收集信息,在对信息进行处理组织后为用户提供检索服务,将用户检索相关的全部信息展示给用户的系统。

搜索引擎的系统构成:1)信息采集子系统(搜索器):页面收集器与分析器2)数据库——(索引器和索引项)3)检索代理软件——(检索器和用户接口)。搜索引擎的分类1)关键词(索引型)搜索引擎google,百度2)分类搜索引擎(目录型搜索引擎)yahoo,搜狗3)元搜索引擎(调用独立搜索引擎)搜魅网 站内搜索工具——专题搜索工具:利用分类和关键词搜索引擎

站外搜索—网络搜索工具—搜索引擎,具备对整个互联网搜索的功能。深网:虽然通过互联网可以获取,但普通搜索引擎由于受技术限制而不能或不作索引的那些文本页、文件或其它通常是高质量、权威的信息。深网信息资源的检索途径:1)利用传统搜索引擎的相应功能间接查找深网信息:百度文档搜索2)利用专门的深网资源目录型检索工具:FindLaw、万维网虚拟图书馆3)利用专业搜索引擎:Science Research、Business Research4)可检索的站点和专题数据库:MOOC大型开放式网络课程、PubMed。

数据库:是至少由一种文档(file)组成、能满足特定目的或特定数据处理系统需要的数据集合。

数据库检索系统:为数据库的信息而开发的专用工具,功能视数据库内容性质而不同,一般用关键字、分类、字顺、编号等检索功能。

数据库的构成:1)联机检索:数据库包括顺排文档和倒排文档:索引词+文献地址)2)搜索引擎:数据库只有倒排文档:索引词+网络URL 网络信息资源指通过网络存储的数字化图、文、声、像等多媒体信息的集合,其主要特征是数字化和网络存取。

网络信息资源的组织方式1)文件方式——主题法,如FTP2)数据库方式——大量规范化数据的管理;3)搜索引擎方式-网络公开区域4)主题指南方式——综合分类法和主题法,如yahoo 5)超媒体技术-超文本与多媒体技术结合

网络信息资源的评价:以网页或站点为评价单位,评价其有效性、可靠性、权威性、相关性、适用性。1)评价标准:网页目的、覆盖的主题或学科领域或范围、内容、图形和多媒体设计、信息的展示与设计、可操作性、费用、评论2)评价方法:定性与定量相结合的方法。

网络信息检索系统工具的性能指标与评价1)所属机构或创建者。2)内容:资料收录的学科范围;覆盖时段;资料来源、类型及数量;包含的数据库的类型与数量;规模和更新周期;可用的外部资源或导航等。3)检索性能:标引方式、采用的检索机制或算法、检索途径、检索结果评价(响应时间、命中数、相关性排序、输出选择(数量、显示格式、分类)、重复链接)、统计分析、个性化服务等。4)界面的友好性及用户的特点、用户负担。

四.检索语言

检索语言:用来描述文献特与征,表达主题提问的一种专门的人工语言,是由给定领域中一切可用来描述信息内容和信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。

检索语言的特点:1)表达概念具有单义性和唯一性2)集中内容相近和相关的文献,使文献存储有组织有序3)不同的检索语言决定了检索途径和角度多样性 检索语言的分类:1.分类语言2.主题语言3.代码语言4.引文语言5.先组式检索语言6.后组式检索语言

分类语言:用分类号和类名来表达信息的内容主题概念,并按知识门类的逻辑次序将信息资源系统地加以划分和组织的语言。

主题语言:以概念的特性关系为基础从自然语言中优选出来,以名词术语为基本词汇,用一组经过规范化处理的、具有组配功能的动态性词或词组作为检索标识的一类检索语言。

检索语言分类法与主题法的比较: a 揭示对象方面:分类法揭示的是文献内容的学科属性;主题法揭示文献论述的具体事物或主题概念,一般不涉及学科类别的判断。

b 使用标识方面:分类法以抽象化的类目代号;比较简洁,但也较费解。主题法直接用词语表示文献主题,直观易懂。

c 排列方式方面:分类法按分类号排列,系统性较强,但不熟悉有关分类表则难以有效地利用它;主题法按词语字顺排列,易学易查。d 用途方面:分类法适于图书或文集的组织和检索,用于编制分类目录和分类索引,还可用于文摘编排、文献报道、藏书排架与统计,提供从学科或专业角度查找文献的途径,族性检索功能强;主题法适于期刊论文、研究报告、会议论文等单篇文献的组织和检索,提供从具体事物入手查找文献信息的途径,专指性强。英文缩写

CALIS中国高等教育文献保障体系

OCLC(Online Computer Library Center)联机计算机图书馆中心组织

NSTL国家科技图书文献中心(NationalScience and Technology Library)LC美国国会图书馆The Library of Congress CNKI清华同方中国期刊全文数据库 CQVIP重庆维普中文科技期刊数据库 OPAC是公共联机书目查询系统。ISO国际标准化组织标准 IEC国际电工标准化组织标准 GB/T推荐性国家标准代号 GB强制性国家标准代号 IPC国际专利分类法 ICS国际标准分类法

CSCI中国科学引文数据库 ISI美国科学情报研究所 ILL馆际互借 DD文献传递 AD入藏报告

五、专利与标准文献的检索

(一)专利文献检索

专利:从法律上保护知识创造发明的一种专有权利,是知识产权的一种。专利文献:实行专利制度的国家及国际性专利组织在专利管理过程中产生的文件及各类出版物的总称。

专利的三层含义:专利法保护的发明;专利权;专利说明书等专利文献。

(二)标准文献检索

标准:是对重复性事物和概念所作的统一规定,它以科学、技术和实践经验的综合成果为基础,经有关方面协商一致,由主管机构批准,以特定形式发布,作为共同遵守的准则和依据。(GB3935-1-83)

标准文献:包括一整套在特定活动领域必须执行的规格、定额、规划、要求等方面的技术文献。

中国标准文献手工检索:1)手工检索标准文献主要是利用标准目录。2)标准目录编排方式大致相同,主要有分类、主题和标准号(顺序号)三种途径。

中国标准文献网络检索:中英文标准名称,标准号,发布日期,发布单位,实施日期,中国标准文献分类号

ISO标准手工检索途径:主题检索,标准号检索,分类检索 ISO标准网络检索途径:简单检索,分类检索,扩展检索

六、科技文献综合检索

科技文献:国内科技文献大体分为图书、期刊、资料三类。

科技文献的类型:按出版形式分1科技图书2科技期刊3会议文献4专利文献5科技论文6科技报告7政府出版物8标准文献9科技档案10产品样本

会议文献的特点:1)新颖性。传递新产生、但未必成熟的科研信息,对学科领域中的新发现等重大事件的首次报道率高2)专深性。专业内容集中、针对性强,一般围绕同一会议主题撰写相关的研究论文。3)连续性。多数会议连续召开,一届会议,一版文集,连续发行。4)多样性。数量庞大,出版不规则,出版形式多样5)网络环境的新特点:自我发布,个人主页、机构收藏库、预印本系统和会议网站,供同行免费检索和浏览。视频发布,以光盘或视频点播等形式发布会议视频资料,如中国学术会议在线、SPIRES等网站。

专利文献的特点:集技术、法律、经济情报为一体;技术内容具有新颖性、先进性和实用性;内容广泛、完整和详尽;出版迅速,数量庞大;可靠性强,质量高;在时间、地域和内容上有局限性;形式统一,分类标准化。

科技论文的特点:出版、保存特殊,数量有限;内容新;数量大,分布分散。科技报告的特点:形式多样;阶段性;保密性,绝密报告、机密报告、秘密报告、非密报告、解密报告等;流通有限,;连续性和系统性;编码体系和方法不统一。标准文献的特点:有固定的代号和专门的编写格式;时效性强,具有法律约束力,要求人们自觉遵守;数量多,篇幅小,文字简练;需要不断修订和补充。

政府出版物的特点:内容广泛。形式多样。.发行和收藏范围有限,一定的保密性,难以收集、管理和检索

科技档案的特点:集记录性和原始性于一体,具有可靠性和稀有性,具有凭证作用,内容广泛,可以提供大量情报和知识,形式多样

产品样本的特点:可靠性强,报道成熟技术、工艺。产品和技术信息较完整。具有及时性和相对新颖性。七.专题检索

1人物的手工检索:1)使用相关工具书2)网络工具书:同方知网工具书检索、OCLC的世界年鉴

2人物的网络检索:1)一般搜索引擎:实用于公众知名人物2)专用搜索引擎:单一搜索引擎:个人信息电话号码,黄页、白页,集合式元搜索引擎,综合性搜索引擎,专门性搜索引擎3)传记网站:中国哲士网4)百科全书网站:维基百科5)人物资料数据库6)网络传记词典

黄页:国际通用的按企业性质和产品类别编排的工商企业电话号码簿,以刊登企业名称、地址、电话号码为主体内容,相当于一个城市或地区的工商企业的户口本,国际惯例黄色纸张印制,故称黄页。

白页:电话号码簿中登录党政机关、团体电话的部分,用白色纸张印刷。Web2.0信息源 社会性搜索:通过搜索信息和访问记录进行社会性共享,从而建立社交网络关系,进而引入社群、用户组Webmarks等个性化信息对用户再搜索提供较好的参照。社会化网络一种基于六度分隔理论运作、强调开发和培养用户社会关系网络的web2.0应用,通过tag、rss或者邮件连接到一起。

基于社会交往的网络信息源:1)博客和博客群,博客个人更新的网页日志,是一个站点和主页。特点:Blogger的时间性书写,确认了博主的身份和形象;倡导知识、思想的交流和共享;社会性软件的基本单位。2)维客Wiki:一种多人协作的写作工具,一个由多人共同创建、累积、完善和维护知识的协同工作空间。特点:超文本系统,支持面向社群的协作式写作;使用方便,开放获取,共享知识。3)威客:指通过互联网把智慧、知识、能力、经验转换成实际的经济价值的互联网新模式。特点:提供知识买卖的平台;主要应用于解决科学、技术、工作、生活和学习等领域的问题;一个隐性知识显性化的过程;降低知识资本生产的地域成本、交易成本和渠道成本。4)网摘:提供一种收藏、分类、排列和分享互联网信息资源的方式,它存储网址和相关信息列表,用标签对网址进行索引,是网址资源得到有序的分类和索引。特点:群体参与,彼此分享和收藏信息,评估网址价值,降低挖掘有效信息的成本;知识分类机制,实现用户聚类,形成基于知识分类的社群;保存互联网上有价值的信息,并做必要的描述和注解,积累形成个人知识体系;满足个人收藏、展示的性格需求。5)内容聚合RSS:站点用来和其他站点之间共享内容的一种简易方式,通过RSS阅读器,用户可以订阅新闻、博客等,及时更新。特点:个人知识管理工具,通过RSS订阅过程,构建自身科学知识体系,建构个人知识框架。;6)开放存取OA,某文献在Internet公共领域里可以被免费获取、允许任何用户阅读、下载、拷贝、传递、打印、检索和超级链接该文献,并为之建立索引,用作软件的输入数据或其他任何合法用途。7)网络社会交往平台:facebook.com——美国知名SNS网站,主要面向美国高校,用户需用大学邮箱注册,中国清华、北大等10多所高校的学生可以注册。校内网(人人网)——面向大学生的互动空间。

web2.0 搜索的特点:使用与传统不同的技术和方法,解决非关键词查询问题;打破一维的搜索结果列表,以“搜索+门户”的结合方式,通过“内容分类+兴趣爱好”,直接单击浏览,实现社区搜索多维展示;用户参与和体验。

第三篇:云南大学电子政务概论期末复习重点整理版

电子政务概论期末复习

1、巴纳德系统理论:

第一、巴纳德认为组织的知识和经验包含着各有用途且相互补充的三种类型:一是有关特定情况下的具体行为的经验和知识。需要个人去亲身体验。二是有关特定组织的实践方面的经验。三是有关超越具体组织的普遍通用的知识和经验。第二、组织的实质是“有意识地协调两个以上的人的活动或力量的一个体系。作为一个整体,组织已是一个不同于原有各组成的组织结构。

第三、组织要形成为一个整体,就必须具备三个基本条件,即“(1)能够互相进行信息交流的人们;(2)这些人们愿意作出贡献;(3)实现一个共同的目的。”信息交流居于中心地位,组织中的其他两个条件只有通过信息交流才能连通起来。

2、啤酒游戏简介:该游戏是生产与分销单一品牌啤酒的产销模拟系统,参加游戏的学生各自扮演不同的角色:零售商、批发商和制造商。在游戏中他们主要对自己的库存进行管理,即每周做一个订购多少啤酒的决策,库存决策的目标是使自己的利益最大化(费用最小化)。

3、啤酒游戏目的:此游戏考察了供应链成员在信息不共享、交货期不确定的情况下所做出的理性决策对供应链系统行为造成的影响。在该游戏中,由于消费者需求的小幅变动,而通过整个系统的加成作用将产生很大的危机,即首先是大量缺货,整个系统订单都不断增加,库存不断枯竭,欠货也不断增加,随后好不容易达到订货单大批交货,但新收到订货数量却开始下降。

4、啤酒游戏的启示:

(1)、有些小组物流供应顺畅,总成本很低,有的小组则在每个都负责尽职的情况下,出现了大范围的缺货或者库存,这也正是这个游戏令人称道之处。对供应链竞争的印象极其深刻的是:供应链竞争的核心意义在于,供应链厂商之间必须高度协作与同步,才能整体上增加整个供应链的收益。各个厂商如果仅仅为自身利益进行决策,不重视整个供应链上下游的整体价值,则会导致整个供应链的效率低下,利益受损。

(2)、战略联盟意味着上下游厂商之间通过高度的信息沟通,共同确保物流供应的同步,降低在整个供应链上的价值浪费。对于每个小组而言,对市场信息的准确把握和共享,将会大大提高整个供应链厂商之间的协作程度,共同降低库存和滞发成本。竞争并不仅仅意味着一个企业和另一个企业之间孤独竞争,更为全面的应该是他们所处的两个供应链之间的竞争,现为整体供应链之间的竞争。随着全球化、信息化的发展,供应链在日益激烈的市场竞争中所起的作用越来越大。

(3)、一个知名企业的成功,其实代表着一条物流增值与供应链上数家乃至数十家企业的共同成功。对于中国企业而言,改变传统的企业竞争眼光,更加重注上下游产业的协作与同步计划,才能在新的国际竞争浪潮中占领制高点。

(4)、结构影响行为。从这个啤酒游戏的教训可知,结构会影响系统的总合行为。不同的人,置身于相似的结构当中,倾向于产生相似的结果。但是,参与系统的各个份子,常常只见树木而不见森林,只能针对眼中所见的local信息,做local的最佳决策。不幸的,每个人的local最佳决策,不见得会使得系统的global最佳决策。像啤酒游戏里头,不管是下游零售商、中游批发商、上游制造商,每个人都在自己的岗位上,对自己所能接触的local信息,做出最符合本身预期的善意、果决、最佳决策,但结局却是~~~能怪罪任何一个份子吗?

(5)、经济学里,有一个(存货加速理论inventory accelerator theory),正是用来解释这种(需求小幅上扬,却导致库存过度增加,进而引起滞销和不景气)现象的商业景气循环理论。

(6)、通过这个游戏,圣吉揭示了工商管理中结构与行为之间的复杂影响。游戏中的每个角色都是整体结构中的一个点,而销售关系就像是一条线将它们连接起来。如果当事人只看到自己这一点,系统就会发生整体的恶性循环。由此出发,圣吉论证了系统思考的重要性。

(7)、走出这种恶性循环的路径,是从全局出发来思考问题,扩大自己的眼界,从整体结构出发考虑所有环节的关系,同时充分考虑时间上的滞后效应,在做出决定之前能事件的起因和行为之间的相互影响。这样,就有可能大幅度降低游戏带来的振荡。

5、传统方式下政府信息传递的特征:

①逐级的信息交流。

②从上到下单向式信息交流居多。

③时空差别的、非同步的信息交流。

④面对面式的、签章式的信息交流。

6、基于ICTS下政府信息传递的特征:

ICTS能实现政府政务信息直接的、网络化的、互动式的和分布式的交流。

①实现同步、直接和双向信息交流。

②实现一对多、多对多的网络式信息交流。

③实现异地、全天候和无人值守式交流。

④实现非接触、非现场分布交流。

⑤实现信息的实时分析和决策支持。

7、成熟的电子政务的特征:

①以公众为服务中心。②顾及所有人。

③无处不在。④无缝整合。

⑤开放的政府。⑥响应的政府。

⑦变革的政府。⑧集成的政府。

8、电子政务系统安全性要素:①有效性、真实性。②机密性。③数据的完整性。④可靠性和不可抵赖性。

9、CRM(客户关系管理)的核心思想:

①CRM解决方案的核心思想就是通过与客户的“接触”,搜集客户的意见、建议和要求,并通过数据挖掘分析,提供个性化的服务。

②CRM是一种以客户为中心的经营策略,它以信息技术为手段,对业务功能进行重新设计,并对工作流程进行重组。

10、客户关系管理的目标:提高效率;拓展市场;保留客房。

11、客户关系管理的功能:

①销售管理与支持。②营销管理与支持。

③客户服务与支持。④计算机、电话、网络的集成CTI。

12、电子商务的体系结构:网络基础→安全基础结构→支付系统→电子商务业务

13、电子商务信息安全体系:基本加密算法→安全认证手段→安全认证协议

14、基本加密算法:

①对称密钥:加密解密相同;

②非对称密钥:加密解密不相同,一个公钥,一个私钥。先用公钥对文件进行加密,然后发送,用私钥进行解密。

15、安全认证手段:①防篡改系统,数字摘要。②数字信封(特定收信人,采用对称密钥加密)。③数字签名。④数字时间戳。⑤数字证书。

16、门户网站:这里是一个Web应用框架,它将各种应用系统、数据资源和互联网资源集成到一个信息管理平台之上,并以统一的用户界面提供给用户,并建立企业对客户、企业对内

部员工和企业对企业的信息通道, 使企业能够释放存储在企业内部和外部的各种信息。

17、流程管理模式的特点:(l)组织结构优化(2)注重过程效率(3)注重过程控制(4)突出管理的服务本质(5)建立新型内部关系(6)强调明确管理目标(7)强调信息工具的重要性。

18、流程再造:BPR是对企业的业务流程作根本性的思考和彻底性重建,其目的是在成本、质量、服务和速度等方面取得显著性的改善,使得企业能最大限度地适应以顾客、竞争、变化为特征的现代企业经营环境。(BPR被称作是“恢复美国竞争力的唯一途径”; 哈默被美国《商业周刊》评为90年代最具影响力的“四大管理宗师”之一。)

19、政府流程最为重要的属性是:约束性、确定性、稳定性、可操作性。

20、政府流程:是指政府在实施管理时,为达成特定目标所经历的、体现工作规律的稳定的活动步骤的集合。

21、电子政务的价值:交流更畅通,行政更高效,成本更节省,协作更延伸,用户更满意。

22、电子政务的概念:电子政务实指国家公共部门为了提高公共事务管理效能和公共服务水平,通过应用网络信息技术与开发信息资源、重组组织结构、创新公共管理模式、优化业务流程有机结合的方式,为公共事务管理和公共服务提供新型管理模式和运行机制。

23、电子政务和传统政务的两个区别:

一是组织结构和业务流程上的区别(根本的);

二是技术手段和服务方式上的区别(形式上的)。

24、数字鸿沟:也叫“信息鸿沟”,指的是一个在那些拥有信息时代工具的人以及那些未曾拥有者之间存在的鸿沟,即信息富有者和信息贫困者之间的鸿沟。数字鸿沟体现了当代信息技术的使用程度存在相当的差距。

25、怎样解决数字鸿沟:处于这一鸿沟的不幸一边,就意味着他们很少有机遇参与到以信息为基础的新经济当中,也很少有机遇参与到在线的教育、培训、购物、娱乐和交往当中,将加剧贫困和不公平现象,因此,必须消除数字鸿沟。

(1)在全国建立信息中心,以保证所有想上网而不具备条件的人都能上网;

(2)政府为低收入提供微机贷款;

(3)制定相应的鼓励措施,为鼓励人们以电子化的方式纳税。

(4)加强了信息技术教育和基础设施建设,实现全民上网,保证公众在家、在工作单位及社区都能接入互联网。

26、“三网一库”:

三网:(1)机关内部办公网,简称“内网”,是各个行政机关内部的行政办公局域网。

(2)办公业务资源网络,简称“专网”,承载全国政府系统共建共享的政务资源信息库,为政府运转提供最主要的信息服务和业务协同支撑环境。

(3)公共管理与服务网络,简称“外网”,建立在公共通信平台之上,通过应用支撑平台与公共互联网络实现接口,并与其他政府部门的外网实现安全的互联和信息交换。一库:政府各部门共建共享的包括党务、政务和行业部门业务数据的电子政务信息资源库。

27、协同政务:是指以服务社会公众为中心,通过计算机信息及网络技术的应用来整合政府资源,重组政务流程,实现政府各个部门之间“网连网”、“网套网”、“一站式服务”形成一个虚拟的网上政府,最终实现政府跨部门、机构、行业的协同工作,以便更大程度地发挥电子政务的优势和作用,为公众提供优质、便捷、高效的服务。

28、不开展协同政务会出现的问题:

(1)电子政务建设中各自为政、产生信息孤岛现象。

(2)由于信息不通,可能大量重复建设,提高电子政务建设成本。

(3)信息不通,出现系统漏洞,如:有的企业虽然在工商部门登记注册了,但没有在税务

部门登记注册,以偷逃税款;有的老人死了好几个月甚至几年,在公安部门注销了,但没有在社会保障部门注销,其家属依然领着退休金或养老金。

(4)民众办事还是要跑多个部门,政府办公效率没有显著提高,电子政务建设失去意义

31、协同政务的例子:

(1)美国联邦政府在电子政务建设中提出了“让人们点击3次鼠标把事情办完”的口号。

(2)某市的项目审批:企业办事员在“项目集中受理中心”网站填写各种申请表格,并把项目申请书以及各种证件、单据递交政务系统,系统自动进行任务分解,并把相关材料发到各部门,由它们协同完成审批任务。

32、“一站式”服务与协同政务有什么区别与联系?

“一站式”服务不是协同政务,它只是协同政务模式提供的一种一站式电子政务平台,只是协同政务提供服务的一种方式。它与电子政务最大的区别是,协同政务是一个具体的服务框架,也是政府办公将要实现的目标。“一站式”服务作为一种操作方式,无法向协同政务那样从整体构造政府办公流程,只是从局部实现这个流程。

33、中间件技术:中间件是介于应用系统和系统软件之间的一类软件,中间件位于客户机/ 服务器的操作系统之上,管理计算机资源和网络通讯,是连接两个独立应用程序或独立系统的软件。对于相连接的系统,即使它们具有不同的接口,但通过中间件相互之间仍能交换信息。

34、出了什么问题才出现了中间件技术,它有什么作用?

出现的问题:在实际政务系统建设中,不同政府部门的服务器经常使用不同的操作系统、数据管理采用不同数据库管理系统业务开发使用不同的开发工具,为了实现信息共享和应用共享,必须使用中间“媒介”,即使用中间件把不同系统整合起来。

作用:中间件技术可以将不同时期、在不同操作系统上开发应用软件集成起来,彼此像一个天衣无缝的整体协调工作,并且中间件技术开发简便、开发周期短、减少了系统的维护、运行和管理的工作量。因此中间件技术成为了政务系统互通互联、协调工作、和消除“信息孤岛”有效的方式。

35、为什么要建立电子政务标准化体系:

(1)标准化是电子政务系统实现“互联互通、信息共享、业务协同、安全可靠”的前提。

(2)中国所辖范围跨度大,机构多,如果都各自建设电子政务系统,不仅浪费大量的资源和时间,也不利于我国软件产业的发展。

(3)如不采用规范化和标准化的方法,政府之间,政府部门之间的各种系统难以兼容,信息资源难以共享,从而形成一个个“信息孤岛”,后果则难以想象。

36、政府知识管理:

政府CIO,政府部门首席信息主管(chief information officer),即政府CIO,是一个在政府部门中负责信息技术系统(包含计算机系统和通讯系统)战略策划、规划、协调和实施的官员。CIO的主要职责是实现信息技术战略与政府管理和公共服务过程的整合。

37、数据仓库:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、随时间变化变化(Time Variant)的数据集合。

38、数据挖掘:就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,抽取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

步骤:查找资源信息、选择和预处理、模式识别、模式分析。

39、电子政务建设规划的含义:从动态上讲:电子政务建设规划是将政府的发展战略和目标转化为电子政务建设目标、发展战略和基本技术实现方式的过程。具体指由政府高级管理层和高级信息管理层,从政府自身及社会的长远发展目标和政府治理范围的全局出发,以政府的核心工作和关键问题为重心,为政府系统确定以信息技术为平台的整体建设目标、战略和资源计划,勾勒电子政务系统总

体结构,和系统各部分逻辑关系,遴选系统基本技术实现方式等一序列过程。从静态上讲:电子政务建设规划是指中央以及地方政府针对政务建设的指导思想、总体目标、基本原则、主要任务以及实现途径所做出的综合部署,一般表现为指导性政策文件。

40、电子政务的顶层设计:顶层设计就是把整个政府看作一个整体,在各个局部系统进行总体架构的分析和设计,从而让各分系统有统一的标准和语言、业务、技术参照。通过顶层设计架构,各分系统就能知道如何与其它系统共享信息或共同操作,从而解决跨部门合作。

41、电子政务建设的两种模式:

(1)自主模式:电子政务自主模式是指政府通过投资建设属于自己的主服务器和电子政务系统来实现内部业务和公众服务电子化的一种模式,在该模式中,系统的产权属于政府,同时设备的采购、网络的建设、系统的运营和维护全部由政府主导完成。

(2)电子政务外包模式:电子政务外包是信息工程和技术外包的一种方式,指政府部门与专业外包服务提供商(ASP)签订信息工程建设和技术服务合同,政府部门将电子政务项目建设、日常运行维护以及相关服务等工作,部分或全部委托给专业的外包服务提供商(ASP)完成的一种管理运行模式。

什么情况下使用:自建与外包相结合。中央政府以自建为主,地方政府以外包为主;内部业务以自建为主,公众服务以外包为主。

各自的优缺点:自主的完全属于政府,财政压力大,系统维护外聘成本高,工作任务繁杂,安全性高,但是易导致信息不沟通信息孤岛形成;外部多方融资,充分利用资源,技术稳定先进,安全性不高,但信息能共享。

42、电子政务规划的效力:公定力、确定力、拘束力、执行力

43、数字时间戳:是用来证明消息的收发时间的。用户首先将需要加时间戳的文件经加密后形成文档,然后将摘要发送到专门提供数字时间戳服务的权威机构,该机构对原摘要加上时间后,进行数字签名,用私钥加密,并发送给原用户。

44、电子政务绩效评估的背景:(1)电子政务的世纪效果与轰轰烈烈的建设局面反差强烈。高投入低产出让政府反思。(2)公众对如何充分利用信息技术的优势,进一步提高政府履行职能的能力提出了更多的要求。

45、电子政务绩效评估:电子政务绩效评估是指由专门的机构和人员依据大量客观事实和数据,按照专门的规范、程序,遵循统一的标准和特定的指标体系,通过定量定性的对比分析,应用科学的方法,对电子政务建设的投入、产出和效益所做出的客观、公正和准确的评估。

46、从哪些方面进行绩效评估:

第一、电子政务业绩,主要表现为电子政务为社会经济活动提供服务的数量和质量

第二、电子政务效率,电子政务效率反映的是行政机关和行政人员从事的电子政务活动所得的劳动成果、社会经济效益同所消耗的人力、物力、财力和时间的比例关系。

第三:电子政务效能,指政府通过电子政务所产生的产品和向公众提供服务的水平。第四:电子政务的成本,即实施电子政务所占用和耗费的资源及其程度。

47、电子政务绩效评估:1993年美国国会通过了《政府绩效及结果法案》,以立法形式确定了绩效评估的地位。

48、RSA算法:

49、行政行为的效力即是指行政行为所发生的法律效果,表现为一种特定的法律约束力和强制力。

第四篇:信息检索复习

【自测型】

信息检索基础知识测验

作业总分:400

1.知识是有用的信息(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

2.英文主题索引都是以词为单位排序的(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

3.专利说明书也涉及到权利情报(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

4.搜索引擎中查询表模块由网页数据库和全文索引组成(分数:4,完成次数:2)

0%正确 100%错误

标准答案:正确

5.域名的结构是左大右小(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

6.通配符只能用于分类号和关键词中,不能用于域名。(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

7.叙词,又称为主题词,是可以概括主题内容的任何自然语言词汇。(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

8.关键词加上强制出现符后,表示该关键词的检索范围缩小了。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

9.英文主题索引都是以字符为单位排序的。(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

10.从广义上讲,凡是记录知识的任何裁体都可以认为是文献。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

11.中文搜索引擎检索模块具有拆分检索词的功能。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

12.国际标准书号中第一、二组数字越短,该语区、出版国或出版社得到的出版配额越多。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

13.在搜索引擎中可以将通配符用于域名进行后方一致检索。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

14.文献标识是概括文献主题内容的检索词,检索标识是概括用户检索需求的检索词。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

15.关键词加上强制出现符后,表示该关键词的检索范围扩大了。(分数:4,完成次数:2)

0%正确 100%错误

标准答案:错误

16.主题检索时可以替换的词可以是同义、近义词、上位概念词、下位概念词。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

17.从根本上说,知识来源于实践。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

18.英文作者索引的排序是先排名后排姓。(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

19.专利权利要求书包含了技术情报。(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

20.在搜索引擎中通配符可以用于域名中。(分数:4,完成次数:2)

0%正确 100%错误

标准答案:正确

21..com是公共服务机构的顶级域名。

(分数:4,完成次数:2)

0%正确 100%错误

标准答案:错误

22.搜索引擎中可以使用逻辑运算符,但只能用于关键词组配,不能用于域名组配。(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

23.关键词是概括主题内容的、经过规范的检索词。(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

24.固定词组检索的查准率比简单关键词的逻辑与组配高。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

25.英文作者索引中的逗号是倒置符。(分数:4,完成次数:2)

0%正确 100%错误

标准答案:正确

26.从广义上讲,文献是物化了的知识。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

27.通配符不可以用于域名搜索。(分数:4,完成次数:2)

100%正确 错误

标准答案:错误

28.国际标准书号中第一组数字如果是2,表示该书为五个法语区国家出版的图书。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

29.搜索引擎中关键词和域名都可以使用逻辑运算符进行组配检索。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

30.检索的实质是实现检索标识和文献标识的匹配。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

31.固定词组检索的查准率比简单关键词的逻辑与组配低。(分数:4,完成次数:2)100%正确 错误

标准答案:错误

32.对于课题分析,首先要在标题中找出表达重要概念的词组或单词,然后找出有潜在意义的词。(分数:4,完成次数:2)

100%正确 错误

标准答案:正确

33.文献老化规律

(分数:4,完成次数:2)

0% A.反映了文献的陈旧程度

0% B.反映了知识老化的速度

100% C.揭示了一个专业的文献利用率与文献出版年限的关系

0% D.揭示了一个专业的成熟度

标准答案:C

34.文献主要由以下数据项组成(分数:4,完成次数:2)

0% A.题名、作者、摘要、文摘号、出处

0% B.书刊名、责任者、摘要、文摘号

100% C.文摘号、标题、责任者、母体文献

0% D.文摘号、题名、作者、摘要、文献出处

标准答案:D

35.评价检索效果的技术标准(分数:4,完成次数:2)

0% A.主要有查全率与查准率两个指标

0% B.与用户花费的检索时间有关

100% C.与检索系统的权威性有关

0% D.受检索的社会经济效果影响

标准答案:A

36.搜索引擎中的网域限定指限定检索词出现的位置(分数:4,0% A.针对超文本文件

0% B.针对网页数据库中的字段

100% C.针对全文索引

0% D.针对查询表

标准答案:A

37.常见的网络协议有(分数:4,完成次数:2)

100% A.HTTP 0% B.Telnet 0% C.FTP

完成次数:2)

0% D.简单邮件协议、远程登录协议、文件传输协议、起文本协议

标准答案:D

38.新闻组的专题名的书写形式与以下哪项相似?(分数:4,完成次数:2)

0% A.域名

0% B.IP地址

0% C.分类号

100% D.标题词

标准答案:A

39.逻辑与组配检索(分数:4,完成次数:2)

0% A.运算符是OR

0% B.可以提高查准率,降低误检率。

0% C.可以提高查全率,降低漏检率

100% D.检索效果与固定词组配检索一样

标准答案:B

40.Google、百度、天网中逻辑与组配符是(分数:4,完成次数:2)

0% A.AND 0% B.&

100% C.* 0% D.空格

标准答案:D

41.索引主要由以下数据项组成(分数:4,完成次数:2)

0% A.分类途径,主题途径。

0% B.分类索引,主题索引,作者索引。

100% C.分类索引,主题索引,作者索引,号码索引

0% D.检索项,文摘号。

标准答案:D

42.专业图书(分数:4,完成次数:2)

0% A.包括大中专教材、标准、手册等。

0% B.包括论文集、政府公报、指南等。

0% C.包括学术专著、年鉴、产品样本等。

100% D.可分为阅读性图书和参考工具书两大类。

标准答案:D

43.搜索引擎中的全文索引(分数:4,完成次数:2)

0% A.针对网页中除编程语言外的所有词建立索引 0% B.针对网页标题和简介中有检索意义的词建立索引

100% C.指对网页内文进行索引

0% D.指对网页中的标题和简介分别建立索引

标准答案:A

44.ISBN(分数:4,完成次数:2)

0% A.其中的字母S是“标准”的英文首字母

0% B.其中的字母B是“文献”的英文首字母

100% C.是国际标准文献号的缩写

0% D.用四组数字唯一地代表一种书

标准答案:A

45.标准号前都有机构代码,表明该标准的主管机关和标准级别。假如机构代码分别为JIS、GB、IPC,它们属于哪一些标准?(分数:4,完成次数:2)

0% A.技术标准、管理标准、专利分类标准。

0% B.日本国家标准、英国国家标准、美国印刷电路标准。

100% C.日本国家标准、中国国家标准、美国印刷电路标准。

0% D.日本国家标准、中国国家标准、国际专利分类标准。

标准答案:C

46.分类号的等级结构(分数:4,完成次数:2)

0% A.为扩大和缩小检索范围提供了方便

0% B.反映了类目之间的从属关系和并列关系

100% C.反映了类目之间的从属关系和相关关系

0% D.说明往右移一位即缩小一级学科范围

标准答案:A

47.国际外观设计分类号08-07-B0329中第三组数字表示(分数:4,完成次数:2)

0% A.小类

0% B.英文版分类号

100% C.法文版分类号

0% D.产品序列号

标准答案:D

48.通配符(分数:4,完成次数:2)

0% A.加在检索词后进行的是模糊检索

0% B.用于代表一个以上的省略字符

0% C.加在分类号后可以检索该类及其所有下位类

100% D.通配符的形式有*、?、%、@ 标准答案:C

49.文献老化规律

(分数:4,完成次数:2)0% A.反映了文献的半衰期

0% B.反映了专业知识更新的速度

100% C.揭示了一个专业的文献,其利用价值与出版日期成反比。

0% D.揭示了一个专业的发展水平

标准答案:B

50.查找文摘的路径有(分数:4,完成次数:2)

0% A.目录、索引。

100% B.页码、文摘号。

0% C.目录或正文的排检词、索引、页眉。

0% D.页码、文摘号、页眉。

标准答案:C

51.评价检索效果的技术标准

(分数:4,完成次数:2)

0% A.反映了对系统的检索结果的满意度

100% B.与用户支出的费用有关

0% C.与用户的沟通有关

0% D.因检索条件的不同而有不同的标准

标准答案:A

52.在使用搜索引擎的关键词搜索时(分数:4,完成次数:2)

0% A.可以使用强制或运算符

0% B.不可以使用逻辑非运算符

100% C.可以使用逻辑与组配

0% D.不可以使用逻辑与组配

标准答案:C

53.常见的网络协议有(分数:4,完成次数:2)

0% A.超文本协议

0% B.远程登录协议

0% C.文件传输协议

100% D.SMTP、Telnet、FTP、HTTP 标准答案:D

54.文献出处中的“出处”指的是(分数:4,完成次数:2)

0% A.文摘或题录所在书刊的书名或刊名

0% B.文摘或题录在原书中的页次或所在原刊的年卷期次

100% C.收藏原文的图书情报单位

0% D.译文原文所在母体文献的原书名或原刊名

标准答案:B

55.逻辑与组配检索(分数:4,完成次数:2)100% A.运算符是XOR

0% B.不宜用同义词、从属概念词和不相关的概念组配

0% C.不宜用交叉概念的词进行组配

0% D.检索效果与逻辑非组配检索一样

标准答案:B

56.专利号由哪些部分组成?(分数:4,完成次数:2)

0% A.国家代码+专利申请类型+顺序号号

100% B.国家代码+申请号+专利文献类型代码

0% C.申请年份+申请号+专利文献类型代码

0% D.申请年份+专利申请类型代号+顺序号

标准答案:D

57.文献出处由以下哪些子项组成?(分数:4,完成次数:2)

0% A.书名、页次

100% B.刊名、年卷期次号

0% C.书刊名、出处

0% D.书刊名、出版年月

标准答案:C

58.专业图书(分数:4,完成次数:2)

0% A.包括学术专著、学位论文、名录等

100% B.包括论文集、百科全书、专利说明书等

0% C.包括科技报告、辞典、会议录等

0% D.其特点是内容比较系统、成熟

标准答案:D

59.在搜索引擎中搜索域名时(分数:4,完成次数:2)

0% A.可以使用强制与运算符

100% B.不可以使用逻辑或运算符

0% C.可以使用逻辑与组配

0% D.不可以使用逻辑与组配

标准答案:C

60.ISBN(分数:4,完成次数:2)

0% A.其中的字母B是“图书”的英文首字母

0% B.其中的字母S是“连续”的英文首字母

100% C.是因特网上的标准书号

0% D.用10 位数字唯一地代表一种书

标准答案:A

61.ISO和IEC分别指(分数:4,完成次数:2)

0% A.国际呼救符号和国际电磁安全委员会

0% B.联合国知识产权署连续出版物管理办公室和联合国教育委员会 100% C.国际标准化组织和国际电工委员会

0% D.因特网标准管理机构国际电子信息委员会

标准答案:C

62.分类号的等级结构(分数:4,完成次数:2)

0% A.反映了人类知识体系的结构性。

100% B.反映了类目之间的从属关系和相关关系。

0% C.反映了类目之间的从属关系和并列关系。

0% D.说明分类号增加一位,类目包含的专业范围就扩大一级。

标准答案:A

63.专业图书可以分类哪几类?(分数:4,完成次数:2)

0% A.阅读性图书和参考工具书

100% B.人文社会科学图书和理工类图书

0% C.专业书和科普读物

0% D.学术性图书和技术性图书

标准答案:A

64.通配符(分数:4,完成次数:2)

0% A.加在检索词前进行的是后方一致检索,这时通配符又称为截词符

100% B.用于代表一个以上的汉字

0% C.加在主题词后不一定能检索其下位概念

0% D.通配符的形式有*、?、$、# 标准答案:C

65.信息检索的特点有(分数:6,完成次数:2)

33% A.普遍性

33% B.多样性

0% C.杂乱性

33% D.可感知

标准答案:A,B,C

66.检索工具书的类型包括(分数:6,完成次数:2)

33% A.文摘

33% B.题录

33% C.索引

0% D.页眉

标准答案:A,B

67.文献分散规律(分数:6,完成次数:2)

33% A.指出文献的利用是有规律的。

33% B.揭示了期刊品种与期刊利用率的关系。

0% C.揭示了图书资料在不同阅读群体中有不同的分布规律。

33% D.揭示了核心期刊、相关期刊、边缘期刊之间国一定的比例关系。

标准答案:B,D

68.使用元词检索可以(分数:6,完成次数:2)

33% A.限定在超文本文件中的搜索范围

33% B.提高查准率

33% C.缩小检索范围

0% D.直达相关网页的首页

标准答案:A,C

69.IP地址(分数:6,完成次数:2)

33% A.其英文原义为Internet Point。

33% B.由4组数字组成。

33% C.若左面1至3组号码代表网络,则右边其余组号码代表主机。

0% D.只有大中型计算机才有IP地址。

标准答案:A,B,C

70.邮件列表的特点有(分数:6,完成次数:2)

0% A.可以采用普通信件的方式提出请求

50% B.采取集中式管理,所有用户都要登录邮件管理服务器去浏览其他人发表的文章

0% C.是一个封闭的学术论坛

50% D.采用离线交流方式

标准答案:C,D

71.文摘号

(分数:6,完成次数:2)

33% A.是文摘记录的唯一性标识

33% B.文摘正文是按文摘号的顺序排列记录的0% C.每年的最后一个文摘号反映了该文摘的年摘录量

33% D.文摘的摘录量与文摘的质量有关

标准答案:A,B,C

72.信息转化为情报的条件是

(分数:6,完成次数:2)

33% A.有丰富的信息资源 33% B.有识别信息的专门知识

0% C.有寻找特定信息的意识

33% D.信息对象处于保密状态

标准答案:B,C

73.元词是(分数:6,完成次数:2)

50% A.标识关键词在超文本文件中位置的标识符

0% B.检索词的词素

50% C.Metawords的中文译名

0% D.专门在元搜索引擎中使用的检索词

标准答案:A,C

74.专业期刊(分数:6,完成次数:2)

50% A.是一种连续出版物

0% B.包括学术性刊物、消息性刊物、资料性刊物等

50% C.包括快报性刊物、检索刊物、数值型刊物等

0% D.包括技术性刊物和其它记录了正式的公开的科学活动的杂志

标准答案:A,B,D

75.邮件列表的特点有(分数:6,完成次数:2)

50% A.是各国邮政局的网站大全。

50% B.除提供信函传递外,还具有电子汇兑、网上付款和转帐功能。

0% C.要在邮件正文中以指令的形式提出请求

0% D.以邮件的形式回传论文

标准答案:C,D

76.URL(分数:6,完成次数:2)

33% A.传递文本和动态数据的网络协议

33% B.统一资源定位符的英文缩写

33% C.由网络协议、域名、目录路径和文件名组成0% D.其中的问号“?”后面是传回Web服务器的表单数据

标准答案:B,C,D

77.信息的特点有:(分数:6,完成次数:2)

33% A.普遍存在性

33% B.形态多样性

0% C.无序性

33% D.有用性

标准答案:A,B,C

78.专利申请的类型有:(分数:6,完成次数:2)

25% A.国防专利

25% B.发明

25% C.实用新型 25% D.外观设计

标准答案:B,C,D

79.文献分散规律(分数:6,完成次数:2)

50% A.指出文献的利用是没有规律的0% B.揭示了专业论文在期刊上的集聚现象

50% C.揭示了专利种类与专利文献利用的关系

0% D.表明在刊载论文量相等的条件下,核心期刊、相关期刊、边缘期刊之间的比例为a0:a1:a2 标准答案:B,D

80.强制出现符

(分数:6,完成次数:2)

50% A.可以提高查全率

0% B.书写形式与逻辑或的简写形式一样

50% C.要加在被强制关键词前

0% D.与被限制的关键词之间不能有空格

标准答案:B,C,D

81.IP地址(分数:6,完成次数:2)

50% A.其含义为网络主机地址

50% B.是网络主机的唯一性标志

0% C.左面第1组数字如果在199-219之间,该网络最多可容纳254台主机

0% D.只有大型计算机才有IP地址

标准答案:A,B,C

82.新闻组(分数:6,完成次数:2)

50% A.收集并提供新闻素材。

0% B.按专题分类。

50% C.数据保存时间短,但覆盖地域广。

0% D.有争议问题的专题讨论组的组名是talk。

标准答案:B,D

83.专利文献的主要类型有:(分数:6,完成次数:2)

33% A.请求书

33% B.说明书及其附图和摘要

33% C.权利要求书

0% D.专利检索工具书

标准答案:B,C,D

84.信息转化为情报的条件是:(分数:6,完成次数:2)

0% A.有获取信息的条件

50% B.识别和解读信息的能力

50% C.有寻找特定信息的目的 0% D.基于某种特殊任务

标准答案:B,C

85.强制不出现运算符(分数:6,完成次数:2)

50% A.可以提高查准率

50% B.书写形式与逻辑非的简写形式一样

0% C.要加在被强制的关键词前,与被限制的关键词之间不能有空格

0% D.符号前后必须留有空格

标准答案:A,B,C

86.专业期刊(分数:6,完成次数:2)

0% A.是科学交流和情报传递的主要载体和重要信息源

50% B.包括技术性刊物、资料性刊物、检索刊物等

50% C.包括学术性刊物、消息性刊物、数字化期刊

0% D.包括快报性刊物和其它记录了正式的公开的科学活动的杂志

标准答案:A,B,D

87.新闻组(分数:6,完成次数:2)

33% A.收集并提供新闻素材

33% B.新闻组的内容按专题分成多个级别

33% C.数据保存时间短,但内容覆盖的地域范围广

0% D.组名News的内容与新闻组自身有关

标准答案:B,D

88.URL(分数:6,完成次数:2)

50% A.传递音频和视频数据的网络协议

0% B.统一资源定位符的英文缩写

50% C.由网络协议、域名、文件名及其目录路径组成0% D.其中问号“?”后面是传回Web服务器的操作参数

标准答案:B,C,D

第五篇:信息检索考试重点

信息检索

考试类型:闭卷

考试题型:单选、判断、名词解释、应用(信息检索过程)考试重点:

1、文献:文献是记录知识的一切载体。凡是用文字、图形、符号、声频、视频记录下来,具有存贮和传递知识功能的一切载体都称为文献。

2、文献类型:印刷型 缩微型 视听型 机读型

3、知识:是在人们对信息进行分析的基础上提供的解决方案。知识管理的主要目的是使信息能够服务于人们的行动和决策。

4、信息:是凭借人的认知能力和经验对数据进行选择、评价、组织和分析的结果。信息管理主要是解决数据的相关性、系统化和规范化的问题。

5、数据:指离散孤立的互不关联的事实、文字、数据和符号,这些资料之间缺乏相关性。

6、文献级次:

零次文献(灰色文献):指非正式出版物或非正式渠道交流的文献。

一次文献(原始文献):凡是著者在科学研究,生产实践中根据科研成果,发明创造撰写的文献,称为一次文献。一次文献是文献的主体,是最基本的情报源,是文献检索的对象。

二次文献:它是将分散、无序的一次文献,按照一定的原则进行加工,整理、提炼、组织,使之成为便于存贮、检索的系统。如目录等检索工具。

三次文献:它是在利用二次文献的基础上,选用一次文献的内容,进行分析、概括、综合研究和评价而编写出来的文献。它又可分为综述研究类和参考工具类两种类型。前者如动态综述、学科总结、专题述评、进展报告等;后者如年鉴、手册、大全等。三次文献源于一次文献,又高于一次文献,属于一种再创性文献。三次文献一般来说系统性好,综合性强,内容比较成熟,常常附有大量的参考文献,有时可作为查阅文献的起点。

高级文献:计算机型文献,如:PTF、HTM等。

7、十大文献源 1图书(Books)2期刊(Periodicals)或(Journal,Magazine)3科技报告(Technical reports)4政府出版物

5会议文献(Conference papers)6专利文献:(patents)7学位论文(Thesis,Dissertation)8技术标准(Technical standards)9科技档案(document)10产品样本

8、文献检索:从大量的文献中查找与特定课题有关的文献的过程。

9、检索语言是根据信息检索的需要,专门用于各种手工和计算机化的文献信息检索与存贮系统描述文献主题概念和研究课题主题概念的表达检索提问的人工语言。检索语言又称为索引语言、存贮与检索语言、文献语言、文献工作语言、标引语言、标引符号、标识系统等等。

9、检索方法:常用法:顺查法、倒查法、抽查法。追溯法:最新引文法。

循环法(分段法):常用法+追溯法

10、检索步骤 :分析课题--选择检索系统--检索途径--检索标识--检索方法--查找文献线索--获取原文 11.信息检索的涵义:从广义上讲,信息检索包括两个过程,一是信息存储(information storage),即信息的标引、加工和存储过程: 二是信息检索(information retrieval),即信息用户的查找过程。从狭义上讲,信息检索仅指后一部分。

信息检索的本质是一个匹配的过程,即用户的信息需求和信息存储的信息集合进行比较和选择的过程

12、信息存储和检索过程的基本原理

13、信息检索的类型: 按信息检索的内容划分:文献检索 数据检索事实检索概念检索 按信息检索的组织方式划分:全文本检索 多媒体检索 超文本检索

14、检索语言(retrieval language)是文献信息标引和检索提问而约定的人工语言。

15、检索语言的种类

16、检索方法:查找(Searching)就是实施检索策略、搜寻所得文献信息的过程。

17、拉网法:在不了解查询某一专题信息的URL地址时,可从提供信息总目的Web 页面开始浏览,沿着专题链接层层查找,直至找到有关的内容为止。然后用“书签”保存这个页面的URL,转向另一个分支。这种方法可以迅速获得较多的相关地址,然后进行筛选。就使用引擎而言,国外专家也建议先用链接页面多、响应时间快的引擎。

18、引文法(跟踪法):文献之间的引证和被引证关系揭示了文献之间存在的某种内在联系,引文法(也有称为跟踪法)就是利用文献后所附的参考文献、相关书目、推荐文章和引文注释查找相关文献的方法。

引文法又可分为两种,一种是由远及近地搜寻,即找到一篇有价值的论文后进一步查找该论文被哪些其它文献引用过,以便了解后人对该论文的评论、是否有人对此作过进一步研究、实践结果如何、最新的进展怎样等等。由远及近地追寻,越查资料越新,研究也就越深入,但这种查法主要依靠专门的引文索引。另一种较为普遍的查法是由近及远地追溯,这样由一变十,由十变百地获取更多相关文献,直到满足要求为止。这种方法适合于历史研究或对背景资料的查询,其缺点是越查材料越旧,追溯得到的文献与现在的研究专题越来越疏远。因此,最好是选择综述、评论和质量较高的专著作为起点,它们所附的参考文献筛选严格,有时还附有评论。

19、常规法:所谓常规法就是利用常规检索工具查找有关文献的方法,是信息时代应掌握的最基本的信息查找方法。常规法可分为顺查法、逆查法和抽查法。

20、排除、限定和合取法

这实际上是将信息加工的方法融入检索中去。思维中使用排除这一概念,是指对查找对象的产生和存在的状态在时间和空间上加以外在否定。把这一方法移植到检索中,就是在时间或空间上极大地收缩检索范围。限定法是相对于排除法而言的,指对查找对象在时间和空间上加以内在的肯定。排除的结果必然是限定,反之亦然。

21、分类检索的步骤

(1)分析待检课题,确定其学科,并弄清学科间的各种关系。(2)查出待检课题的分类号(工具简单时可以省略)(3)选择适当的检索工具

(4)进入检索系统后选择分类号途径,并在对话框内输入分类号,开始检索。(5)对比题目,阅览相关信息,选出所需信息,并下载相关信息。(6)原文的索取

22、检索技术

(1)布尔检索(boolean retrieval)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配的一种技术,也是目前最常用的一种检索技术。

(2)截词检索(truncation retrieval)是指在检索词的适当位置截断,用截断的词的一个局部进行的检索。由于检索词与数据库所存储信息字符是部分一致性匹配,所以又称部分一致检索。截词符多采用通配符“?”、“$”、“*”(3)邻近检索(proximity retrieval),又称为“位置检索”、“词位检索”、“全文检索”是一种可以不依赖叙词表而直接使用自由词进行检索的一种技术,它以数据库原始记录中词语的相对次序或者位置关系为对象进行组配运算。

(4)字段限定检索:是用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,是提高检索效果的一种有效检索方法。

例子:(minicomputer/DE, TI OR personal computer/ID, TI)AND PY=2008 AND LA=English 这个检索式所表达的检索要求是:查找2008年出版的关于微电脑或者个人电脑的英文文献,并要求“微电脑”一词在命中文献的叙词字段、标题字段出现,“个人电脑”一词在命中文献的自由词字段出现。

23、信息检索的基本步骤

24、确定检索词

1.切分:是对课题的语句以自由词为单位进行拆分,转换为检索的最小单元。自由词切分仅适用于自然语言检索。

2.删除:是对自然语言中不具有实质性检索意义的虚词(如介词、连词、副词等),或者使用频率较低的词,或者专指性太高、过分宽泛的词,或者过分具体的限定词、禁用词,或者不能表达课题实质的高频词,或者存在蕴含关系可以合并的词,一律予以删除,使自然语言转换成为关键词和主题词的集合。3.替补:在进行切分、删除后,对检索词进行替换和补充。4.组合 ①概念相交组合。这个新概念是原来用以组合的两个概念的下位概念,如曲柄连杆机构*发动机=汽车发动机。② 概念限定组合。这个新概念可用来表示这一事物的某一属性或某一个方面。如电视机*数字化=数字电视机。③概念并列组合。具有概念并列关系的自由词间的组配,其结果使概念检索的范围扩大,如环境污染+环境保护=环境污染和环境保护。

④概念删除组合。是指两个具有上下位关系的自由词间的组合,其结果使概念检索的范围缩小,如信息处理-模拟信息处理=数字信息处理。⑤增加

(1)增加“限义词”。有两种方法:直接增加限义词、挖掘隐含词、提取潜在的检索词;把限义词以逻辑的方式加入,可采用逻辑“与”或逻辑“非”的方法增加限义词。

(2)分析隐含概念。挖掘潜在的主题词还可以通过对上位词、下位词、同类词关系的分析得到其它相关主题词。如例1:“妇女吸烟与肺癌的关系研究”,切分、删除后得:吸烟、肺癌两个检索词,分析、补充上位词可增加检索词:烟、癌症、恶性肿瘤。

提取检索词首先是切分、删除,其次是进行替补、组合和增加。当检索结果信息量过多时

原因:选用了多义性的检索词 截词截的过短,输入检索词太少 应该使用“与(AND)”的使用了“或(OR)”;优先运算符‘()’使用错误。考虑缩小检索范围。方法如下:(1)采用专指性强的主题词,减少同义词 同族相关词等相关性不强的检索词。(2)增加限制概念,采用‘AND’算符连接检索词或进行二次检索。(3)使用字段限定,把检索词限定在题目主题词等主要字段。(4)缩短检索年限,限制检索结果的文献类型 语种及出版国。(5)使用‘NOT’算符,排除无关概念。(6)调整位置算符,由松变严。(7)改模糊检索为精确检索。

当检索结果信息量太少时

原因:检索词拼写错误;遗漏重要的同义词或隐含概念;检索词过于生僻具体;没有使用截词算符;位置算符和字段算符使用的过多 使用过多的‘AND’考虑扩大检索范围方法如下:

根据词表的分类结构体系口占关键的检索词,用扩展按钮增加同义词和相关词并用‘or’算符连接这些词(2)降低检索词的专指度,可从词表或检出文献中选择上位词或泛指词补充道检索式中(3)减少检索年限 文献类型 语种以及出版国的限制(4)取消某些限制过严的字段限制 位置算符限制(5)在词干相同的单词后使用截词符(6)改精确检索为模糊检索(7)同时使用拼写正确的词 以及拼写错误的词或存在多种普遍错别字的词作为检索。

计算机信息检索的本质是信息用户的提问标识和信息集合数据库特征标识的匹配过程。计算机信息检索的系统构成 : 服务器 通信网络 检索终端 数据库

文献检索过程:制定检索策略—选择检索路径—使用检索方法—熟悉检索步骤(分析课题—选择检索系统—检索途径—检索标识—检索方法—查找文献线索—获取原文)。

下载【云南大学】信息检索期末复习重点word格式文档
下载【云南大学】信息检索期末复习重点.doc
将本文档下载到自己电脑,方便修改和收藏,请勿使用迅雷等下载。
点此处下载文档

文档为doc格式


声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:645879355@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。

相关范文推荐

    信息检索期末论文

    在研究“氧化锌半导体薄膜的制备及表征”课题中,信息检索的应用 首先当我们拿到课题“氧化锌半导体薄膜的制备及表征”课题之后,我们马上需要做的是查找相关的文献,获取相关的......

    信息检索期末总结

    1. 2. 信息七大特点:普遍性、载体依附性、时效性、传递性、共享性、可转换性、可伪性 十大信息源:图书、期刊、专利文献、标准文献、会议文献、灰色文献、技术档案、科技报告......

    信息检索复习1(精选合集)

    信息检索复习1、什麽是信息素养P.1 信息素养是指图书检索技能和计算机技能集合而成的一种综合的能力和素质。 2、信息、知识、情报和文献的定义P3-6 信息:是自然界、人类......

    信息检索复习要点

    复习要点: 1. 如何查找纸本原文,必备信息是什么,刊名等同于什么 刊名等同于ISSN号,必备的信息是,文章题目、期刊名称或是ISSN号,年/卷/期。 先查找有无电子全文。 谷歌搜索、SFX全......

    医药信息检索作业重点归纳

    检索作业:  基础知识 1.按信息的产生次序和加工整理的程度不同,可将信息源划分为四个层次,分别是哪四个层次,并举例? 按信息的产生次序和加工整理的程度不同可将信息划分为以下四......

    网络信息检索期末作业

    期末作业一、 读书心得 1、 结合《世界是平的》、《理解媒介》,谈谈有关网络新时代特征的看法。 小谈网络新时代特征 今时不同往日,今天的世界是以往的人类所不能想象的,就像我......

    信息检索课期末复习题

    信息检索课期末复习题第1章 绪论1.信息素质的概念。(P2)2.信息素质的四要素分别是什么?(P3)第3章 信息与信息资源1.信息的含义。(P33)2.信息的特征。(P3-34)3.文献的概念。(P35)4.文献......

    医药信息检索复习终极版

    信息、知识、情报和文献的概念是什么?它们之间关系如何? 信息:指物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反映,它提供了客观世界事物的消息、知识,是事物的......