第一篇:现代信息检索题目及
《现代信息查询与利用 》参考题目
一、每一位同学从以下题中选择一题来做,也可以自拟题目: 城市下岗工人工作生活状况
促进城乡义务教育均衡发展问题
大型赛事对城市发展的影响
大学毕业生当村官
大学生创业现状、问题与对策
大学生就业问题研究综述
“80后”与“90后”大学生比较研究
低碳经济研究综述
电子商务发展研究综述
发展低碳经济的现状与对策
发展旅游业对当地生态环境的影响
房地产市场研究综述
在校大学生创业问题
网络对大学生的影响问题
教育应注重人格培训还是技能培训
大学生谈恋爱问题
构建和谐社会背景下的医疗卫生问题
关于城市化研究综述
关注弱势群体生活保障问题
国内外高等教育研究综述
节能减排问题
经济国际金融危机后民营企业经营状况
经济与环境协调研究综述
科学发展观与大学生活规划
老年人家庭赡养问题及对策
旅游文化开发基础研究
农村劳动力转型问题
农村留守儿童生活状况研究
农村人口的就业方式、就业观念变化调查调研
农村社会保障制度建设研究
农村社会弱势群体的权利保护问题
农村社会养老保险研究综述
农村义务教育实施情况研究
农民工返乡创业问题
全球变暖问题
社会保障问题
四川旅游环境研究综述
特色农业现代化道路调研
图书馆建筑研究进展综述
我国信息生态问题研究综述
我国远程教育在农村中的发展问题 新农村建设背景下的农村乡风文明建设 新形势下粮食安全问题 医疗制度改革问题
金融危机对我国财政政策的影响综述区域经济发展研究综述
新农村建设中的公共事业管理研究综述农村留守儿童心理问题研究综述碳汇交易在我国的发展现状及对策基于分形理论的地方文化产业发展研究高校处罚法的立法现状与未来发展公民道德危机问题研究纪录片创作的故事化绵阳的旅游市场研究综述
数字图书馆的知识产权问题研究综述知识传播动力学研究综述企业战略信息系统研究综述知识传播动力学研究综述
分布式知识管理系统的开发和应用研究综述流媒体技术研究综述软系统方法研究综述
高校信息化体系建构研究综述智能代理技术研究综述
网络信息的挖掘技术研究综述异构信息集成模型研究综述网络不良信息过滤研究
信息向量与信息接发失真研究综述信息技术对组织的影响研究综述信息资源开发技术研究综述三维可视化系统研究综述信息污染研究综述信息系统实证研究综述
版权保护与信息资源共享研究综述网络虚拟财产的法律属性研究农村宅基地使用权流转法律问题互联网发展的法治问题
公民启动违宪审查的法律困境公民言论自由的法律限制
大众传媒对大学生学习的影响消费者知情权的保障研究我国品牌发展的问题与对策广告新闻化的媒介行为分析研究
二、要求按以下格式及内容要求撰写“《现代信息查询与利用》综合报告”:
《现代信息查询与利用》综合报告模板
学科专业学号姓名成绩
课题:
一.研究主题分析 1. 需求分析:
(列举出课题需要的文献信息为全面性文献资料/专深性文献资料;查找的文献资料的文献类型;文献加工深度;文献的时间范围;文献的作者、文献的质量;语种范围)2. 关键词分析:
(根据课题题目提取出检索关键词,并且扩展出相关的等同词与下位词)3. 背景知识:
(通过文献资料汇集书写300字左右的课题的背景材料,可包括课题描述的事物发展历程、种类、现状,国内外研究的重点机构、项目、代表人物和已经取得的学术成果等)4. 拟解决的问题:
(通过思维分析活动和了解课题背景知识对课题进行主题分析,提出需要解决的问题)二.信息检索与收集 1.检索方法:
(文献检索过程中可能需要使用的检索方法,例如常规法、追溯法、访谈法、二次检索法、综合法等)2.检索工具:
(查找文献的工具;文献检索过程中使用到的中文数据库;中文搜索引擎;纸质书籍、报纸、期刊等。要求使用的检索工具不少于3个)3.检索主题词:检索表达式
(文献检索过程中使用的检索词,检索技术的应用)4.检索过程:
(根据提取的主题检索词,依次使用不同的检索工具,运用构建相匹配的检索表达式并且使
用适合的检索方法,分别获取检索结果)
三、检索结果的筛选与评价
1、依据检索目标,对检索获得的相关结果文献进行选择,并记录下其中6篇重要文献的外表特征分别是:(1)【题名】 【作者】【作者单位】 【刊名】【关键词】
【摘要】(此处指的是原文的摘要)
得到了下列的重要文献(包括追溯法检索与引文检索法获取的文献)的外表特征及摘要是:
2、依据检索结果,从文献的相关性、可靠性、适用性、新颖性等几个方面来评价一下
四、检索结果的比较与归纳
(通过阅读分析,对5篇文献从研究的目的、提出研究的问题、研究方法、研究的结论、文献的创新点、该文献与你的关系等方面进行比较与归纳分析,写出针对该题目,在以后的写作中将重点研究的内容与方法,或提出自己研究的方向与重点。)
五、检索结果的应用与组织(综述写作)
按照课题要求,根据分析整理出的5篇文献资料,选择一种综述类型撰写课题的综述。要求字数1000字左右,格式要完整:(1)题目:(2)引言:(3)正文:(4)结论:(5)参考文献:(按照标准的参考文献标注格式书写,并在综述中标注出来)
六、我的信息素养(选做其中一题)
1、对照本课程的信息素养评价指标,根据课程学习的心得体会,写下自我信息素养提高的总结,200字。
2、打开,以实名制形式做一份问卷调查。
作业形式:打印稿
作业上交时间:6月20日
地点:新区图书馆三楼技术部(3-12)电话:6089229
温馨提示:综合报告中所提及的概念在课堂上、书本上都有讲过,如果不记得,可网络自助查询,此过程不必写入报告。
第二篇:现代信息检索论文
期末课程论文
论文标题:课程名称:信息检索技术课程编号:学生姓名:尹江津学生学号:所在学院:计算机科学与工程学院学习专业:计算机科学与技术课程教师:
文本分类及相关技术研究
1220500 1100310230
王
冲
2013年7月2 日
文本分类及相关技术研究
信息检索(Information Retrieval,IR)是研究信息的表示、存储、组织和获取的一门学科,其目标是为用户快速、准确地提供其所需的信息。信息检索起源于20世纪50年代,在60年代取得了关键性进展,其中最著名的是GerardSalton开发的SMART系统以及Cym Cleverdon提出的Cranfield评价方法,SMART系统和Cranfield评价方法有力地推动了信息检索的发展。在70年代和80年代,多种关于文档检索的模型被提出,文本检索会议(TREC)于1992年开始举办,该会议推动了大规模文档集合环境下的信息检索技术的发展。随着互联网上信息的迅速增加,为了进一步提高用户信息检索的质量和效率,网络上出现了更高效地信息索工具——搜索引擎(Google,Yahoo,Bing,百度等),搜索引擎为用户在互联网这个分布式环境下检索需要的信息提供了极大的方便。
文本分类是一个监督学习过程,它根据一个类信息已知的训练文档集合,训练出文本特征和文本类别间的关系模型,然后通过这个学习得到的模型对待分类文本进行分类。文本分类技术是处理和组织文本数据的重要手段,同时也是信息检索的重要基础,把大量的文本信息按主题层次进行组织可以极大地简化信息检索的过程,按照类别对文档进行检索或对检索结果进行分类,都可以提高检索的查准率。由于文本分类技术可以对大量的文本进行分类,文本分类在信息检索、自然语言处理、垃圾信息过滤、Web挖掘等领域得到了广泛应用。
一、文本分类概述 1.文本分类的一般过程
数据分类是数据分析的一种重要形式,数据分类通常用两个步骤:学习和分类。在学习步,分类算法利用训练数据来构建分类器,训练数据有多个元组以及与元素关联的类标签构成。元组X被表示为n维的属性向量,每一个元组属于一个或多个事先定义好的类别,类别由类标号属性(class label attribute)决定,类标号属性由离散、无序值构成。由于每一个训练元组的类标号已知,因此,学习步是一个监督学习过程。学习步可以看作是学习映身函数,函数,对于给定的元组Z该函数可以预测与X关联的类别标号。文本是数据的一种具体形式,也是语言的实际运用形态,文本在人们生常生活中无处不在,任何有具体一定含义的文字都可以统称为文本。文本分类系统的任务是:在给定的分类体系下,根据文本的内容自动地对待分类文本进行分类,确定待分类文本的类别。其数学公式表示如下:
其中,A为类信息未知文本的集合,B为分类体系中类别信息的集合文本分类一般包括以下5个过程:文本预处理、文本表示、特征降维、分类器的选取与训练以及分类结果的评价。
文本分类系统的主要功能模块为:
(1)文本预处理:为了使文档的格式满足分类器的输入要求,首先需要对原始语料进行处理,将其格
式进行规范化,;
(2)文本表示:将文本分解为基本处理单元,用数学模型来表示;(3)特征降维:降低特征空间的维数,提高分类器的效率和准确率;(4)分类器:选择合适的分类器并用训练数据集进行训练;(5)性能评价:选择对分类器的性能进行评估的性能评价标准。
2.文本预处理·
自动文本分类的第一步是文本预处理。通常情况下,各种不同类型的文档的来自不同的领域,从而文档的存储形式各异,并且计算机处理的文本不仅包含文字内容,还包含有功能性标签等不规范符号,文本分类模型不能直接对原始文档进行处理。必须对原始文本进行预处理,去除其中的噪声,规范化其形式,从而使文本满足分类模型的输入要求。文本预处理是影响文本分类准确度的关键因素,文本预处理的主要任务是从原始文本提取主要内容并对其格式进行规范化,一般包括以下几个步骤:去除文档中的格式标记、过滤非法字符、字母大小写转换、去除停用词和稀有词、词干化处理。
3.文本表示
文本本身不能被直接用来分类,为了使文本能够输入到计算机中进行处理,首先应将原始文本转换为数学模型,然后用计算机对数学模型进行处理。在实际应用中,将原始文本转为文本向量和词频矩阵后,这些数学模型非常庞大,计算机处理时需要花费大量的时间,为了提高处理效率,一般都假设词语与词语之间相互独立,词语在文本中的位置被忽略,文档被表示为不同特征项的集合。这种方法被称为“朴素(Naive)”的方法或“词袋“模型。文本表示模型主要有布尔模型、向量空间模型以及统计语言模型,虽然这三种模型采用不同的方法来表示文档,这三种模型都采用了“词袋”模型的思想。
4.信息增益
信息增益是指某特征项在文本中出现前后的信息熵之差,在机器学习领域中,经常用信息增益来衡量某个特征项的重要性。对于词语t和文档类别C,通过统计C中出现和不出现t的文档数来衡量t对C的信息增益。特征项t的信息增益用如下公式计算:
其中,Pr(Ci)表示在文本集合中属于白类的文本出现的概率,Pr(t)表示文本集合中包含特征项t的文本在文本集合中的出现概率,Pr(Ci|t)表示在文本中包含词语f的条件下文本属于类Ci的条件概率,Pr(t)表示文本集合不包含特征项t的文本在文本集合中的出现概率,Pr(Ci|t)表示在文本中不包含词语t的条件下文本属于类Ci的条件概率,m是类别总数。根据公式计算出各个特征项的信息增益后,除去增益值小于指定闽值的特征项,剩余的即为选中的特征;或按特征项的信息增益从大到小排序,删除信息增益很小的单词。
二、文本分类方法 1.Naive Bayes方法
Naive Bayes分类方法(以下简称NB法)是一种简单而又非常有效的分类方法。NB法的一个前提假设是:在给定的文档类语境下,文档属性是相互独立的。假设面为一任意文档,它属于文档类C={cl,C2,.,Ck)中的某一类cj。根据NB分类法有:
对文档反进行分类,就是按计算所有文档类在给定di情况下的概率,概率值最大的那个类就是di所在的类,即:
可知,对于给定分类背景和测试文档,用NB法分类的关键就是计算P(Cj)和P(di|cj)。计算P(cj)和尸(硝lcj)的过程就是建立分类模型(或者说学习)的过程。根据.P(dj|ci)计算方式的不同,可以将Naive Bayes方法分为最大似然模型(Maximum Likelihood Model)、多项式模型(Multinomial Model)、泊松模型(PoisonModel)等[ELM03]。
2.使用最大熵模型进行中文文本分类
最大熵模型是一种在广泛应用于自然语言处理中的概率估计方法,它可以综合观察到的各种相关或幂相美的概率知识,对许多问题的处理结果都到这或超过了其他方法的最好结果。但是,将最大熵模型应用在文本分类中的研究却非常少,本章使用最大熵模型进行了中文文本分类的研究。通过实验,比较和分析了不目的中文文本特证生成方法,以及使用平滑技术的情况下,基于最大熵模型的分类器的分类性能;将其和Bayes、KNN、SVM三葶争典墨的文本分类器进行了比较;使用Bagging来提高最大熵模型的分类稳定性。
1).最大熵模型
最大熵模型是用来进行概率估计的。假设a是某个事件,b是事件a发生的环境(或称上下文),我们想知道a和b的联合概率,记为p(a,b)。更一般地,设所有可能发生的事件组成集合为A,所有环境组成的集合为B,我们想知道,对于任意给定的aA,bB,概率p(a,b)是多少?
我们抱这个问题放到自然语言处理的领域来讨论,对于文本分类问题,一个文档分到某个类别可以看成一个事件,文档中出现的词可以看成这个事件的发生环境,我们想知道包含词b的文档属于某一类a的概率。很容易想到的方法是通过训练语料进行统计。给定一个训练集,定义A={a1,a2,A,am)是文档所属类别集,B={bl,b2,A,bm}是文档的特征词集,num(ai,bj)为疆练集中二元组(ai,bj)出现的次数,那么我们可以使用如下公式进行概率估计:
这个方法有个很大的问题,即“稀疏事件”(sparse evidence)问题,即便是很大的训练文本,很多
二元缝组(ai,bj)仍然没有出现,武断的认为它的概率为0显然是不可取的。最大熵模型是这样来解决稀疏事件问题的,它使未知事件的概率分布总是尽可能均匀,即倾向予得到最大熵。例如一个军事、政治和科技的三类文本分类题,我们得知出现“飞秘”这个词的、80%的文档属于军事类别,对于“飞机”这个词在蒺饱两类中的分布未知。根据最大熵原则,如果给定一个包含“飞机”这个词文档,那么认为文档以0.8的概率属于军事类别,分别以0.1的概率属于其它两类;如果文档中不包含“飞机”这个词,那么认为文档分别以相同的、1/3的概率属于每一个类。即,在符合已知约束条件下,使未知事件尽可能均匀。具体来说,根据Shannon的定义,熵的计算公式如下:
那么,求解满足最大熵原则的概率分布公式如下:
三、总结与展望
文本分类技术是组织和处理文本数据的重要手段,其主要任务是如何在给定的分类体系下,根据文本的内容自动地确定与文本关联的类别。文本分类可以有效解决大量文本信息归类的问题,并且是信息检索、Web挖掘、内容信息过滤等研究的重要基础。主题模型是概率模型,由于主题模型可以捕获潜在的语义结构信息,主题模型在文本分类、信息抽取、观点挖掘等文本挖掘任务中的应用得到了较深入的研究。
本文对文本分类进行了研究,介绍了文本分类的一般过程与关键技术,主要包括:文本预处理、文本表示、性能评价指标,同时还对主题模型PLSA、LDA、sLDA和iTopicModel的构建方法和参数估计方法进行了介绍。针对已有的监督主题模型与基于机器学习的文本分类算法假设文档之间相互独立、不能有效利用文档间的关联关系的问题,提出了监督关联主题模型SRTM和关联文本分类算法TC.iTM。为了利用利用文档间的关联关系来提高监督主题模型的预测准确度,我们基于iTopicModel提出了监督关联主题模型SRTM,将文档间的关联关系、文档的文本信息、文档的标号进行统一建模,首先用古典线性回归模型对文档标号进行建模,给出SRTM的联合概率分布,通过EM算法最大化联合概率分布的对数似然对SRTM的参数进行估计,然后用Fold.In[54]方法对训练数据以外文档的标号进行预测。最后我们用广义线性模型对文档标号进行建模,对SRTM进行扩展,使SRTM可以处理多种类型的文档标号。Cora研究论文分类数据集和电影评论数据集上的实验表明,在文档网络中,SRTM的预测结果要优于现有的监督主题模型。
参考文献: [学位论文] 姜英杰,2010郑州大学:计算机系统结构
[学位论文] 刘欣,2010重庆大学:计算机科技与技术
[学位论文] 陈树清,2010南京理工大学:计算机应用技术
第三篇:信息检索题目及答案
注意:
1、通读教材,根据页码提示完成下列题目。
2、最后一次上机课在线测试,范围不超出如下题目。
第一章
一、单选
1、报道范围主要为能源方面的科技报告为(D)。
A、AD
B、PB
C、NASA
D、DOE{第7页}
2、(C)是出版周期最短的定期连续出版物。
A、图书
B、期刊
C、报纸
D、学位论文{第6页}
3、(A)是高校或科研机构的毕业生为获取学位而撰写的。
A、学位论文
B、科技报告
C、会议文献
D、档案文献{第6页}
4、了解各个国家政治、经济、科技发展政策的重要信息源是(B)
A、科技报告
B、政府出版物
C、标准文献
D、档案文献{第8页}
5、年鉴属于下列哪一类别(D)
A、零次信息
B、一次信息
C、二次信息
D、三次信息{第7页}
6、下列哪种文献属于一次文献(A)。
A、图书
B、百科全书
C、综述
D、文摘 {第4页}
7、下列文献中属于一次信息的是(A)
A、专利说明书
B、百科全书
C、目录
D、综述{第4页}
8、以下各项属于二次信息的是(A)
A、索引
B、期刊
C、学位论文
D、百科全书{第4页}
二、多选
9、二次信息主要包括(CD)等。
A、手册
B、年鉴
C、目录
D、题录{第4页}
10、信息的属性包括(ABCD)
A、客观性
B、时效性
C、传递性
D、共享性{第3页}
11、信息素质的内涵主要包括(ABC)。
A、信息意识素质
B、信息能力素质
C、信息道德素质
D、信息职业素质{第9页}
12、以下类型的信息属于三次信息的是(BC)。
A、目录
B、词典
C、百科全书
D、科技报告{第4页}
三、判断
13、档案文献具有原始性特点,客观真实地反映了历史。(正确){第8页}
14、年鉴和百科全书属于二次信息。{第4页}错
15、图书一般不能反映最新的信息,时效性差,相比之下,期刊出版发行速度快,内容新颖。(正确){第6页}
16、文献信息源是各种信息源中检索与利用的主体。(正确){第3页}
17、一次信息也称为第一手资料,如书目和索引。(错){第4页}
18、语言信息源,即零次信息,也就是指非正式的、口头交换的信息。(正确){第4页}
19、知识被包含于信息,是信息的组成部分。(正确){第2页} 20、专利说明书属于二次信息的范畴。(错){第4页} 第二章
一、单选
21、(D)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。
A、查全率
B、查准率
C、误检率 D、漏检率{第43页}
22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D)。
A、G636.33 B、G216.2 C、I247.4 D、H319{第21页}
23、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A)
A、检索出除了中年教师以外的在职人员的数据
B、中年教师的数据
C、中年和教师的数据
D、在职人员的数据{第34-35页}
24、布尔逻辑检索中检索符号“OR”的主要作用在于(B)。
A、提高查准率
B、提高查全率
C、排除不必要信息
D、减少文献输出量{第35页}
25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C)。
A、目录
B、题录
C、索引
D、文摘{第30页}
26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A)
A、全文检索
B、文献检索
C、超文本检索
D、超媒体检索{第14页}
27、截词检索中,“?”和“*”的主要区别在于(A)。
A、字符数量的不同
B、字符位置的不同
C、字符大小写的不同
D、字符缩写的不同{第36页}
28、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(C)表示无限限检索。
A、+ B、| C、* D、?{第36页}
29、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(A)表示有限检索。
A、?
B、| C、* D、-{第36页} 30、利用截词技术检索“?ake”,以下检索结果正确的是(D)
A、stake B、snake C、slake D、take{第36页}
31、利用图书末尾所附参考文献进行检索的方法是(D)。
A、顺查法
B、倒查法
C、抽查法
D、追溯法{第15页}
32、位置运算符号(W)和(N)的主要区别在于(C)。
A、检索词之间间隔的字符数量的差异
B、检索词是否出现在同一字段中
C、检索词出现的位置是否可以颠倒
D、检索词是否出现在同一文献中{第37-38页}
33、我国最早的分类法是(B)
A、《中经新簿》
B、《七略》
C、《四库全书总目》
D、《隋书经籍志》{第19页}
34、要查找吴敬琏所发表的文章,首选途径为(C)。
A、题名途径
B、号码途径
C、责任者途径
D、以上都行{第16页}
二、多选
35、布尔逻辑检索的运算符号包括(ABC)。
A、and B、or C、not D、add{第34-35页}
36、布尔逻辑运算符号“非”的作用在于(ABCD)。
A、增加限制条件
B、排除检索结果
C、缩小文献范围
D、提高查准率{第35页}
37、布尔逻辑运算符号“与”的作用在于(ABCD)。
A、增加限制条件
B、缩小检索范围
C、提高检索的专指性
D、提高查准率{第34页}
38、常用的位置检索符号包括(ABCD)。
A、(W)
B、(nW)C、(N)D、(nN){第37-38页}
39、常用的信息检索方法有以下几种(ABCD)
A、常规法
B、追溯法
C、循环法
D、浏览法{第15页} 40、截词检索中,常用的截词符号有(CD)。
A、+ B、-C、* D、?{第36页}
41、描述信息外表特征的信息检索语言包括(ABD)。
A、题名
B、著者
C、出版者
D、号码{第16-17页}
42、如果检索结果太多,查准率很低,需要调整检索范围,此时调整检索策略的方法有(AD)等。
A、用逻辑“与”或者逻辑“非”增加限制概念
B、用逻辑“或”或截词增加同族概念
C、使用截词检索
D、用二次检索增加限制条件{第41页}
43、使用截词检索的作用在于(ACD)。
A、扩大检索范围
B、排除检索结果
C、防止漏检
D、提高查全率{第36页}
44、使用逻辑“或”是为了(AC)。
A、提高查全率
B、提高查准率
C、扩大检索范围
D、缩小检索范围{第34页}
45、网络检索系统的特点是(ABC)。
A、资料丰富
B、检索方便
C、费用低廉
D、不受时空限制{第28页}
46、文献信息检索工具主要有以下几种类型(ABCD)。
A、目录
B、题录
C、索引
D、文摘{第30页}
47、下列哪种方法可以提高检索的查全率(ABCD)。
A、降低检索词的专指度
B、取消“and”/“not”等过严的限制符
C、增加检索年限,减少语种、文献类型的限制,扩大检索词出现的可检字段范围
D、改精确检索为模糊检索{第41页}
48、下列哪种方法可以提高检索的查准率(ABCD)。
A、加强检索词的专指度
B、用“and”/“not”等限制或排除某些概念
C、从年代、语种和文献类型上进行限制
D、将检索词限定在一定的字段中{第41页}
49、信息检索系统的类型包括(AB)。
A、手工检索系统
B、计算机检索系统
C、文字检索系统
D、符号检索系统{第27-28页} 50、信息检索效果评价的指标有(ABCD)。
A、查全率
B、漏检率
C、查准率
D、误检率{第42-43页}
51、影响检索效果的因素主要来自两个方面(CD)。
A、查全率
B、查准率
C、检索系统本身
D、检索人员的检索水平{第43页}
52、在计算机信息检索系统中,常用的检索技术有(ABCD)。
A、布尔逻辑检索
B、截词检索
C、位置检索
D、限制检索{第32-38页}
53、在下面的分类号中,(CD)是中国图书馆图书分类号。
A、22.27 B、TB324 C、G252.7 D、R329.2{第20页}
54、在限制检索中,检索词与检索字段的关系用限制符表示,以下属于常见限制符的有(ABCD)。
A、包含
B、大于
C、等于
D、介于{第33页}
三、判断
55、《中图法》的标识符号是汉语拼音字母与阿拉伯数字相结合的混合制号码。(正确){第20页}
56、不论信息检索的方法是否相同,信息检索的原理都是一样的。(正确){第11页}
57、查全率和漏检率是一对互逆的检索指标。(正确){第42页}
58、截词检索技术可以有效防止漏检。(正确){第36页}
59、使用循环法检索能获得较高的查全率和查准率。(正确){第15页} 60、数据事实检索工具属于二次信息的范畴。(错){第13页} 61、数据信息检索是一种非确定性检索,不能直接提供用户所需要的确切的数据。(错){第13页} 62、文献信息检索是一种相关性检索而非确定性检索。(正确){第13页} 63、信息检索语言是一种人工语言。(正确){第17页}
第三章
一、单选
64、Adobe Reader可以阅读(D)格式文件。
A、VIP B、TXT C、HTML D、PDF{上机试一下!} 65、ISBN是(B)的缩写。
A、国际标准刊号
B、国际标准书号
C、连续出版物代码
D、国内统一刊号{第45页} 66、超星数字图书馆可以为我们提供(A)
A、图书的原文
B、专利文献的原文
C、科技报告的原文
D、学位论文的原文{上机试一下!} 67、浏览超星数字图书馆,应首先安装(D)。
A、Apabi Reader B、Adobe Reader C、CAJ View D、SSReader{上机试一下!} 68、下列不属于图书特点的是(D)
A、内容全面可靠
B、出版周期长
C、内容更新慢
D、信息较新颖{第45页}
二、多选
69、图书全文信息的获取可以通过(ABCD)等渠道
A、从网上购买图书
B、从图书馆借书
C、通过电子图书数据库下载图书全文
D、通过搜索引擎查找免费的电子书全文{上机试一下!} 70、下列数据库可以查找电子书的是(ABCD)
A、书生之家数字图书馆
B、超星数字图书馆
C、CNKI期刊全文数据库
D、SPINGERLINK{上机试一下!} 71、下列网站可以在线买印刷型图书的有(ABD)
A、www.xiexiebang.com/cm/)、国家科学数字图书馆的图书情报学科信息门户(http://www.xiexiebang.com/)等属于专业型网络导航。{第213页}正确 192、URL是Uniform / Universal Resource Locator,中文名称为统一资源定位符,也被称为网页地址,俗称网址,是Internet上标准的资源地址。{第203页}正确
193、百度检索结果标题左边的【DOC】标志表示该结果不是网页,而是一个WORD文档。{第200页}正确
194、并不是所有的网络信息资源都需要下载,通过网页直接浏览是我们从Internet上获取信息的主要方式。{第214页}正确
195、并不是所有的网上资源都有明确的下载链接,对于一些没有明确下载链接的资源,下载的时候需要一些特殊的方法和技巧。{第214页}正确
196、多数搜索引擎对支持对以DO C、XLS、PPT、RTF、PDF为后缀名的文件进行检索。{第200页}正确
197、多数搜索引擎是通过在检索词之间使用空格或加号来实现布尔逻辑“并且”功能的。{第198页}正确
198、多数搜索引擎支持特定文件类型检索,百度支持所有的文件类型。{第200页}错 199、共享程度高、获取成本较低是网络信息资源的特点之一。{第178页}正确 200、宏观有序、微观无序是网络信息资源的特点之一。{第177页}错
201、考虑到搜索引擎的商业模式,检索相关度并不是检索结果排序的唯一指标。{第186页}正确 202、快照是搜索引擎对搜集到的网页中文本信息的本地备份。{第197页}正确
203、使用搜索引擎检索有关《天龙八部》这部武侠小说方面的内容,但是不希望有关《天龙八部》电视剧方面的信息出现。可以用如下检索表达式:天龙八部 –电视剧{第199页}正确 204、搜索引擎把索引信息存储在索引器中。{第185页}错
205、搜索引擎的检索策略是指利用搜索引擎进行信息检索的全面规划,主要涉及分析检索需求、选择搜索引擎及其具体功能、确定检索式、修正检索式等问题。{第206页}正确
206、搜索引擎检索结果页面每个检索结果中出现的日期实际上是网页的创建时间。{第197页}错 207、搜索引擎检索器的主要功能是抓取信息。{第186页}错
208、所谓“主+辅+限定”结构检索式是指由主题词、辅助词、语法限定组成的检索式。{第206页}正确
209、网络导航是根据具体用户的需要,对Internet上信息资源进行搜集、分类,形成相对科学、系统、动态更新的网络资源组织体系,并通过一个门户以超链接的形式为用户使用网络信息资源提供指引。{第209页}正确
210、相对于搜索引擎首页的简单检索而言,高级检索界面提供更为丰富的检索功能,相对高级检索语法而言,高级检索界面提供可视化的功能选项,不用记复杂的检索语法规则,因此对用户尤其是入门用户来说,通过搜索引擎的高级检索界面检索是提高检索效率的合适选择。{第204页}正确
211、由于缺乏统一的管理控制,来源不同的网络信息资源质量参差不齐,价值差别较大{第178页}正确
212、在Internet中,很多有价值的信息资源并非以普通的网页的形式存在,而是以文件形式存在,文件的格式也多种多样。{第200页}正确
213、在百度搜索时,使用filetype语法,增加检索条件,缩小了结果范围,提高了查准率。{第200页}正确
214、在百度搜索时,使用intitle增加检索条件,扩大了结果范围,提高了查全率。{第201页}错
215、在百度搜索时,使用site语法增加检索条件,缩小了结果范围,提高了查准率。{第202页}正确
216、在百度搜索时,使用减号增加检索条件,缩小了结果范围,提高了查准率。{第199页}正确
217、在百度搜索时,使用空格增加检索条件,缩小了结果范围,提高了查准率。{第198页}正确
218、在百度搜索时,使用竖线增加检索条件,缩小了结果范围,提高了查准率。{第199页}错
219、在百度搜索时,使用双引号对检索条件进行限定,缩小了结果范围,提高了查全率。{第199页}错
220、专门查询机票信息的检索系统是垂直搜索引擎。{第187页}正确
221、作为在搜索引擎检索框输入的文字和符号,检索式并没有一个固定的格式,但考虑到检索的效率,在分析检索需求的的基础上,有意识的使用“主+辅+限定”结构检索式能取得较好的检索效果。{第206页}正确
第四篇:现代信息检索学习报告
76993082.doc
(图与内容无关)
Modern Information Retrieval 现代信息检索学习报告
姓名:
班级:
学号: 教师:
76993082.doc
一,我的感想
在报这课程时,对这门课程并不了解,只是简单的认为信息检索就是翻翻书找找文献等是单纯的查找。但是经过这一学期的课程,我发现每一条信息,每一篇文章都是系统的归类,划分范围类型,而检索的途径也很多种,如有作者途径检索、分类途径检索等,检索式更是分类齐全繁多。
有很多收获,感觉很充实,发现我们的生活中时时刻刻都在检索信息.在老师的指引下,我们对检索工具一步一步地熟悉和应用,对于检索的方法,我觉得不管是在哪个网站检索,最重要的还是关键词的选择。关键词选的“关键”,不仅可以提高检索速度,而且大大提高了检索结果的质量,可以很容易找到自己需要的资料,总之要缩小范围。
二,学习收获
信息检索课是无意间报名的,如不是一个偶然的事件,要不是我找错教室,也许我就会错过了一个真正的学习的机会。根据CNNIC最新统计调查显示,在互联网应用中,信息检索已经排在了第二位,成为仅次于电子邮件的互联网应用。搜索网站可以帮助我们快速便捷地在互联网中进行信息的检索、查询。信息检索对我们来说并不陌生,在这个信息泛滥的年代,很难想象如果一夜之间如果没有了Internet将对我们的生活产生怎样的影响。
以前我在网上找资料基本上处于一种盲目的状态。在百度里输入
76993082.doc
关键词,不少检索出来的东西,基本上用处不大,或者并没有什么依据,只是网友自己的解答。本学期上了信息检索课,我学习到了检索的一些知识,并且也由此及彼地把这些知识应用到信息的检索中。在学习阶段,通过上信息检索课我对信息检索的认识又上升到了一个新的高度。
我觉得信息检索可以应用在我们每个课程中,自己可以给自己觉得有意义的课题,进行一个追踪或者资料的查询,可以把自己学到的知识巩固,并且可以深化自己随着方面的理解。例如在我们的一堂《企业财务管理》课程,老师布臵了一个作业,一个企业并购案例分析,香港巨商李嘉诚之子,李泽楷,盈科数码动力主席与新加坡总理李光耀之子,李显扬,新加坡电信行政争夺香港电讯的收购权。在分析这道题时,就涉及到信息的检索,首先要看看这三家公司的经营情况,还要检索当时参与收购的财团,还有收购的获胜方,收购价格,最终收购后的经营状况等等。最后通过自己查到的这些资料分析为什么盈科数码动力会获胜,但是经营确是赔本的。
通过学习以后发现,信息检索的策略也是非常重要的,我原来误以为一个好的检索策略只能提高查准率,大不了我多查几篇资料,现在发现它还能提高你的查全率,而且对于你从较高层次上把握课题的研究方向、发展脉络是极有帮助的。
附:常用搜索网站信息和基本检索技巧
一,八大搜索网站简单介绍
1、“Google”是功能强大,易用性最强的搜索网站,搜索速度快而且提供了最丰富的高级搜索功能。
Google(http://www.xiexiebang.com.yahoo.com)支持网页、网站搜索,搜索速度快而且准确性比较高。
4、“网易”网站搜索非常出色,但缺少提示,网易搜索的操作界面不太方便,在使用的过程中也缺少提示。
网易搜索(http://search.163.com)支持网页、网站搜索,网页搜索使用的是百度的搜索技术,除了分页方式以外,其他的返回结果都与百度一样,但推荐的站点比较少。
5、“搜狐”曾是IE默认的中文搜索网站,网站搜索值得推荐,但重复现象较多搜狐的搜索结果中没有标出关键字,查阅起来非常不便。
搜狐(http://search.soho.com)支持网页、网站搜索,在国内享有很高的声誉,曾经一度是微软IE浏览器使用的默认中文搜索网站,在IE浏览器地址栏直接输入关键字即可进行搜索。
6、“慧聪”是出色的 行业搜索网站,但缺少高级搜索功能,死链率也不低,而且搜索结果中重复的网站较多。
长期以来,国内的搜索技术提供厂商很少,百度作为先驱者,占据了大部分份额。到了2002年,国内搜索市场中出现了一匹黑马,那就是慧聪搜索(http://www.xiexiebang.com)是国家“九五”重点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果。天网搜索的FTP服务器文件搜索功能非常强大,而且还为用户整理了一份庞大的热门搜索关键字目录,方便用户浏览和下载所需的文件。二,信息检索技巧
1、选择恰当的关键字
互联网上流传的所有搜索技巧都是在如何确定关键字上做文章,选择一个好的关键字是搜索成功的关键。关键字代表着我们要搜索资料的特征,如果您找不
76993082.doc
到所需的信息,大部分情况是因为在关键字的选择方向上发生了偏移。找出关键字可不是一件简单的事情:首先您需要知道或者估计出目标网页内包含的文字,在脑子里形成一个比较清晰概念,再从中提炼出此类信息最具代表性的关键字。尽量不要选择常用词汇进行搜索,但可以同时使用多个关键字并加入与、或、非等多种逻辑关系进行搜索,这样才能避免返回无关的搜索结果。
a.避免输入及逻辑关系错误 首先我们要避免输入的关键字中有错别字,以及其他错误的操作。不同的搜索网站往往都有各自的特点,在某些搜索网站上,您可以使用“Where can I find software?”这样的自然语言进行搜索;但在某些搜索网站上,您甚至不能成功地使用单个汉字作为关键字进行搜索。另外,在使用多关键字通过与、或、非逻辑关系进行搜索时,不同的搜索网站所采用的逻辑关系表示符号也可能有所不同。所以我们有必要针对不同的搜索网站选择不同的关键字,并在首次使用一个搜索网站时,花一点时间阅读搜索网站的帮助文档,这是非常有必要的。
b.使用多关个键字来提高 检准率 对于大部分的搜索任务来说,一般都能够通过搜索网站找到需要的网页,但是如果不细心选择关键字,搜索网站可能会返回很多并不是您需要的结果。此时,如果您将另外一个跟搜索目标相关的关键字加在一起搜索,返回的结果就会少很多,也更加准确。因此,很多时候我们需要使用多个关键字查询的方法来提高搜索准确率。但需要注意的是,搜索网站对关键字的个数可能会有限制。另一方面,也要注意搜索内容之间的逻辑关系是否合理。
2.句子检索法可有效提高文本检准率
在使用搜索网站时,不少人经常被“关键字”这个名称所限,而忘了关键字可以是一个字、一个词,甚至一句话。例如在搜索小说、文章等文本内容时,最简单的方法,是用文本的标题搜索,但最高效的方法,则是用文中的一句话来搜索,可以让您的搜索效率提高不少。3.文件检索法 利于快速查找文件目标
如果您的搜索目标是一个文件,如一个公司Logo的图像文件,或者一个设备驱动程序的压缩包,您除了可以用公司的名称或者设备的名称进行搜索外,还可以从文件的名称入手。例如,当您在搜索设备驱动程序时,如果选择设备的品牌、型号为关键字时,搜索网站会返回许多无关的信息,这时,如果在这些关键字的后面再加上ZIP或RAR等常见压缩文件扩展名,您会有意外的收获。4。“抛砖引玉”法利于快速查找相关信息 如果您有一个非常喜欢的专业网站,并希望从互联网上找到更多同类的网站,这时怎么选择关键字最有效呢?或许搜索这个网站的内容类型会找到一些不错的站点,例如使用“军事网站”、“医学站点”做关键字,但很多时候这种搜索方法也可能一无所得。实际上最有效的方法是抛砖引玉,用您最喜欢的网站的站点地址作为关键字。因为链接到那个站点的往往是同类站点,用这种方法您肯定能够找到一些相关的网站。
5.中西结合检索法可以很好地完成某些搜索任务
在使用搜索网站时,灵活地结合中文和英文可以很好地完成某些搜索任务。您除了可以将要翻译成中文的英文词汇用作关键字,并指定搜索网站只返回中文网页的结果,尝试将搜索网站当成翻译机器来使用;还可以将中文词汇的一部分翻译成英文,例如您正想将“土豆烧牛肉”翻译成英文,只要您知道土豆的英文,您就可以输入关键字 “土豆烧牛肉 potato”,从互联网上找到含有土豆烧牛肉
76993082.doc 的英文网页。
三,信息检索的应用
本学期选修了现代信息检索课程,觉得很有用,虽然在一开始对于这门课程,到底能够学下什么,到底可以应用多少产生过质疑。觉得现代信息检索,名字叫得听高级,到底学什么不了解,但在这门课程学完后我有了理解。“快速便捷地找到自己所需要的信息”是这门课程的要求,那怎么才能应用与我所学的旅游管理专业上呢?
随着互联网技术的广泛应用,旅游业的网上营销是近期行业内探讨的热门话题,而其中一个重要的推广手段——搜索引擎,在企业中发挥的作用也渐渐突显出来。对搜索引擎以及旅游行业专业人士—— “去哪儿”旅游搜索引擎的了解,综观搜索引擎对推动在线旅游业发展方面所创造的价值,可以让旅游业界人士对运用搜索引擎来最大化收益有个更清晰的理解。
通过对“去哪儿”旅游搜索引擎的了解,可以看整个在线旅游行业的现状,细致分析了消费者利用网络查找及预订相关旅游服务的情况,不但有利于完善和丰富旅游搜索引擎自身的发展,对旅游运营商——航空公司、酒店及旅游代理商了解搜索引擎的及消费者购买流程更是大有裨益。
“去哪儿”的调查发现,使用网上预订的旅客都是旅游常客,进行网上预订的消费者是热衷旅游的人士,26%称在过去一年中他们至少度假4次;虽然中国的网络用户主要是在中国境内旅行,越来越多的中国人计划出国旅行,将近40%的人希望下一次旅行时能够走出国 6
76993082.doc
门。
对于网上旅行者特征的调查,“去哪儿”的报告显示,这部分消费者是属于吸引力很强的人群,73%使用信用卡,22%拥有并驾驶小汽车,88%拥有大学学历。
而对他们的预订方式的调查发现,更多的人愿意使用互联网预订旅行。“去哪儿”的报告显示,一半以上的互联网用户曾经在某个地方在网上购买机票,略低于一半的人曾在网上预订酒店。
从市场应用角度来讲,航空旅游行业对搜索引擎的依赖性是比较强的。我们可以从用户的反馈看到,凡是在网上有旅行预订经历的用户,有97%的人都会通过搜索引擎来寻找旅游产品。这也给航空公司、旅行代理,还有酒店一个很强烈的信号——利用搜索引擎来传达他们的相关信息,是企业推广的有效手段之一。”
关于信息检索的应用有部分摘抄自2007的一个腾讯新闻网的《关于旅游业与搜索引擎的发展关系》,其中还有介绍Google的旅游搜索引擎,但由于Google2010年3月推出中国内地,转至香港,就不做介绍分析。
以上为我对现代信息检索的感想,学习收获,和现代信息检索在游业方面应用的看法,可能不是太全面,或者太狭隘,望何老师见谅和指导。
2011年12月5日星期一
第五篇:信息检索资料题目整理版
选择题:(10*2'=20')
1、用__A__检索2004年中国经济领域的统计数据、政策、会议、新理论。A 《中国经济年鉴》 B 《中国统计年鉴》
C 《中国大百科全书》经济卷 D 《经济管理大辞典》
2、用__C__检索金融统计数据、中国宏观经济月度分析报告、食品行业报告《2003年奶业形势分析》
A 《中国人民大学报刊全文数据库》 B 维普《中文科技期刊数据库》 C 国研网
D CNKI或者万方数据库的会议论文数据库
3、检索2004年经济方面的信息资料应该用2005年出版的年鉴.4、已知参考文献:徐经长等,国际会计学,北京:中国人民大学出版社,1999。要找原文,使用_ D_检索《国际会计学》的收藏情况。A、维普《中文科技期刊数据库》 B、中国人民大学报刊全文数据库 C、国务院发展研究中心信息网 D、图书馆的馆藏查询
5、用__C_检索世界范围的专利摘要比较方便 A、美国专利商标局数据库 B、日本专利局数据库
C、欧洲专利局esp@cenet数据库
D、世界知识产权组织//ipdl.wipo.int/PCT电子公报
6、用_A_检索α—呋喃甲醇羧酸酯的合成,含有碳元素和氢元素的化合物的英文综合学术性文献。
A、外文EBSCO数据库
B、外文农业类CAB文献数据库 C、外文农业类AGRICOIA数据库 D、外文食品科技文摘数据库FSTA
7、综合性检索工具
维普《中文科技期刊数据库》、CNKI的《中国期刊全文数据库》、万方《中国数字化期刊群》
8、专利信息检索工具
使用最广收费专利数据库:thomson scientific公司derwent系列专利数据库 免费专利数据库:欧洲专利局、美国专利商标局、IBM专利数据库
9、综合性检索工具 欧洲专利局、《DELPHION知识产权信息网数据库》、thomson scientific公司derwent系列专利数据库
10、单一检索工具包括专利公报、专利索引、各国专利局的专利数据库 中国国家知识产权局、美国专利商标局网站专利数据库
11、商标检索工具:中国知识产权网、中国商标网(提供商标近似查询、商标综合查询、商标状态查询)、美国专利商标局(提供商标电子查询系统)、国际商标协会
判断题:(10*2'=20')
逻辑“与”:用and、“*”或者空格表示。逻辑“或”:用or、“+”或逗号表示。
逻辑“非”:用not或减号表示。A not B表示包含A同时不包含B。
名词解释:(4*5“=20)信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及他们之间相互关系、相互作用等运动状态的表达。文献:记录有知识的一切载体。
情报是“在特定时间、特定状态下对特定的人提供的有用知识”,基本属性是知识性、传递性和效用性。
主题“是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和问题”,即文献的“中心内容”。
主题途径是采用反映文献主题概念的检索词作为检索入口的一种检索途径,也是最常用、最重要的检索途径。
关键词是半规范化的词汇。主题词比较规范,一般有专用的词表,主要用于一些外文数据库和中文图书数据库,很少用于中文期刊和学位论文数据库。
规范词汇是从待检数据库的叙词表或主题词表中选取的规范化的、能表达文献中心内容的词或词组。
词表是数据库和检索者必须共同遵循使用的检索语言。自由词汇是论文主题中新技术、新学科中新产生尚未被主题词表收录的名词术语或在叙词表中找不到的词。
信息检索系统是为满足一定信息需求而建立的一整套对信息进行收集、加工、存储和检索的完整系统。包括两个子系统:存储子系统和检索子系统。联机检索:利用与检索系统或信息中心主机的连接,在中央处理机控制下查询系统内的数据库,并能够与系统实时对话,随时调整检索策略。文档是存储在计算机上一组相关记录的集合,具有完整的内容和逻辑结构。大型的检索系统往往有多个文档。
网络信息是指利用网络检索软件或搜索引擎查询到的在互联网上发布的信息资源,这也是一种广义的联机检索的信息。
分类途径就是人们常说的分类号检索。这种检索是根据信息内容的学科分类来进行的。分类法按照种类,可以分为网络信息分类法、图书/资料分类法、专利分类法、标准分类法。真正具有系统性的分类途径主要有图书期刊分类法和专利文献分类法的途径。检索工具是人们用来存储、报道和查找各类信息的工具。
数据库是在计算机存储设备上按一定方式存储的相互关联的数据集合。
记录是检索系统或数据库中信息的基本存储单元,记录中的字段,是检索的基本元素。功能性类目是按发明的技术功能进行分类,即按发明的内在特点与性质进行分类,而不按其用途分类。
应用性类目:应用性分类法是把物或方法限定于特定使用领域的分类法。引擎是Internet上的一种网站,它的主要任务是在Internet上主动搜索Web服务器信息并将其自动索引,其索引的内容存储于可供查询的大型数据库中。一个搜索引擎由搜索器、索引器、检索器和用户接口4个部分组成。典型的搜索引擎:google,百度,搜狐,新浪。
简答题:(6*5'=30')
1、信息、文献和情报之间的关系。
信息、情报和文献之间的关系表现为信息包含情报,文献是记录有知识的载体。当文献中记录的知识传递给用户,并为用户所利用时,就转化为情报;情报虽大多数来自文献,但也有可能来自口头和实物。所以情报与文献存在交叉关系,它们可以相互转化。特定的知识和情报,对于既不认识又不能理解它们的人来说,只不过是一种信息。
2、按出版的形式和内容不同,可以把信息分为几类。
按出版形式和内容的不同,可将信息分为图书、期刊、报纸和特种信息。图书是指50页以上的以出版方式单本刊印的出版物,包括专著,汇编本,多卷本,丛书等。期刊是一种以印刷形式和其他形式逐次刊行的,通常有数字和年月顺序编号,并打算无限期地连续出版下去的出版物。报纸是以刊物新闻和评论为主的出版周期较短的定期连续性出版物。专利信息是专利制度的产物,广义上是指所有与专利有关的资料,包括专利申请书、专利说明书、专利分类表、专利公报、专利文摘、专利证书等。狭义上的专利信息仅指专利说明书。
3、有一位学生拟定的中文研究课题为“法国文艺复兴时期文学作品浅析”。要求查询国内中文检索工具。如何具体分析课题? 答:1.学科属性、专业范围属于社会科学,具体属于外国文学,还涉及外语等多学科。2.是文献类检索结合事实数据类检索。事实数据类检索包括查询”文艺复兴“这个概念;文艺复兴时期有多长;在该期间法国诞生了那些重要的有影响的作品;可以从百科全书、文学辞典等参考工具书中查到。文献类检索就是查询是否有前人撰写的法国文艺复兴时期文学作品浅析的期刊论文、学位论文、专著或者网页。3.考虑课题的特殊要求,补充检索标识:文学家、F.拉伯雷、小说、《巨人传》。
4、CNKI专业检索示例:要求检索钱伟长在清华大学或上海大学时发表的文章。答案:作者=钱伟长and(单位=清华大学or单位=上海大学)。
5、CNKI专业检索示例:检索钱伟长1980年以前在清华大学期间发表的题名或摘要中都包含“物理”的文章。
答案:作者=钱伟长and单位=清华大学and(题名=物理or摘要=物理)and年<1980。
6、检索哈尔滨工业大学的罗守靖发表有关“半固态成形的应用”方面的中文期刊文章。答案:关键词=半固态成形应用and作者=罗守靖。
7、课题“甲壳质纤维及保健针织品”需要检索中文信息,如何拟定检索式保证查全率。答案:中文的参考检索式:(甲壳质or甲壳素or甲壳胺or壳聚糖or壳多糖or几丁质or几丁糖or几丁酶or氨基葡糖or葡糖胺or葡萄糖胺)and棉。
外文国际联机检索检索式:(chitin or chitosan or rn=1398-61-4 or rn=9001-06-3 or rn=9012-76-4)(s)(fiber or fiber)and cotton and(spinn or blend)
8、试分析分类途径的优缺点:
分类途径的优点:1.具有族性检索的功能,查全率较高。2.按照人们认识事物的习惯,一学科分类为基础,容易被人们接受和应用。缺点:1.不适用于特性检索,查准率相对的较主题词低。2.不能适应学科发展中的变化,难以反映新学科和新名词术语。3.人们认识的不统一,往往造成分类不一致及排检的错误,不易反映交叉学科。
9、检索“保土、之水、移民”课题,如何确定具体的检索要点? 答:1.近代以来我国森林覆盖率、区域覆盖变化情况及其原因。2.近三百年来我国东西部人口变动情况。3.我国历代移民概况。4.新中国成立以来中央领导人关于我国移民问题的讲话。5.黄河、长江水是何时由清变浑的。
10、搜索引擎的优点和缺点:
优点:搜索引擎现在已经成为网络信息检索最重要的指路标,几乎达到了无所不搜的地步,正确使用搜索引擎,可以检索到数据、图书、期刊、学术论文、专利等各类信息的题录或者部分原文,还能检索文字、图像、声音、动画等不同格式的文件。
缺点:
1、质量参差不齐,信息的分类加工欠规范,各搜索引擎在搜索指令的输入格式与输入内容上存在差异并难以兼容,缺乏同性易用的检索方法与技巧。
2、没有同统一的网络信息分类标准。
3、建立资源索引时针对性不强,搜索速度慢,死链接过多,重复信息及无效信息过多。
4、对资源不具有选择和价值判断的能力,排序结果不理想,难以搜索动态网页,全差率下降。
11、信息检索和分析步骤:无论是采用印刷型检索工具还是计算机数据库进行检索,一般都要经过以下检索步骤:1.检索准备。2.选择合适的检索工具。3.选择检索途径。4.拟定检索式。5.实施检索。6.筛选文献。7.索取原文。8.定性定量分析。9.得出结论,形成情报。
12、有哪些检索途径和方法 检索途径:一般来讲,信息类型的著录格式本身就是检索途径,可以分为以下4种:主题途径、分类途径、著者途径和其他途径。检索时应遵循“主题途径为主,多种检索途径综合应用”的总原则。检索方法:1.常规法:从时间上考虑有順查法、倒查法、时间抽样法。2.引文法。3.交替法。
13、什么是“信息检索与分析利用”课程
信息检索与分析利用也称为“信息检索与利用”,包括文献的“检索”和“利用”两部分内容。“检索”部分介绍信息检索的原理、方法和步骤。对文献的”利用”而言,需要对检索的文献去粗取精,去伪存真,进行统计分析,获取情报,适应市场竞争。
14、有哪些数字图书馆信息检索系统。
答:
1、美国国会图书馆
2、中国国家图书馆
3、上海数字图书馆
4、其他数字图书馆
综合题:(1*10”=10')
综合分析治疗乙型肝炎的中药的信息,特别是中国专利,筛选其中最常用的中药基础方,并作评价。
主要步骤:1.分析课题,课题提示时间范围是查找最近10年的文献,如果没有检索到所需文献,最好能上溯多年不限。先查中文,后查外文。2.选择检索工具。3.确定检索途径,本课题可选用主题(关键词)途径为主,结合分类途径。4.确定检索词。5.拟定检索式(部分),实施检索。6.筛选检索结果,按照参考文献格式列出筛选结果,如果文献很多,可以使用文件管理软件对文献排序:图书、期刊论文、学位论文、专利信息、网络论文。7.索取原文。8.定量分析,专利格式统一,具有较高分析价值:a.统计授权专利的分布:空间上的分布、时间上的分布、授权专利申请人的行业分布、计算授权专利的技术成长率。b.统计全部专利所用的中药。9.定性分析:包括寻找用药规律、筛选药方和评价专利。10.定性与定量分析相结合的专利评估。