信息检索与利用复习资料
(一)、名词解释
1、INTERNET(因特网):Internet: 因特网。泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。采用TCP/IP协议。
2、SCI: SCI是科学引文索引的英文缩写首字母。SCI是一个引文数据库,收录全世界出版的数、理、化、农、林、医、生命科学、天文、地理、环境、材料、工程技术等自然科学各学科的核心期刊。
3、报刊:报刊是指报纸和期刊的总称,是属于连续出版物,它具有统一的题名,定期或不定期以连续分册形式出版,有卷期或年月标识,并且计划无限期连续出版。报纸以刊载新闻和评论为主,期则围绕某一学科和某些学科或某一研究对象,由多篇文献资料编辑而成。
4、标准文献。广义的标准文献包括标准的原始文件及检索工具书等。狭义的标准文献仅指带有标准号的标准、规范、规程等技术标准。
5、超文本:超文本是在普通文本的基础上增加了链接功能的一种文本。用户只要用鼠标点击页面上有特殊颜色或有下划线的文字时,就会出现新的解释或访问更多的信息。
6、分类途径:是指按文献内容的学科分类体系查找文献信息的途径。一般说来,一种检索工具的编制都须按学科建立自己的分类体系,其收录的文献按分类目录中的排序进行编排,这样的编排的结果可将同一学科的文献集中,便于按学科查找文献。
7、技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。
8、检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。
9、竞争情报:竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究。
10、科学文献:文献:凡是人类的知识用文字、图形、代码、符号、声频、视频等方式和技术手段记载在一定载体上的每一件记录,统称为文献。而把记录科学知识的每一份物质载体称为科学文献,
11、目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。
12、全文搜索引擎。全文搜索引擎是使用自动索引软件来搜集和标引网页资源、建立数据库,以Web形式提供查找网络资源的一种网络信息检索工具。
13、索引:索引是将一种或一批相关书刊内容中的篇目、字句、人名、地名、事件、分子式等摘出,按一定的方法编排,并指明其在原书中的位置,为读者提供查找线索的工具书。索引是记录期刊、报纸、文集、论丛、会议录等文献所包含的论文题目、撰述者,将其摘录出来,并注明其出处,按照一定的原则编制而成,形成查寻文献篇名的检索工具。
14、图书馆目录:图书馆目录是提示、识别和检索馆藏文献信息的工具,也是宣传图书、辅导阅读的工具,是读者迅速、准确、有效地检索所需文献资料的向导,被喻为“打开人类知识宝库的钥匙”。
15、网络信息资源。以电子形式存储于成千上万台计算机组成的网络中的信息资源,它包括各类数据、电子文件、学术论文、图书、软件、商业活动等各种信息。 信息检索。是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。
16、网络信息资源:以电子形式存储于成千上万台计算机组成的网络中的信息资源,它包括各类数据、电子文件、学术论文、图书、软件、商业活动等各种信息。
17、网站:网站是某些单位或个人为了一定目的、为用户提供某些方面的服务,在Internet设置的站点,这些服务主要有Web服务、Ftp服务和Email服务等。
18、文献检索:以文献或其索引、文摘为检索对象,目的是核实已知文献的不确切项目,如著者名,年代、出处等,或查检某课题原始文献的线索及它们的具体收藏情况。
19、文献信息资源:文献是记录有知识的一切载体。文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。
20、信息检索。是从大量相关信息中迅速、准确、相对无漏地获取信息(文献)的过程。也可以说是利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。
21、信息检索语言。信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。
22、信息检索策略。是为实现检索目标而制定的计划和方法案,是对整个检索过程的谋划和指导,即是对检索过程的安排。
23、一次文献:即原始文献,它是作者本人以生产或科研为依据而创作的原始文献,是科研成果的一种主要表达方式,代表新知识,组成了可供交流的系统性信息,是信息检索的主要对象和最终目标。如图书、期刊论文、会议文献、学位论文等。
24、主题标引。是依据一定的主题词表和主题标引规则,赋予信息资源语词表示的过程。 智能搜索引擎。是结合了人工智能技术的新一代搜索引擎,它使因特网信息检索从基于关键词提高到基于知识或概念,并对知识有一定的分析处理能力,能够实现分词技术、同义词技术、概念搜索、短语识别及机器翻译技术等。
25、主题法。主题法是一种用能表达、描述文献主题的名词术语来进行文献标引、检索的方法。
26、追溯法:也称文献追踪法。此法不是利用确定的检索工具,而是利用已知文献的某种指引,如文献所附的参考文献、有关注释等,追踪查找文献。
(二)、判断题
1、EI(工程索引)是世界上最大型的工程类信息数据库。(∨) 2、EI数据库不能查到文艺类文献。(V) 3、Internet的信息大部分是收费的。(×) 4、Internet的信息是一种动态和有序的。(×)
5、ISTP(科学会议录索引)是美国情报研究所出版的科学技术会议录索引和社会科学及人文科学会议录索引。(∨)
6、PQDD(博硕士论文)是目前世界上最大、使用最广泛的学位论文数据库。(∨) 7、SCI(科学引文索引)是基于因特网环境的国外大型引文数据库之一。(∨) 8、SCI是引文数据库。(V)。
9、查全率与查准率是评价检索效果的两项重要指标。(是)
10、查找入口词是参考工具书查找特定信息的依据或出发点,又称检索点。(是 ) 11、单元词“航空”不能再分解为“航”和“空”。 (是 )
12、当计算机的访问范围受到限制时,可以通过代理服务器访问外部网络。(∨)
13、二八定律在期刊文献检索中的体现是,20%的期刊登载了80%的重要文献,体现这种特性的是核心期刊。(∨)
14、工具书排检方法里主题法中主题的含义与文艺作品中的主题是两个相同的概念。(否)
15、关系模型将数据之间的联系以关系的形式确定下来,并以二维表格的形式加以组织。 (是 ) 16、广义的信息检索包括信息检索和信息存储两个过程。(是 ) 17、截词方式可以有前截断、中截断和后截断。(是 )
18、截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。 (∨) 19、利用某个图书馆的书刊目录查询系统(OPAC),可以了解该图书馆收藏有哪些印刷型图书和期刊。(∨) 20、联合目录可以帮助读者确定其所需要的文献收藏在那个情报机构。(∨) 21、逻辑算符也称布尔算符,用来表示两个检索单元之间的逻辑关系。(是 ) 22、名录和黄页类检索工具中可以查到企业的基本信息。(V) 23、任何一种截词检索,都隐含着布尔逻辑检索的逻辑或运算。(∨)
24、如果想要了解即将举办的会议信息,最好的一种途径是查会议论文数据库。(×) 25、实验记录属于一次文献。(是)
26、索引和目录的含义是一样的。(否 )
2
27、通过“万方数据资源系统”可以查找标准文献的全文。(∨)
28、 通过BA、ISTP、Kluwer online、Springer Link 数据库都能检索到外文期刊论文全文。(×) 29、文献的内容特征用于找出相关文献,外部特征用于获得特定文献。(∨) 30、文献检索语言是标引与检索共同使用的约定语言。(∨) 31、下列选项中,属于常用的检索方法的是追溯法。(是) 32、下载比较大的文件和程序,通常使用的是FTP协议。(∨) 33、信息的收集原则有前瞻性原则。(∨)
34、以单篇文献为著录对象,并附有摘要的检索工具为文摘。(∨) 35、以文摘命名的报纸,如文摘报是文摘型检索工具书。(×)。 36、影响查全率和查准率的因素是R和P.(∨)
37、在《中国图书馆分类法》里,从C到N都是属于社会科学的基本大类。(×) 38、在《中国图书馆分类法》里,哲学属于社会科学大部类。(×) 39、在大多数情况下,信息检索的目的是找到相关文献,而不是答案。(∨) 40、在检索工具中,主要收录化学与化工类文献的是CA。(V) 41、在重庆维普数据库检索系统中可以查到企业名录。(×) 42、中国图书馆图书分类法简称为主题词法。(×) 43、主题词的体现形式是叙词表。(∨) 44、主题语言是一种过程语言。(是 )
45、综述因附有大量参考文献,所以是二次文献。(×) (三) 单选题 1、《全国报刊索引数据库》可以支持全文检索的两个字段是( ):B . 题名和文摘 2、EI是世界上最大的( )提供者之一。A . 工程信息
3、Internet上有非常丰富的信息资源,可通过屏幕拷贝或抓图软件将重要的信息保存为( )格式。B . 图像格式
4、Internet是信息的海洋,任何机构、任何人、任何时间都可以在网上共享或发布信息。信息的交互性是指( ):C . 讨论、交流和传递信息。
5、按域名的结构:计算机名. 组织机构名. 网络名. 最高层域名,域名www.sina.com.cn的级别自右向左是逐渐( )的。A . 降低
6、分类途径是按照文献所属的学科分类,利用()进行检索的途径。 C分类号及分类名 7、机检效果与检索人员的素质有着密切的关系。人员的素质主要包括()。 D.以上三项 8、课题“计算机在情报检索中的应用”的中图法分类号及类名名()。 D.G252.7 情报检索
9、利用SCI不但能了解何人/机构、何时、何处发表了哪些文章,而且还可以了解这些文章后来( )。D .被哪些人在哪些文章中引用过
10、利用文献后所附参考文献进行检索的方法叫()。 A.追溯法 11、逻辑算符包括()算符。 D.以上三项
12、全文数据库是存储原始文件( )的一种数据库。A . 全文或主要部分 13、实验记录属于( )。A .一次文献
14、书目数据库又称为()文献信息数据库,是存储描述如目录、题录、文摘等书目线索的数据库。B.二次 15、下列检索提问式中,属于无限截断的是( )。B .comput? 16、下列选项中,不属于常用的检索方法的是( )。C .编码法 17、以下常用域名含义不正确的是( ):C . edu表示政府机构 18、在Internet上,信息资源的检索方法主要有三种,下列哪一种不属于Internet上信息检索的方法( )?D . 基于工具书的
三、填空题
1、_知识__、_载体___、_记录____是构成文献的三个基本要素。
2、CNKI数据库是中国知识基础设施工程的简称,其数据库主要资源有:(中国期刊全文库)3、全文库、
3
(中国优秀博硕士学位论文全文数据库)全文数据库、(中国重要报纸全文库)4、全数字图书馆是采用现代高新技术所支撑的数字信息资源系统,它将(文字、图像、语音、影像、软件)和科学数据等信息,以数字化方式存贮,以网络化方式连接,为用提供实时服务,实现资源共享。
5、IPC 是 国际专利分类 号,其作用是提供从分类途径查找专利。
6、按检索方法划分,检索工具可分为_手工检索_工具、_计算机和网络检索工具。
7、按文献载体形式划分,文献可分为 印刷型、缩微型、声像型、和 电子型。根据文献Biomedical applications of nanoscale devices, Anon. Source: Materials Technology, v 19, n 2, June, 2004, p 118-119.的著录特点,可以判断,该文献是科技期刊_。
8、查找中文科技期刊全文文献的数据库有清华中国学术期刊(或维普中文科技期刊 或万方数字化期刊); 9、常用的布尔逻辑运算符有:(逻辑与 )、 OR或、( 逻辑非 )。
10、德温特公司的专利文献检索工具为检索者提供了三种检索途径即:_国际专利分类号检索___、_专利权人检索__和_专利号检索__。
11、公告号为8510961的专利是_发明专利 (类型的)专利,专利号为200420011414.6 的专利是 实用新型 (类型的)专利;申请号为99322746.5的专利是_外观设计 (类型)专利。在标准号GB/T 19557.8-2004中,其中GB/T是推荐标准代号,2004是颁布年代。
12、广义的信息检索实际上包括文献的_存储__和文献的_检索_两个相互依存的过程。
检索语言的种类,按词汇的类型可分为:关键词语言、(单元词语言)、(标题词语言)和(叙词 )。 13、目前,常见的主题词语言有_标题词_语言、_单元词_语言、_关键词_语言和_叙词_语言。 手工检索检索中国专利主要使用_《中国专利公报》__和_《中国专利索引_》_两种。
数据库按信息载体分,可分为(光盘 )数据库、( 网络 )数据库和磁盘数据库(现用得较少)。 14、数据库的分类在不同学科中有不同的分类方法,在信息检索中常按( 信息组织方式、信息载体 )对其进行分类。
15、文献外部特征的检索途径之一,责任者途径,即通常所说的著者姓名途径。责任者是指对文献内容负责或作出主要贡献的个人或团体,包括(著者名、评者、编者)。
我国从1985年4月1日开始实施《中华人民共和国专利法》,标志着我国专利制度的正式建立。 16、要查明同济大学图书馆是否有“computer communications”这本期刊,可以通过 电子期刊导航系统 和_书目信息检索系统 等系统查找。
17、在计算机信息检索系统中,常用的检索技术主要有布尔逻辑检索 、截词检索、位置检索 、限制检索 和 加权检索_等。
18、在许多数据库中,都有“二次检索”功能,“二次检索”指:在前一次检索基础上再检索。 中文检索工具的内容,一般由使用说明、目次、_正文__、_索引___和_文摘来源_五个部分组成。 四、多项选择题
1、按收录文献的范围划分,检索工具可分为(ABC)。A、综合性检索工具 B、专业性检索 C、单一性检索 2、按照检索系统的功能划分,计算机信息检索系统可分为()。A .目录检索系统B .文献检索系统C .事实检索系统
3、常用的逻辑算符有三种,分别为()。A .AND C .OR D .NOT 4、从概念之间的关系的检索策略的常识判断,()是符合逻辑的。A.cycle OR bicycle D.bank AND management 5、对于输出篇数过多的情况,其原因可能是()。 B.遗漏重要的同义词或陷含含概念 D.应该使用逻辑“与”的使用了逻辑“或”
6、工具法也称常用法,它有()三种方法。A .顺查B .倒查C .抽查 7、机读型文献分为()。A .磁盘式文献C .硬盘式文献D .磁带式文献
8、基本索引字段包括:()。A .篇名字段B .文摘字段C .叙词字段D .自由词字段
9、计算机检索大致可分为以下三种方式:()。B .菜单检索C .超文本检索D .命令检索
10、计算机信息检索系统一般包含以下几个部分:()。A .计算机检索终端B .通信设施C .数据库D .检索软件E .其他应用软件
11、目前图书情报界大多从记录类型的角度将数据库分成以下几种类型:()。A .书目型数据库B .词典型数据库C .数值型数据库D .全文型数据库E .多媒体数据库
4
12、评价检索系统检索效果的最常用指标是()。 B.查准率 C.查全率
13、数据库依据数据模型的不同可以划分为以下三种类型()A .层次数据库C .网状数据库D .关系数据库 14、缩小检索范围的检索策略调整方法有()。B.增加同义词或同族相关词,使用逻辑“或”将它们连接起来 C.使用字段限制 D.限制检索结果的文献类型、语种、出版国家 F.使用逻辑“非”算符,排除无关概念
15、文献检索工具的质量主要由下列几项指标来确定,即()。A .文献的收录量B .文献的摘录及标引质量C .文献报导的时效D .使用的难易程度E .索引是否完善
16、我国技术标准主要分为( AC )。A、国家标准 C、企业标准
17、一般图书馆的主要工作项目有()。A .流通阅览B .参考信息咨询D .用户培训
18、主要检索词的含义是指课题名称中的()。A.有实质含义的名词 B.有实质含义的形容词 19、专利申请必须遵循的原则有( ACD )。A、书面原则C、优先权原则D、单一性原则
20、专利文献的特点有(ABCD )A、技术新颖 B、格式统一规范 C、实用性强 D、报道迅速,价值巨大 21、最主要的文献检索途径主要有:()。A .分类途径B .主题途径C .著者途径D .号码途径 (四)、问答题
1、按信息所依附的载体为依据,信息有哪些类型?答:有文献信息、口头信息、电子信息、生物信息等。 2、常用的手工检索方法有哪些?答 1直接查检法,2间接查检法,包括顺查法、倒查法和抽查法,3追溯法,4综合法。
3、常用的信息检索方法有哪些?答:常规检索法,回溯检索法,循环检索法。
4、国内数字图书馆中规模较大、影响较广的有哪几家?举例说明如何检索?答:主要有超星数字图书馆、书生之家数字图书馆、中国数字图书馆、方正数字图书馆等。如登录超星数字图书馆,可以用分类、书名、作者和高级检索等方式检索图书。
5、简述信息检索语言的功能。答:信息检索语言是沟通信息存储和信息检索的桥梁;对信息组织人员来说,它是表达信息主题内容,形成标识并赖以组织信息的依据;对信息检索人员来说,它是表达检索需求的依据。
6、如果要查找有关“转基因生物和细胞及其制备方法”方面的中外文文献,如何查找?请写出具体的检索步骤。答(1)、分析课题,明确检索要求; (2)、选择检索系统:要考虑文献类型 (3)、选择检索途径 (4)、选择检索方法 (5)、查找文献线索 (6)、获取原始文献
7、试比较分类语言与主题词语言。答:分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以及混合分类语言。 主题语言是直接以表达主题内容的语词作为检索标识,以字顺为主要检索途径的标引和检索信息的语言。主题语言是一种描述性语言,它使用自然语言中的词语或规范化的词语来描述文献所论述或研究的事物概念,具有较强的直观性、专指性和灵活性。
8、搜索引擎的特点是什么?答:使用方便,信息量大,检索方法多样。
9、万方数据库资源系统包含哪几大信息系统?答:包含有4大信息系统。A、科技信息系统;B、数字化期刊系统C、企业服务系统D、医药信息系统。
10、万方数据库资源系统的数据库有11类,举出其中的G类即科技文献数据库中的5个数据库。答:中国化工文摘数据库、中国机械工程文献数据库、中国农业科学文献数据库、中国生物医学文献数据库、中国计算机文献数据库等。
11、文献信息的主要形式有哪些?答:文献信息根据其载体的物质形态,基本上可分为手抄型、印刷型、缩微型、机读型和视听型。手抄型是指古旧文献和未经付印的手稿及技术档案之类的资料,其中可供开发利用者颇多。印刷型是属传统的印刷形式,以纸张为载体,通过包括铅印、石印、油印、胶印等方式得来的产品。缩微型即缩微复制品,它以感光材料为载体,利用摄影技术将手抄型或印刷型文献缩摄而形成的文献形式,包括缩微胶卷、缩微平片、缩微胶套和幻灯片等。机读型是采用一种利用机器――电子计算机才能进行阅读的新型载体。视听型又称声像资料,它通常以感光材料或磁性材料为载体,以光学感光或电磁转换为记录手段而产生出来的一种文献。
12、信息的概念是什么?信息有哪些特征? 答:广义的信息概念:即信息是事物运动的状态和方式,也叫本体论信息。狭义的信息概念:即信息是认识主体对事物运动状态和方式的反映,也叫认识论信息。信息具有以下几个特征:普遍性、无限性、寄载性、传递性、可知性与可贮性、动态性、共享性
5