信息检索复习(名词解释)(3)

2019-08-31 18:30

子计算机”和“存取速度”的组配表示“电子计算机的存取速度”

? c.组合组配:又叫并列组配,是指除上述两类叙词组配之外,任何两个或两个以上的叙词之间的

组配。例如:“计算机”、“应用”和“图书馆”的组配表达“计算机在图书馆中的应用” ? 叙词语言的特点是:

? 规范性强,叙词语言事先进行规范化处理,列于叙词表中,标引和检索都从叙词表中选词,保证

了标引和检索的一致性。

? 利用叙词的组配,可使用有限的叙词表达各种复杂的主题,尤其是最新出现的主题。

? 叙词语言从单元概念出发提示文献内容,有助于准确、全面地揭示文献的主题,提高标引深度和

专指度。

? 检索入口多,能满足多元检索的需要,检索范围改变也相当灵活,大提高了检全率。 ? 同时适用于手工检索和计算机检索系统。

? 叙词语言是我国目前使用最广泛的受控主题语言。 2、根据组配方式划分

? (1)先组式语言:表达信息主题概念的标识已事先用固定关系组配好,并编制在词表中,标引

人员在标引信息或用户在检索信息时,必须根据词表选用组配好的主题进行操作。如:体系分类法和标题词法。

? (2)后组式语言:表达信息主题概念的标识在编制词表时不曾预先规定组配关系。当标引信息

时,只能根据词表中选用单独的主题词来描述信息的主题概念;检索时,用户可以根据需要将不同的检索词组配在一起,用来表达复杂的主题概念。如:元词、叙词。

3、根据规范化程度划分

? (1)规范化语言 ? (2)自然语言

? (3)两者结合的发展趋势 4、根据描述的文献特征分

? (1)描述文献内容特征的检索语言

? 内容特征是指表征文献实质意义的特征,如主题词、关键词、分类号、内容摘要等。 ? 主题语言、分类语言、分类主题一体化语言 ? (2)描述文献外部特征的检索语言

外部特征是指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名(题名、篇名)、人名、各种符号标识(专利号、标准号、报告号等)、机构名、文献出处等。 代码语言、引文语言

三、检索途径及其选择

1、内容特征检索途径:内容特征是指表征文献实质意义的特征,如主题词、关键词、分类号、内容摘要等。

? (1)分类途径 ? (2)主题途径 ? (3)分类主题途径

2、外部特征检索途径:外部特征是指文献上显而易见的,一般情况下不反映文献实质意义的那些特征,如书名(题名、篇名)、人名、各种符号标识(专利号、标准号、报告号等)、机构名、文献出处等

? (1)责任者途径 ? (2)题名途径 ? (3)序号途径 ? (4)引文途径

第二节 事实数据信息的检索工具

一、字典、词典(辞典):字典是为字词提供音韵、意思解释、例句、用法等等的工具书。在西方,是没有字典的概念,全是中国独有的。 字典收字为主,亦会收词。词典或辞典收词为主,也会收字。为了配合社会发展需求,词典收词数量激增并发展出不同对象、不同行业及不同用途的词典。 例:《新华字典》、《现代汉语词典》《牛津英语词典》、《建筑大辞典》

西文词典一般都是按本国文字的字母顺序排列,查询时按字顺查找;日文字典大多按五十音顺排列,查找时按音顺查找;中文字典排列方法较多,有部首法、笔画笔顺法、汉语拼音法、四角号码法等。

二、百科全书:常被誉为“没有围墙的大学”

概要记述人类一切知识门类或某一知识门类的工具书 。百科全书在规模和内容上均超过其他类型的工具书,它集各类。百科全书的主要作用是供人们查检必要的知识和事实资料,其完备性在于它几乎包容了各种工具书的成分,囊括了各方面的知识。 百科全书可按收录范围分为综合性百科全书(如:《中国百科全书》、专业性百科全书(如:《化工百科全书》;还可按编辑规模分为:大百科全书(20卷以上)、小百科全书(10卷以下)、百科词典(单卷)。

编排方式有三种:按字顺编排、按分类编排和分类与字顺相结合编排。目前,按字顺编排条目已成为百科全书编排方式的主流,也有采用分类与字顺相结合的形式编排的。

百科全书一般都有各种索引,其中最主要的是主题索引,就是把条目的条头、释文的隐含主题和参见主题按字顺排列以供检索。

世界ABC三大百科全书:美国百科全书、不列颠百科全书、科利尔百科全书 美国百科全书》名为Encyclopedia Americana,简称EA,

《不列颠百科全书(Encyclopedia Britannica)》(又称《大英百科全书》,简称EB) 科利尔百科全书(Collier' Encyclopedia)简称EC

三、手册:

顾名思义是放置于手边可以方便地参考的一种工具书。是汇集某一学科或某一主题等需要经常查考的资料,供读者随时翻检的工具书。手册就是各行各业、不同地域、不同职业的人在进行某种行为时所需要的一种了解相关信息的材料。手册主要为人们提供某一学科或某一方面的基本知识,方便日常生活或学习。手册中所收的知识偏重于介绍基本情况和提供基本材料,如各种公式、规章、条例、事实、数据、图表等等。通常按类进行编排,便于查找。 如:《图书情报工作手册》、《数学手册》

四、年鉴:是一种按年编纂出版的参考工具书。以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书。汇辑一年内的重要时事、文献和统计资料,按年度连续出版。年鉴内容丰富、新颖,叙述简明,编排得当,具有可靠性、统计性、新颖性、连续性、知识性、检索性等特点。其主要作用是向人们提供一年内全面、真实、系统的事实资料,便于了解事物现状和研究发展趋势。它所收集的材料主要来源于当年的政府公报、国家重要报刊的报道和统计部门的数据。因此,年鉴有较大的总结、统计意义和比较系统的连续参考作用。通过年鉴,可查找近年来国际国内时事,各部门各行业的进展及各学科各专业的研究动态;可查找政府颁布的重要法规文献和逐年可比的统计数据资料。

年鉴大体可分为综合性年鉴和专业性年鉴两大类,前者如百科年鉴、统计年鉴等;后者如经济年鉴、历史年鉴、文艺年鉴、出版年鉴等。

五、名录:名录是提供有关专名(人名、地名和机构名录等)简要工具书,内容涉及比较广泛。人们可

以从名录中查找关于人物生平、机构组织和某一行政区划沿革等信息。名录是一种事实便览性的工具书,虽只提供有关机构、人物等的简要资料,但能起指引情报源的作用,对沟通信息、促进交流、加强协作提供了很大的方便。名录按收集信息的内容的不同,可分为人名录、地名录和机构名录。

1、人名录又称“名人录”,是介绍某一方面人物生卒年、学历经历、荣誉、著作等资料的检索工具。如:《世界名人录》。

人名录分为综合性、国别或地区性的、专业或职业性的三类 ,每类又有回溯性的(也称人名辞典)和当代人物两种。 2、地名录

是收录经审定的规范化的地方名称,并注明所属的国家、行政区划以及在地图集上的具体位置的工具书。主要提供各行政区域(国家、城市、省、县、乡、街道)、山川、河流、岛屿等的规范化名称、地理位置、人口、历史沿革、地产和矿产等资料。如:《中国行政区划大辞典》、《世界地名录》。 3、机构名录又叫机构指南

是汇集机构名、人名、地名等专名及与之相关的资料的一种工具书。一般提供公司或组织机构的名称、地址、电话号码、历史与现状、机构的主要业务与人事、主要负责人等情况,许多公司和厂商名录还要介绍其规模、资产、经营范围、产品、设备等情况。具有简明、新颖、确实等特点。如:《中国企事业名录大全》

第三节 文献检索工具简介

文献检索工具是用于报道、存贮和查找文献线索的工具,它通过对文献特征的描述,并按一定的科学方法排列、提供多种检索途径,使我们能从文献的汪洋大海里找到特定的文献。 检索工具必须具备四个条件:

第一,必须详细描述文献的外部特征和内容特征。 第二,每条描述记录都必须具有各种检索标识。(所谓检索标识是指描述文献外部特征和内容特征的专门用于信息检索的词、词组或代码,如主题词、分类号、著者姓名、文献序号等。) 第三,全部描述记录要科学地组织成一个有机的整体 第四,能够提供多种检索途径。 检索工具的类型:

? 按检索手段分,有手工检索工具、机械检索工具和计算机检索工具; ? 按出版形式分,有书本式、期刊式、卡片式、缩微式和机读式; ? 按收录范围分,有综合性、专业性、专题性和单一性; ? 按文种分,有中文、西文、日文、俄文等; ? 按著录方式分,有目录型、题录型和文摘型。

? 其中按著录方式划分体现了检索工具对文献内容揭示的深浅程度,体现了检索工具的性质,这是

检索工具最主要的划分方法。

一、 目录型检索工具

? 目录是以出版物(如一本图书、一种期刊等)为报道对象,揭示出版物外部特征的检索工具。所

以目录对文献的描述比较浅显,一般只描述文献的外部特征,有时也通过简单的内容提要介绍文献的内容,但它不涉及文献中的具体章节或具体文献。目录主要用于报道、登记出版物的出版发行情况,揭示其收藏情况,供人们选购、查阅和获取文献时使用。目录的著录项目通常包括出版物名称、责任者(著者、编者或译者)、出版项(出版者、出版地、出版时间、版次等)和稽核项(页数、开本、价格等)。

? 目录型检索工具主要有图书馆馆藏目录、联合目录、出版社目录、国家书目等。 二、 题录型检索工具

? 题录是以单篇文献作为报道单位,揭示文献外部特征的检索工具。由于它是以单篇文献为单位来

报道和存储文献的,所以对文献的揭示程度比目录要具体、深入。但题录与文摘相比,对文献内容的揭示又相对较浅,不过,它也因此具有加工容易、可以缩短报道的时差、文体简短、可以增加检索刊物的容量的优点。题录的著录项目一般包括题录号、文献题目、作者及其工作单位、出处、原文文种、主题词、文中所附图表数及参考文献数等。

? 《Index to Scientific & Technical Proceedings》是由美国科学信息研究所(ISI)出版的,是专

为检索会议录、会议出版物及其会议论文题录而编制的综合性检索刊物,内容涉及基础学科、工程技术及应用科学等领域,每年收录约4000次重要科学会议的论文。目前,全球正式出版的重要会议文献约有75%~90%被ISTP收录,是快速、全面了解会议文献的重要检索工具,并作为评价科研工作者学术水平的重要指标,它与SCI《科学引文索引》(Science Citation Index)、EI《工程索引》(The Engineering Index )、并称为“三大索引”。其正文按会议号的顺序排列,著录每个会议的名称、会议事项、会议录及其出版情况和该会论文的题录。

三、文摘型检索工具

? 文摘(abstract)是指对一份文献或一个文献单元的内容所做的简略、准确的描述,通常不包含

对原文的补充、解释和评论。文摘的报道对象与题录相同,但它对文献内容的揭示程度较题录更深入具体,它不仅描述文献的外部特征,还进一步描述文献的主题内容。对内容的介绍主要由其中的“文摘”部分完成。文摘是最常用的文献检索工具。

文摘的主要著录项目为:

? (1)文摘号、入藏号(abstract number ,reference number , accession number )。它是在文献处

理完以后,为每条文摘编的号码,起排序并帮助读者识别特写文摘的作用。它可以是简单的顺序号,也可以是含有某种情报内容的代码符号。

? (2)文献名称(document title)。即文献的题目(篇名),它是读者识别特定文献的重要标志之

一。文献名称一般是逐字照录,有时也可以删去某些引导性的词,或对含义不清及不完整的名称加以改写、补充。外文文献一般要同时著录译名和原名。有些英文检索工具对非拉丁文字的文献一般不著录原名,而著录原名的音译名。

? (3)著者(author)及其工作单位(affiliation)。是读者迅速鉴别文献的依据之一,著录著者姓

名可以用全称,也可以用简称。许多国家的人名表述是名在前,姓在后,一般姓用全称,名可以缩写。但大多数检索工具都采用姓在前、名在后的形式。英文检索工具对非拉丁文姓名用音译法著录。

(4)合同号(contract number)或拨款号( grant number)。如果该文献是在某项合同或拨款的支持下进行的,一般都要标明该项合同的编号或拨款文件的编号。科技报告都有这一项目。

(5)原文出处。指刊载原文的地方。原文如果是某种期刊中的论文,出处包括该刊的刊名、出版地、卷期号、出版日期和起讫页码;如果是图书或其中的一部分,出处就是书名、编著者、出版地、出版者、出版时间和起讫页码。科技报告的出处就是入藏号、订购号或原来的报告号。专利说明书的出处就是专利申请书或专利说明书的编号。原文出处的著录是读者顺利找到原文的重要线索。

(6)原文文别和译文来源。原文文别一般用某种语言的简称标明,放在文献出处之后,有的放在文献的译名之后。若所摘录的文献是一篇译文,应给出译文的来源(被译文献的出处),如“译自X刊X卷X期X页”。此项的用处是免得使读者去找他所不能阅读的东西。

(7)主题词或索引词。指用来描述该文献的主题内容的若干个词或词组。该项的用途很多,既可以帮助读者了解原文主题,也可以用以查找其他相关文献,或供计算机识别和进行逻辑组配检索。

(8)文摘正文。对文献内容所做的简略描述。可以有报道性文摘和指示性文摘之分。前者需概述原文的内容要点,特别是创新点,向读者提供原文中的定量信息(如距离、最大值、最小值、公式等)和定性信息(如发现、结果、新方法、新设备、结论等)。它是原文内容的浓缩,基本上能反映原文的技术内容、信息量大,字数也较多。后者则是为了把原文的主题范围、目的和方法概略地指示给读者的一种文摘,一般不包含具体的数据、方法、设备、结论等内容。它指示读者将在原文中发现什么,帮助读者判断原文是否与自己的需要相关以及是否需要阅读原文,字数也相对较少。 第四节 索引介绍

一个完整的检索工具包括四个部分: 1、说明部分 2、正文部分 3、辅助索引部分 4、附录部分

索引通常不提供文献内容本身,只指明文献的物理位置,是一种检索文献的系统指南,使读者能准确地找出文献或文献集合体中的特定信息。

? 最常用的索引有著者索引、主题索引、分类索引、题名索引。

主题索引是以主题词为标目,按照主题词的字顺排列组织的索引。按照组织主题词的原则和方法上的不同,

一、 著者索引

二 主题索引可分为四种:

1、标题索引 2、关键词索引 3、单元词索引 4、叙词索引

关键词索引

关键词索引是按关键词的字顺排列的索引。关键词是直接从原文的标题、摘要或全文中抽选出来的,具有实质意义的、未经规范化处理的自然语言词汇。被抽选出来的关键词都可以作为标引词在索引中进行轮排,作为检索词进行检索。由于关键词表达事物和概念比较直接,不受词表控制,能及时反映新事物、新概念,目前被广泛地应用于手工检索和计算机检索系统中。但关键词索引不显示词间关系,不能进行缩检和扩检,影响检索效率。不过,在计算机检索系统中,利用关键词之间的逻辑组配,在一定程度上解决了这个问题。计算机检索系统还采用编制禁用词表和关键词表等方法,以提高关键词抽取的准确性,并对词间关系进行控制,提高了检索效率。

三、 分类索引

分类索引以科学分类为基础,运用概念划分的方法将知识按一系列的标准和逻辑规则进行层层划分,形成一个严格有序的直线式的知识门类等级体系,用概括事物本质属性的概念作为类目名称,并给出相应的标记符号作为类号,按照分类号编排。分类的方法能较好地体现学科的系统性,反映事物之间的平行、隶属和派生关系,适合人们认识事物的习惯,有利于从学科或专业的角度进行族性检索。目前我国广泛


信息检索复习(名词解释)(3).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:安监总局40号令 - 重大危险源分级方法

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: