以数据为检索对象,检索结果是特定的数值性数据,是用户可以直接利用的信息。 ⑵事实检索(Fact retrieval) 以事实为检索对象,检索的结果是已有的基本事实或对非数值性数据进行逻辑推理等方式处理后所得到的具体答案。例如,想了解科威特油井灭火的有关情况。 ⑶文献检索(Document retrieval)
其中数据检索和事实检索是检索包含在文献中的情报,而文献检索实际是书目检索,检索包含有所需情报的文献的线索,根据文献的线索,再进一步查找文献,然后筛选出所需要的情报。文献检索是最基本的检索形式。
1.3.2文献检索的作用
文献检索是科学决策的依据
继承和借鉴前人的成果,实现创新 避免重复劳动,减少浪费
节约查找文献的时间,提高工作效率 不断拓宽知识面,改善知识结构 1.3.3文献检索工具
检索工具是用来报道、存储和查找文献线索的工具。它是在一次文献的基础上,经过加工整理、编辑而成的二次文献。 检索工具的基本结构
一部完整的检索工具通常由:使用说明、著录正文、索引和附录几部分组成。正文由文摘、题录或目录组成。
索引分主题索引、作者索引、分类号索引、期索引、卷索引、累积索引等。 通常把目录、题录、文摘和索引通称为检索工具。 检索工具的出版形式 书本式检索工具 卡片式检索工具 缩微式检索工具 机读式检索工具 目 录 卡
I247.5 阳光下的童话/ 岑凯伦著.__广州: 519 花城出版社,1997.12.02
34896 32页;32开 .__ (岑凯伦作品集) 11.00 元
ISBN7-5360-2697-8
I.阳... Ⅱ.岑... Ⅲ. Ⅳ. I247.5 检索工具的著录方式(类型)
⑴目录(bibliography、catalogue) 目录是对图书、期刊或其他单独出版物特征的揭示和报道。它是历史上出现最早的一种检索工具类型。目录主要用于检索出版物的名称、著者及其出版、收藏单位。常用的目录有、馆藏目录、期刊年终目录等(一般期刊的年终最后一期上有全年的目录)等。 ⑵题录(title)
题录是对单篇文献外表特征的揭示和报道,著录项目一般有篇名、著者、文献来源、文种等。
- 5 -
由于著录项目比较简单,因此收录范围广,报道速度快,是用来查找最新文献的重要工具。我国的《全国报刊索引》也属这种类型。 检索工具类型-题录-例
例1. Schware, R.“Climate Change in Water Supply: How Sensitive is the Northwest?” Climatic Change and Water Supply. Washington, D. C. : National Academy of Sciences, 1986: 82-98
⑶文摘(Abstract)
文摘是系统报道、累计和检索文献的主要工具,是二次文献的核心。文摘以单篇文献为报道单位,不仅著录一次文献的外表特征(即文献的标头部分),还著录文献的内容摘要。按文摘报道的详简程度,文摘可分为指示性文摘和报道性文摘两种类型。报道性文摘有时可代替原文,这类文摘对于不懂原文文种及难以获得原文的科技人员尤为重要。 ⑷索引(index)
索引是揭示各种文献外部特征或内容特征的系统化记载工具。它的著录项目没有目录、题录、文摘那样完全,大多数索引不能直接查到原始文献资料,而必须通过该文献资料在检索工具中的序号,在检素工具的正文中找到文献资料的来源出处,进而找到原始文献资料。 1.4检索语言
检索语言就是信息组织、存储与情息检索时所用的语言。 信息检索语言主要有两大类:体系分类检索语言和主题检索语言。体系检索话言是以学科为基础按类分级编排的.是一种直接体现知识分类等级概念的标识系统,一般以符号为标识。 主题检索语言则是用能反映信息内容的主题概念的词语作为标识的标识系统。主题检索语言又分为两类。一类足规范主题检索语言.另一类是非规范主题枪索语言。 体系分类检索语言
信息资源分类法按照编制方式分体系分类法、组配分类法、混合式分类法 1)体系分类法
体系分类法是一种将所有的类日组织成一个等级系统
《大卫 . 科波菲尔 上》—— I561.4/68:1
I561.4/68:1-----索书号 I------文学类
I561------英国文学 .4 ------小说 I561.4 -----分类号
68:1---------- 排架号 (书次号) 1-----册数号
《国际十进分类法》体系结构
- 6 -
0 总类 1 哲学
2 宗教、科学
3 社会科学、经济、法律、行政
4 (语言学)(该类1963年已并入第8类,现为空类) 5 数学、自然科学
6 应用数学、医学、工业、农业 7 艺术
8 语言学、文学 9 地理、传记、历史
2)组配分类法
它是为适应现代信息资源标引和检索的需要发展起来的分类法类型。它运用概念可分析和综合的原理,将可能构成文献主题的概念分析成为单元或分面,设臵若干标准单元的类表,使用时,先分析标引对象的主题.根据主题分析的结果通过相应概念类目的组配表达主题内容。以这些类目标识的组合,表示该项主题在分类体系中的次序。例如。中华网设计了两个分面,一 个是地域面.分省级行政区、城市两级类日;另—个是主题面,一级类目为工商经济、电脑网络、社会文化、教育就业等。 组配的作用
控制词量。组配可以起到控制词表体积的作用。只要选择了基本的词汇,通过组配,就可以用少量的词表达和描述尽可能多的概念。组配实际上遵循了数字排列组合的原理和方法。 扩大检索途径。在组配中,每一个词及其组合都可以作为检索人口参加排序,所以可以扩大检索途径。如查找教育心理学方面的文献,可有三个人口,教育学、心理学及教育+心理学,即提供了三条检索途径。
可以自由扩大、缩小或改变检索范围。在标引时,可用许多个词来标识一篇文献,因而可以达到很高的专指度和标引深度。在检索时,可根据检索中出现的具体情况,随时增减叙词,以扩大、缩小或改变检索范围,直到满足检索要求为止。
3)混合式分类法
这是介于上述两种分类法之间,既应用概念划分和概括的原理,又应用概念分所和综合的原理而编制的分类法,根据侧重面不同.又有体系- 组配分类法和 组配-体系分类法之分。体系—一组配分类体系它是等级分类体系和分面组配分类体系相互结合、相互融合的一种分类体系。因此兼有两者的优点。现在一些著名的中文搜索引擎如新浪、搜狐、网易、中文雅虎等均采用这种分类体系。
2.主题法检索语言
主题法检索语言是为一种从内容角度标引相检索信息资源的方法。它不像分类法以学科体系为中心。用来表达信息资源的词语称为主题词。是将自然语言中的词语经过人工规范后的语言,即经过词汇控制的词语。
所谓主题检索语言就是根据信息的主题特征来组织排列传息的方法。它以语词作为检索标
- 7 -
识,按字顺排列,直观性强。也是一种普通使用的信息组织方法。 传统的主题法包括标题词法、单元词法、叙词法。
1)标题词法
标题词法是主题法系统中最早出现的一种。标题法的土要特征是事先编表,加美国《subject headings for engineering,简称SHE》就是《the engineering index》系统的配套词表。标题词法比较直观、容易学握;查找速度快。但查全一门学科或某一属性事物的文献却较为困难。 2)元词法
元词法,又叫单元词法。把概念上不能再分的词作为一个单元,用来标识文献主题的方法叫元词法。比如“数字化图书馆”不是单元词,而“数字化”和“图书馆”才是单元词。
单元词法:它的优点是强调词汇的单元最小、使用灵活,但出于采用字面组配,容易发生概念含混或不统一的情况。
3)叙词法
叙词法,又称为主题词法。将自然语言的语词概念,经过规范化和优选处理.通过组配来标识文献主题的方法称为叙词法。叙词具有概念性、描述性、组配性。叙词法综合了多种信息检索语言的原理和方法,采用灵活的概念组配,并在词与词之间建立参照系统,是主题法发展的最新方法。叙词法适用于计算机和手工检索系统,是同前应用较广的一种语言。我国目前使用的主题法类型基本上为叙词法。 作为主题词的词和词组应概念明确,一词一义,符合科学性、通用性的特点。如中国的《汉语主题词表》。
概念组配是叙词语言的基本原理。
概念组配与字面组配在形式上有时相同,有时不同;而从性质上来看两者区别是很大的。字面组配是词的分析与组合(拆词);概念组配是概念的分析与综合(拆义)。例如: 字面组配 概念组配
模拟+控制-->模拟控制 模拟+控制-->模拟控制
香蕉+苹果-->香蕉苹果 香蕉味食品+苹果-->香蕉苹果
在以上第一例中,无论是字面组配还是概念组配,其结果都是“模拟控制”,第二例中,根据字面组配原理,“香蕉”和“苹果”组配是“香蕉苹果”,而概念组配的结果应是指“一种香蕉和苹果杂交的品种”,而这样的品种目前是不存在的。所谓“香蕉苹果”只能是一种有香蕉味的苹果,因此,根据概念组配原理,这个概念应当用“香蕉味的食品”和“苹果”两个词组配,才符合概念逻辑。
叙词语言吸取了多种情报检索语言的原理和方法,包括: 1.它保留了单元词法组配的基本原理;
2.采用了组配分类法的概念组配,以及适当采用标题词语言的预先组配方法; 3.采用了标题词语言对语词进行严格规范化的方法,以保证词与概念的一一对应;
4.采用并进一步完善了标题词语言的参照系统,采用了体系分类法的基本原理编制叙词范畴索引和词族索引,采用叙词轮排索引,从多方面显示叙词的相关关系。
叙词作为标引和检索人员之间的共同语言,是通过叙词表来实现的。叙词表的结构比较复杂,一般由一个主表和若干辅表构成。
1.叙词字顺表。一般是叙词的主表,它是将叙词和叙词完全按字顺排列,并有标注事项和参照
- 8 -
系统。
2.叙词分类索引。也称分类表或范畴索引,是一种重要的辅助索引。这种索引便于从学科或专业的角度来选用叙词。
3.叙词等级索引。也称族系表或词族索引。利用概念等级关系将叙词汇集在一起成为一族,构成一个从泛指叙词到专指叙词的等级系统。
4.叙词轮排表索引。也称轮排表。它是利用字母成族的原理,将有相同单词的词组叙词集中在一起,排列在该个单词之下,从而可以从该单词出发,查出某一个或全部含有该单词的词组叙词。 5.叙词双语种对照索引,如英汉对照索引等。
6.专有叙词索引。如地区索引、人物索引、机构索引等。
4)非规范主题法
非规范主题法检索语言相对主题法检索语言而言,即使用自然语言作为检索语言。自然语言是指直接使用不经过规范的自然语言中的词语作为标识,进行信息资源的标说和检索。因非规范主题法一般不对词汇进行控制。处理速度快、成本低,故在计算机检索中得到了广泛的应用。随着电子文本和网络的出现,非规范主题法已逐步发展成为主要的检索方式。 非规范主题法可分为关键词法和纯自然语言法。
关键词语言是直接选用文献中的自然语言作基本词汇,并将那些能够揭示文献题名或主要意旨的关键性自然语词作为关键词进行标引的一种检索语言。所谓关键词是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表征文献主题内容具有实质意义的语词,亦即对揭示和描述文献主题内容来说是重要的、带关键性的(可作为检索“入口”的)那些词语。关键词语言是为适应目录索引编制的自动化的需要而产生的。它与标题词语言、叙词语言同属主题法系统。但是,标题词语言、叙词语言使用的都是经规范化的自然语言,而关键词语言基本上不作规范化处理。例如,“国际联机检索概论”中的“国际联机”、“联机”、“检索”都是能描述这篇文献的主题的,可以作为检索词。概括地说,关键词法就是将文献原来所用的,能描述其主题概念的那些具有关键性的词抽出,不加规范或只作极少量的规范化处理,按字顺排列,以提供检索途径的方法。
关键词法目前已得到广泛的应用,出现了多种关键词索引形式,大体可分为两类:一类是带上下文的关键词索引,包括题内关键词和题外关键词索引等;另一类是不带上下文的关键词索引,包括单纯关键词索引、词对式关键词索引和简单关键词索引。 题内关键词索引。也称上下文关键词索引,这种索引将文献标题中的关键词和非关键词都保留,并保持标题原文的词序,使每一个关键词都有一次机会轮流排到作为检索词的固定位臵(如中栏开头),将处于固定检索位臵的关键词按字顺排列起来,每条款目附文献地址。这样构成的关键词索引便成为一种检索工具。如美国出版的《化学题录》(Chemical Title)。
题外关键词索引。这种索引是将文献标题中的关键词和非关键词都保留,并保持标题原文的词序,同时轮流地将每个关键词“抽出”(实际上在标题原文位臵仍保留或用“*”号代替),臵于标题左方(或左上方)的检索词位臵,并将处于检索词位臵的关键词按字顺排列。
单纯关键词索引。这种索引是将表征主题内容的关键词抽出组成索引款目,然后将索引款目中的关键词轮流移到左端(或左上方)作为检索词,并按字顺排列,每条款目后附文献地址(文摘号)。
简单关键词索引。这种索引的索引款目只有一个关键词。后面附全部相关文摘号,非常简单。
- 9 -