细分或者指出排列方法,规定某一类的特殊分类规则和方法等。
类目索引---帮助使用者从类目名称的字顺或者音序来查找相应的分类号的辅助性工具。
? 直接索引:把分类表中的类目及其注释中的有关主题的概念,按照名字字顺排列。
难以反映相关事项和复杂的专指主题。
? 相关索引:在直接索引的基础上,还集中反映在分类中被分散了的相关事项。 ? 主题分类对照索引:在主题词表中的主题词后面列出对应的分类法的类号,以便从
主题词字顺查找相应分类号。是分类法和主题法沟通的桥梁,既是体系分类法的辅助工具,也是分类法和主题法相互转换的工具。在一定程度上能缓解“集中—分散”矛盾。(重点考)
体系分类法 主要特点:
? 按照学科、专业属性建立类目体系,形成按学科、专业集中信息的知识概念体系,
满足用户从学科、专业出发的检索课题,提高查全率
? 采用等级列举式的概念标识系统来揭示概念之间的关系,便于用户“鸟瞰全貌”、“触
类旁通”地查找某一专业的信息
? 采用分类号作为标识,不受语种的限制
? 分类标识是定组式的、固定的、不可分拆的、其中诸因素是不可变换位置的 缺点:
? 修订不便,无法及时增加反映新知识的类目,对很狭窄的主题很难找到相应的类目
和类号
? 采用先组定组式标识,难以进行组配检索,使得检索途径单一,检准率低 ? 采用分类号作为主题的标识,缺乏直观性
? 按学科和专业集中信息以及线性的分类体系,难以反映多维的知识空间结构 《中国图书馆图书分类法》简称《中图法》、《中国人民大学图书馆图书分类法》简称《人大法》、《中国科学院图书馆图书分类法》简称《科图法》。 《杜威十进分类法》(Dewey Decimal Classification)简称DC或DDC、《国际十进分类法》(Universal Decimal Classification),简称UDC,《美国国会图书馆分类法》(Library of Congress Classification)简称LC。 组配分类法:《冒号分类法》五个基本范畴:
2.4主题检索语言(主要理解记忆,叙词语言集其他三家之长)专指度高、直观性好、灵活性强。
由于按字顺(音序或者笔画等)排列,同一学科的信息被分散在各处,在族检索方面不及分类法
1.标题词语言
标题词的特点: ①直接性。 ②直观性。
③受控性(或称规范性)标题只是选择那些可能成为文献主题的事物及其较为通用、准确、专指、检索效果好的名称,并设法实现名称与概念的惟一对应。 ④语义关联性。 ⑤先组性。 ⑥示范性
标题词的类型(标题法的类型)
单级标题。即一个标题仅由一个名词术语构成。 带说明语的单级标题。例如,“液压传动,用于机床的”;“期刊,化学的”;“期刊,信息密度,统计法”。
多级标题。由两个或两个以上的标题词采用组配符号“—”连接起来的标题形式称为多级标题。例如“肿瘤—治疗”。“—”后的标题称为子标题。子标题、次子标题都必须是规范化的语词.这是区别于说明语的地方。
倒置标题。将复词标题中具有检索意义的后置部分依次作为入口词前置,并用逗号“,”与原入口词连接的标题形式称为倒置标题。“低速飞机”与“飞机,低速” 带限定词的标题。如“图书馆学(辞典)”、“橘(树)”“橘(水果)”。限定词一般都置于括号中,用于作形式复分,或区分两个字面相同但无法用其他方式区分的标题。 混合标题系统。 特点
1.用受控的自然语言语词作标识,直观地表达主题概念,直接标引信息。
2.以字顺序列组织标识,提供直接的主题检索途径,以便利于进行特性检索。
3.主要用参照系统间接显示标题所表达的主题极念之间的关系,形成语义网络。它能为选用4.标题进行标引和检索提供一定方便。
5.按事物集中文献,而不是按学科、专业集中。标题语言适合于从事物出发的检索。 6.提供先组式的主题标识,标识含义比较明确,选用标识比较容易。
缺点:
允许必要时自拟标题表达新的或没有列出的主题概念,适应能力较强。
多途径检索的可能性较小。按事物集中文献,而不是按学科、专业集中。适合于从事物出发的检索,不适合于从学科出发的族性检索。 2.单元词语言
单元词:也是一种受控的自然语言语词,是指那些最基本的、在概念上不能再分解的词汇单位。如:“大学”、“管理”、“教育”。
单元词语言是一种以单元词为主题标识,通过字面组配的方式表达资源主题的标引语言。 是一种后组式的主题语言。 是对标题法的革新。 采用的后组配的方式,在标引时不组配单元词,在检索时才对单元词下所列的文献号进行对比,号码相同的就表示有组配关系。 特点:
1通过最基本的词汇可以表达大量的专指概念和新概念,适合对专指主题进行标引。标引专指度高;适应性强。
2标引结果不存在词序问题,每个单元词都可以作为检索入口,从而提供更多的检索途径;检索时,可以通过单元词的增减,较自由地扩大、缩小或改变检索范围。 3词表体积小;修订容易。 缺点:
1字面拆分和字面组配容易造成语义失真。 2缺乏参照系统,难以满足族性检索的需求。 3直观性和系统性差。
4只适用于标识单元方式的检索系统。 3.关键词语言
所谓关键词,是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对描述信息主题内容具有实质意义的语词,亦即对揭示和描述文献主题内容来说是重要的、带关键性的(可以作为检索“入口”的)那些语词。
关键词有点像单元词。但单元词是在同义词和近义词中作优选的,而关键词则不作优选,甚至对同一个词的单复数和变格等词形变化也不加统一,而保持作者用词原状,同义词、近义词、一个词的不同形态并存。所有的关键词是平等的,全部按字顺排列。若干关键词的结合构成一条索引款目,说明一简文献的主题内容;但全部关键词在检索系统中部是彼此孤立,没有任何联系。 原理:
1直接抽取信息中或题名中的语词作标识来表达信息资源主题内容的一种主题检索语言,
2对作为标识的词不加规范或只作少量规范处理,不编制受控词表来进行词汇控制,不显示词间关系,只是编制禁用词表(非关键词)来控制抽词。
3每个关键词是平等的,都可作为检索标识,按照字顺轮流排至检索位置(入口词位置),提供多途径的主题字顺检索。
4是最早用于计算机信息检索的自然语言形式。
优点:
? 使用自然语言,表达主题比较直观、专指,可以保证较高的检准率,符合用户使用
习惯。
? 检索途径多。
? 标引简单,标引不需要查看词表,降低对标引人员的要求,节省标引时间;同时,
易于使用计算机编制,保证资源传递过程的及时性和生产过程的高效性和低成本; ? 及时性:能及时更新词汇。 缺点:
? 不揭示关键词之间的等级关系和相关关系,不进行同义词、相关词的处理,用户检
索很难靠自己的了解查全同一概念的不同词形及进行相关词的检索,增加用户负担,漏检的可能大,影响查全率。
? 题名中不少语词为通用概念,它们为检索入口建立的检索款目没有实际意义。 ? 难以进行族性检索。 关键词索引的类型(要求区分)
题内关键词索引,题外关键词索引,词对式关键词索引(P57) 4叙词语言原理(博采众家之长)
? 以从自然语言中精选出来的、经过严格处理的表示单元概念的规范化语词作为资源
主题标识,通过概念组配方式表达主题的后组式检索语言。 ? 叙词的特点:直观性、规范性、组配性。(集众家之长)
叙词语言的编制
主表:将叙词按字顺排列,并附标注事项和参照系统。
分类索引:也称为范畴索引,从学科或专业的角度来选用叙词。
词组索引:即等级索引,具有属分关系的一组叙词称为一族,构成从泛指到专指的叙词等级系统
轮排索引:将有相同单词的词组叙词集中在一起,排列在这个单词之下,方便从单词出发,查找某一个或全部含有该单词的词组叙词。 叙词表编制的注意事项: (1)主题词的选择与规范:
? 词形规范:如:储气筒(叙词)——贮气筒(非叙词); ? 词义规范:如:加限定词:结构主义(心理学);加含义注释,计算机分析
注:用计算机进行分析
? 词类规范:对叙词的选词范围进行规范 ? 先组度规范:适当的先组度提高标引的一致性,如“环境工程”、“亲属语言”、
“猎户星云”。
(3) 主题词的组配:交叉关系(“:”)、限定关系(“-”或“,”)、联结关系。 叙词语言的性能 优点:
① 结构完备,词汇控制严格,可根据检索系统的需要对词汇进行有效控制; ② 组配准确,标引能力强,能够准确、专指地标引和揭示各种主题内容; ③ 检索效率高,可通过灵活组配方式进行多途径检索,达到较好的检索效果。 ④ 对检索系统适应能力强,可同时适用于标识单元和文献单元检索方式,既能
较好适应计算机检索系统的要求,又能适应手工检索系统的需要。
缺点:
? 词汇控制要求严格,词表编制和管理的难度大,成本高; ? 资源标引需在概念分析的基础上进行,标引难度大,要求高。
1969年,第一部分类主题一体化检索语言的诞生。 分面叙词表
是以英国艾奇逊主编的世界上第一部一体化词表的名称命名,可以说是最典型的一体化词表
? 2.6.2 网络环境下的分类检索语言
? (1)分类法的电子化——提高标引和检索的效率。DDC、UDC、LCC都有电子化版
本。(考)
? (2)分类体系结构的多维化——利用超文本技术,更好地揭示类目之间的多维关
系。自由分类法(Folksonomy)在类目划分标准、横向关系揭示和类目设置方面表现出明显的多维性。打破传统目录按照唯一标准进行类目划分的原则,轻松揭示多属性主题、交叉学科、总论与专论、地区与主题、资源形式与主题等横向关系。 ? (3)在内容上,聚类标准的主题化、类目划分的随意性、类目排列的非逻辑性和
类名的通俗化等。(重点考)
辅助词表的应用——
? 后控词表:即词间关系表,是利用受控语言的基本原理和方法编制的自然语
言检索用词表。是自然语言和受控语言结合的产物。(考)
? 后控词表的特点:(考) ? (1)词汇只用于检索
? (2)词汇控制不如先控词表严格
? (3)收词丰富,包括同义词、近义词、俗称、缩写、流行俚语等 ? (4)动态性强,及时更新和增补新主题概念 ? (5)有较强的灵活性和自由度,标引简单
? (6)具有面向文献和用户的特点,文献保障和用户保障能力强