第一章
一.信息组织的含义
信息组织,即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。 序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以及这种关系在时间和空间中的表现。
二.信息组织在信息资源建设中的地位与作用
1.信息资源建设的基本内容与环节包括信息的采集,组织,开发和利用。信息组织在其中属于关键因素,处于关节点的地位。
现在社会信息的基本特征是庞杂性和分散性,人们对信息需求的特点是专业的高度选择性,内容的精良性,时间的紧迫性。 2.信息组织是一个信息增值过程。
3.信息组织是信息生命周期管理思想的最积极,最活跃的因素,做好信息组织工作,会促进信息流通,发挥信息效用,使信息流形成良性循环,使信息在时间上更快速的传播。 4.信息组织是信息检索利用的基础。 三.信息组织的发展阶段
1.清册职能时间:它主要通过对信息的记录和登载,如同“信息账房先生”,告诉人们有什么信息而已。
2.查检职能时期:信息组织活动不仅告诉人们有什么信息,而且告诉人们怎样找到信息。 3.组织职能时期:利用计算机技术,通信技术和网络技术已经不满足告诉人们有什么信息和怎样找到信息。它不仅可以告诉人们我们这里有什么信息,而且还可以告诉人们其他地方有什么信息。人们还可以知道什么信息适合于自己,可以多途径多角度地查检信息。 四.信息组织的理论基础
系统论,耗散结构理论和协同论使信息组织有了理论基础。 五.信息组织的方法基础
语言学,逻辑学,知识分类是信息组织的方法基础。
要把庞杂分散的信息组织成有序优化的整体,就必须建立符号系统,但都和自然语言一样,有着共同特征:有语词,有词汇,有语法,这就是信息组织的语言学基础。 知识分类是一门研究知识体系结构的学问。 六.信息组织的基本方法
信息的外在特征和内容特征,它们是信息组织的基本对象和管理依据。
信息的外在特征:就是指信息的物质载体所直接反映的特征,构成信息载体的外在的,形式的特征。
信息的内容特征:就是信息所包含和承载的具体内容。 信息的序化和优化是信息组织的结果和目标。信息的序化就是按照一定的方法将无序的信息组织成有序信息的过程。信息的优化则是在序化的基础上,按照结构功能优化的目的对信息进行再序化的过程。
七.信息序化的基本方法P5(简答题 1.语法信息序化法:即根据信息的外在特征,使用一套形式化的符号系统来组织信息的方法。包括号码法,物名法,专门代码法,引证关系法,时序法,地序法。
2.语义信息序化法:即根据信息的内容特征,使用一套含有语义的符号系统来组织信息。语义信息序化法有分类法和主题法两种基本类型。
3.语用信息序化法:就是指根据信息的实用价值来组织信息的方法,主要有权值序化法和逻
1
辑序化法。
(1)权值序化法:就是按信息的重要性来组织信息。 (2)逻辑序化法:就是按某种逻辑关系来组织信息。 八.信息优化的基本方法
信息的优化主要包括信息的优选,浓缩,重新表述及三者的综合运用。 1.信息的优选正是实现社会信息有相对贫集向信息富集转化的优化过程。 2.信息的浓缩是使社会信息由博而约,由粗而精的一个信息加工过程。 信息浓缩的主要形式有文摘,题录,目录,词条。
3.信息的重新表述是使某些信息由不便利用向便于利用转化的加工过程。 信息重新表述有改写、编译、翻译等方式。
信息的综合优化是前述三种基本优化方法的结合运用,其主要形式是信息综述和信息述评。 九.信息组织的一般过程和原则
信息组织的一般过程包括信息替代和信息序化两部分了。信息的替代过程(亦可成为信息揭示过程)实际上是对原始信息的外表特征(包括题名,著者,出处等)和内容特征(包括分类号,主题词,摘要等)进行表述的过程,这项工作通常称为著录。 信息序化是对替代信息给出信息标识的过程,这项工作通常称为标引。 信息组织与信息检索在实际操作中是两个互逆的过程。 通过信息检索可以进行信息组织质量的评价,通常我们在进行评价时惯用的两个指标是,查准率和查全率。
1.查准率简写为P,是指所检出的相关信息占所有检出信息的比率 查准率=检出相关信息量/检出信息的总量; 2.查全率简写为R,是系统在进行某一检索时,检出的相关信息量与系统信息库中相关信息总量的比率
查全率=检出相关信息量/信息库内相关信息总量。 十.信息组织的基本原则
1.客观性原则:信息组织中进行描述和揭示的基本依据就是信息本身,因此,我们描述和揭示信息的外在特征和内容特征必须客观而准确,要根据信息本身所反映的各种特征加以科学地反映和序化,形成相应的信息组织成果。 2.系统性原则:为实现系统性必须把握4个原则 (1)宏观信息组织和微观信息组织的关系。 (2)信息组织部门与其他部门的关系。 (3)信息组织工作的各个环节之间的关系。 (4)不同信息处理方法之间的关系。 3.目的性原则 4.现代化原则
第二章
分类法是以知识属性来描述和表达信息内容的一种信息处理方法。分类语言是以数字,字母与数字结合作为基本字符,采用字符直接连接并以圆点作为隔离的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。 传统的分类体系以枚举方式为特征(中图法的分类思想) 一.分类法
1.分类法的类型:现今主要有两种类型分类法,一种是体系型分类法(《中图法》);一种是体系—组配分类法(UDC)。 体系型分类法是传统的分类法,它的特点是:直线型的序列,层累制的结构,列举式的类目,
2
码号式的语言。
体系—组配分类法,它的特点仍然有体系分类法的特点,但它增加了复分组配能力。 《中国图书馆分类法——中图法》是典型的体系型分类法,而《国际十进制分类法——UDC》是典型的体系——组配型分类法。分类法通常由类目,号码,正表,附表,说明和索引等六个部分组成。 二. 类目
1.类目:类是一组在某一点上彼此相同或相似的许多事物的总称。图书分类表的类就是一组在某一点上彼此相同的许多图书的总称。每一类必须给予相应的名称,这就是类目,或称为类名。
所谓类目的内涵,是指这个类目所反映的图书有关本质属性,也即是类目的含义。类目的外延则是指这个类目的适用范围,也就是这个类目所能包含的范围。 2.类目间的关系
(1)从属关系:凡具有共性与个性,全局与局部,总论与分论关系的类目都可以看做从属关系。
例:化学与有机化学
(2)同一关系:即两个或两个以上的类目反映的是同一内容,它们有着同一的外延,但类名可以相同也可以相异。
例:概率论(几率论,或然论) 晶体学与结晶学
(3)交叉关系:交叉关系又称交错关系,凡是相关类目都具有这种关系。 例;大学和共青团员
(4)并列关系:同为某一类的下位类,但不含有互相反对或矛盾之意。
例:原始社会制度,奴隶社会制度,封建制度,资本主义制度,共产主义制度。
(5)对立关系:即两个类目所反映的图书内容彼此极端相反,但相加并不等于全体。 例:无产阶级和资产阶级 无机肥料和有机肥料
(6)矛盾关系:两个类目所反映的图书内容相互排斥,但相加等于全体,即等于它的上位类。
例:脊椎动物和无脊椎动物 黑色金属冶金学和有色金属冶金学 三.号码 (简答题)
1、号码又称类号,即类目的代号,或称分类标识,它是代表各级类目的标记。 有关号码的要求主要是:
①逻辑性:指该逻辑系统必须与类目的分类体系一致,使各级类号能够显示出类目在分类体系中的位置
②简易性:指号码必须简短易写并便于使用
③伸缩性:号码编制必须有一定的伸缩性,即便于类目的增减。伸缩性也称弹性,要求在一定的地点、时间、条件下有它的相对稳定性,又要求随着地点、时间、条件的变化要有扩充发展或削减压缩的可能性
号码的类型及其编制方式:
(1)号码类型:号码可分为单纯号码和混合号码两种类型
A.单纯的数字号码:它与其他数字比较有着容易辨认,念读,记忆,书写,排列,检索的优点。
B.单纯的字母号码;由于它的基数较大,因而最大的优点是能组合较多的号码,而号码并不会太长。但它的最大缺点是不易认,不易读,不易记,不易写,使用时常常会发生差错。
3
C.混合号码:取上述两种号码的优点
(2)号码的编制方式:顺序制,层累制,混合制。 (3)号码的编制方法:(简答题时多写点) A.间接编号法:间接编号法也称留空位。 B.扩展编号法:扩展编号法也称八分法。 C.双位编号法 D.借位编号法
E.起讫编号法:起讫编号又称扩充编号。 F.连接编号法(采用冒号“:”目的是连接原有两个相关类目的号码,重新构成另一个类目的号码)
G..辅助编号法:“a”推荐符号只供马、恩、列、斯和毛泽东的著作。“—”总论复分号 “[ ]”交替符号 “+”联合符号 “( )”国家区分符号 “=”时代区分符号 “< >”通用时间,地点区分符号 “《 》”民族区分符号。 四.正表
1.正表:正表是整个文献分类表的主体,是分类体系的具体表现。它的形式一般有:基本部类表,基本大类表,主要类目表和详细类目表等。
(1)基本部类表:由基本部类组成,基本部类又称为大部,或称为基本序列。
(2)基本大类表:基本大类表又称为大纲,是在基本序列的基础上进一步展开而成。(P25页的正表结构大类A----Z要记得)
(3)主要类目表:主要类目表又称基本类目表,或称简表。 (4)详细类目表:详细类目表又简称详表。
2.附表:附表又称辅助表或复分表。其主要功能是为了辅助正表的不足,便于正表各类目的扩充和展开。
(1)通用附表:包括总论复分表,地域区分表,时代区分表,民族区分表。 (2)专类附表
(一)UDC:国际十进分类表——UDC(Universal Decimal Classification)是以杜威《十进分类法》简称DC或DDC为基础改进而编成的。 UDC的基本大类共十个 0 总论
1 哲学,心理学 2 宗教 ,神学
3 社会科学,法律,管理 4
5. 数学,自然科学
6. 应用科学(医学,工程学,农学) 7. 美术,文艺,体育运动 8. 语言学,文学 9. 地理,历史
(二).UDC号码组配 符号 名称 应用
+ 加号 并列符号
/ 斜杠 表示彼此相互排列的十进分类号的连续扩充符号 ‘ 撇号 组配符号(也称合成符号)
4
: 冒号 关联符号 4.UDC组配符号的使用
(1)并列符号“+” (2)关联符号“:” (3)扩充符号“/” (4)合成复分号“’” 5.UDC辅助表和辅助类号 (1)通用语言辅助号“=”(等号) (2)通用类型辅助号“(0?)” 例:(05)期刊,杂志,评论,年鉴。 (3)通用地区辅助号“(1/9)” 例:(4/9)现代世界
(4)通用民族与种族复分号“(=)” (5)通用时间辅助号“?” (6) 通用观点辅助号“.00”
第三章
一.标题法
1.主题法是以主题语言为基础描述和表达信息内容的一种信息处理方法
2.所谓主题语言,是指以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。
主题语言的发展经历了一个由严格规范到自由组配再到适当规范的过程。主题法是文献检索工作中两大检索方法之一,它是一种文献主题标识和查找文献的依据。
3.标题法的含义:这是主题法的最早类型,也称传统式主题法,又称字顺主题分类语言。文献主题的内容是用规范化了的词或词组来标识,这个词或词组就是所谓文献的标题,把它们按字顺排列起来就成为标题表。
4.标题词词组语法:正叙式(如:DIESEL EGINES 柴油机),倒叙式(如:PIPE,COPPTER 铜管),并列式(如:BOLTS AND NUTS 螺栓和螺帽),形容词+名词(如:Optical Properties 光学性质), 动词+名词(如:Amplitude Modulation), 名词+名词(如:Electron Beams 电子束),名词+介词+名词(如:Flow of Fluids 流体),复合名词+动名词 (如:Coal mines and Mining 煤矿与采矿) 5.标题语言的缺点:
(1)缺乏按学科专业概念进行族性检索的能力。 (2)缺乏描述复杂概念较高专指度的能力。
(3)缺乏具有多种途径检索和自由扩检的能力,它的扩检和缩检的能力。 二.叙词法 1.叙词的含义:叙词语言是以规范化科学名词作为基础的一种主题法检索语言。以主题词(叙词)作为文献内容标识和查找的依据,它是从自然语言中优选出来的经过规范化处理的名词术语。它是一种后组式语言。
2.叙词的性能:叙词的优异检索性能,首先在于它是一种后组式检索语言,可以自由地进行广泛的组配,形成各种专指标识,扩大或缩小检索范围,以及进行多维性,多途径检索等。 (1)保留了单元词组配的基本原理
(2)采用了标题法对词语进行严格规范化的方法,以保证词与概念的一一对应
(3)采用了体系分类法的基本原理,编制叙词分类索引(范畴索引)和等级索引(词族索引)
3.叙词的作用:直观性,单义性,组配性,网罗性和专指性,多维检索性,语义关联性,计算机检索与手工检索的兼容性,现代科学技术的适应性。(简答题P48要再加点内容) 三.叙词表
5