信息:是客观世界中各种事物的变化和特征的最新反映以及经过传递后的再现。 知识:系统化,理论化的信息。
知识是人类对客观事物的认识、实践经验的总结。
知识是一种特定的人类信息,它是对信息进行提炼和深化的结果。 信息是知识的源泉、材料,知识是信息的理论和结果。
情报:人在一定的时间内为一定目的而传递的有使用价值的知识或信息。情报来源于知识,是知识的一部分,是特定的知识或信息。 具有保密性、时效性、传递性 文献:记录有知识的一切载体。
凡人类的知识或信息,以文字、图形、代码、符号、声频、视频等形式记载到不同固态物质载体上面形成的一切记录。 l 文献由四要素构成:
l 文献信息:文献的内容。指文献载体上所承载的信息、知识内容。它属于信息, 除具有信息的一切性质和功能外,也有自身的特点。
l 符号系统:信息的携带者。文献的符号系统指图画、文字、公式、图表、编码、 声像和电磁信息等。
l 文献载体:符号赖以依附的“寄主”
l 记录方式:代表文献的符号进入载体的方法和过程。文献的记录方式是指表达 信息的符号系统通过特定的人工记录方式使其附着于一定的文献载体上。 l 四要素缺一不可。
4者关系:信息升华到理论化和系统化就形成了知识,再将知识记录在一定的物质载体上就形成了文献。文献是贮存传递知识、情报和信息的介质。知识是文献的实质内容,载体是文献的外在形式。 信息>知识>情报
l 医学文献特点: 1. 数量庞大2. 载体多样化3. 多种文化4. 学科交叉、出版分散、 5. 知识信息更新加快6. 交流传播速度加快7. 电子化发展趋势
文献检索:将文献按照一定方式集中组织和存储起来,并按照文献用户需求查找出有关文献或文献中包含的信息内容的过程。
包括文献存储和检索(广义)。狭义的文献检索是从用户的角度来理解,仅指从已经存贮的具有检索功能的文献信息集合中查询出所需文献的过程。 类型:(1)按检出结果形式划分:书目检索、全文检索、引文检索。
(2)从情报检索角度划分:文献检索、数据检索、事实检索 (3)按检索手段划分:手工检索和计算机检索 原理:(关键) 标识与存贮标识相一致
(存储中,对外表特征(标题、作者、来源、卷期、页次、年月、类型、号码、文种)和内容特征(主题词、分类号、类型名称、文摘)分析和加工,形成文献特征的标识,排序形成多种索引编入到检索系统)
分类标引:对文献赋予分类号标识的过程 主题标引: 主题词标识
字段:每一种文献特征。Field:组成记录的数据,反映一篇文献的具体特征。如题名(TI)、著者(AU)、地址(AD)、出处(SO)、主题词(MeSH)、关键词(KW)、特征词(TG)
出版年(PY)、语种(LA)
“缺省”字段由标题、摘要、关键词、主题词、作者、刊名组合而成。“出处”为组合字段 记录(Record): 是构成数据库的基本信息单元,每条记录都描述了一个原始信息的外表和内容特征。一条记录通常由多个数据项组成,文献型数据库中的一条记录通常代表一篇文献。 文档(File): 是数据库中一部分记录的集合。许多大型数据库往往包含有数以万计的记录,为便利用户检索,常划分为若干文档。 数据库>文档>记录>字段
文献检索系统:指根据特定的文献信息需求而建立起来的一种有关文献信息的搜集、加工、存储和检索的程序化系统。
类型:目录型、题录型、文摘型、全文型 文献检索系统的评价:(1)报道信息的准确性 (2)报道信息的及时性 (3)索引体系的完善程度 (4)对信息标引的深度 (5)查全率和查准率 查全率与查准率
查全率(R)和查准率(P)是检索系统最为流行和重要的两个性能和效果评价标志。 R=检出的相关信息量/检索工具中相关信息总量X100% P=检出的相关信息量/检出的信息总量X100%
P和R之间存在互逆关系,如果R较高,P将相对下降;反之亦然。两者只能相对提高,两者永远不可能达到100%
一次文献信息(原始文献):是指以著者本人的研究成果(如实验、观察、调查研究等结果)为依据而创作的原始文献,如期刊论文、专利说明书、会议论文、学位论文、科技报告等。
特点:内容新颖、详尽,因而是文献信息的最主要来源和检索对象,但其量大、分散而无序,对其查找与利用带来不便。
二次文献信息:是对大量的、分散的、无序的一次文献信息经过加工整序后而形成的文献。如目录、索引和文摘等。
特点:报道性和检索性,主要作用是提供查找文献信息的线索,故又称为检索工具。 三次文献信息:是将分散无序的某一范围的一次文献,经过综合整理后而重新组织成有条理有定评的文献,如综述、进展、年鉴和百科全书等。
特点:对知识信息具有浓缩性和综合性的特点,同时兼有检索文献的作用。
零次文献信息:是指未经正式发表或未融入正式交流渠道的最原始的文献,如书信、手稿、实验数据、观察记录、笔记、内部档案等。 特点:内容新颖,但不成熟,难以查询。
零次文献是形成一次文献最基本的素材;一次文献是信息的主要来源和检索对象;二次文献是检索的手段和工具;三次文献既是检索对象,同时也具有检索文献之功能。 电子文献资源的特点:(1)存储介质和传播形式的改变(2)信息的表现形式多样化 (3)文献资源类型多样化(4)多层次的信息服务功能(5)更新速度快、时效性强(6)具备检索系统或功能(7)检索访问不受时空限制 数据库:参考数据库:书目数据库、指南数据库
源数据库:全文数据库、事实数据库、数值数据库、术语数据库、图像数据库 混合数据库
检索语言:又称标引语言或索引语言,是用于描述文献检索系统中文献的内容特征及外表特征和表达用户检索提问一种专门的标识系统。
检索语言由检索标目(检索系统中的特征标识,也称检索词、索引词、标引词等)和语法组成(利用标目查找文献的一整套规则)。 分类:1、规范语言:又称受控语言、人工语言
2、非规范语言:又称非受控语言、自然语言。(自由词、关键词。无法用规范词准确表达或新出现的词语)
《中图法》将学科划分为5个基本部类(马克思主义、列宁主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书),22个基本大类
主题检索语言:以反映文献内容的主题词或关键词作为文献存储和检索的标识。
关键词语言:有意义的信息。易于掌握、灵活性高、词汇更新及时;缺乏词汇控制,用词不统一、检索率偏低
叙词语言(主题词):概念组配,组配性。结构完备、词汇控制严格、组配准确;增加了标引和检索难度
先组式语言:分类语言、标题语言等
后组式语言:叙词语言、单元词语言(规范)、关键词语言(非规范)等 《医学主题词表》(MeSh):副主题词又称限定词,与主题词进行组配
代码检索语言:用代表事物的代码作为标识系统的索引语言。(化合物分子式索引、环状化合物环系索引、化学物质号索引等)
文献检索的方法:(1)追溯法: 通过已知文献后附有的参考文献中提供的线索来查找文献。 (2)常用法:利用各种检索工具来查找文献。它又分为顺查法、倒查法和抽查法。 (3)循环法:是将常用法和追溯法交替使用的一种综合文献检索方法。 (4)浏览法:是从本专业期刊或其它类型的原始文献中直接查阅文献资料。
l 顺查法:按照时间顺序由远及近逐年查找文献的方法。一般用于重大课题和各学科 发展史以及新兴学科等方面的研究课题的全面检索,一般已知课题开始年代。如查找“有关SARS的文献” 。查新规定检索十年或十五年的文献
l 倒查法: 按照时间顺序由近及远回溯性逐年查找文献的方法。科研人员常用的检索方法。适用于一些新课题或有新内容的老课题,或在确认某项成果是否有创新时,也适合采用倒查法
l 抽查法:针对某学科或某课题研究的特点,根据文献资料发表集中的年代或时期,抽出其中一段时间进行文献检索的方法。多用于写专题调查报告。
检索途径:(1)著者途径:利用已知著者姓名作为检索标识进行文献查检。
(2)分类途径:利用特定分类体系的分类号或分类类目作为检索标识进行文献查检。 (3)主题途径:利用从文献中抽出来的、或经过人工规范化的、能代表文献组要内容的检索标识或标引词进行检索。
(4)其他途径:利用特定的检索标识进行文献查检。 布尔逻辑运算符的优先顺序:()>NOT>AND>OR 检索词之间可直接使用逻辑运算符,但智能检索除外。 位置算符:with表示同字段检索 字段限定符:如AIDS in ti;py=2002
截词算符:“*”、“?”
中国生物医学文献数据库 (CBM)
数据标引:CBM的全部题录均根据《医学主题词表》(即MeSH词表)、《中国中医药学主题词表》进行主题标引,《中国图书馆分类法 · 医学专业分类表》进行分类标引。 通配符:(1)单字通配符?:替代一个字符。注意:?必须为半角状态。 (2)任意通配符%:替代任意个字符。
强制执行符/短语检索符“”:检索词做为短语或含有特殊符号“-”、“(”、“,”等,用英文半角双引号标识检索词,如: “1,25-(OH)2D3” CBM检索方法:
1、基本检索:也称自由词检索或关键词检索。(CBM默认)
优点:没有严格的词语规范,根据个人需要使用不同的自由词,检索时灵活、方便、直观,尤其是专有名词、新名词
缺点:检索误差大,查准率、查全率不高
(精确检索:检索结果等同于检索词的一种检索,适用于关键词、主题词、特征词、分类号、作者、第一作者、刊名、期字段。如第一作者=马明)
2、主题检索:是基于文献内容的主题概念进行检索,有利于查全率和查准率。 优点:利于查全和查准
便于扩大或缩小检索范围(扩展vs不扩展、加权 vs 不加权) 便于限定文献的主要概念及各个方面(组配一个或多个副主题词) 缺点: 非专业人员难以掌握主题词的标引
主题词:亦称叙词,是指能代表文献主题内容实质的、经过严格规范化处理的专业名词术语。 (词条中带有“见”字时,前面的词为主题词的同义词,后面的词为正式主题词) 主题词加权检索:加权检索(缩小范围,提高查准率)表示仅对加*主题词检索; 非加权检索(增大范围)表示对加*和非加*均进行检索 。
主题词/副主题词扩展检索:上位只有1个,下位可有多个。有“+”表示有下位。 扩展检索(增大范围),非扩展检索(缩小范围)
副主题词的选择:阿司匹林(药名:治疗应用)治疗高血压(疾病:药物疗法) 碎石术(方法)治疗尿路结石(外科学)