EDS/T 1—2006
地震科学数据 元数据编写指南
1 范围
本标准规定了地震科学数据的元数据内容和编写元数据的方法。
本标准适用于对地震科学数据集的描述、地震科学数据集的编目和地震科学数据共享服务。 2 规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
DB/T11.1—2000 地震数据分类与代码 第1部分:基本类别 SDS/T2111-2005 元数据标准化基本原则和方法 SDS/T2112-2005 科学数据共享元数据内容 3 标准应用的一致性要求
在地震科学数据共享应用中定义的元数据应与本标准保持一致。 4 术语和定义
4.1
数据类型 data type
对数据值域的说明。数据类型用诸如整型、实型等术语标识。
4.2
数据集 dataset
可以识别的数据集合;在本标准中特指一个数据库或者一个或多个数据文件。 4.3
元数据 metadata
关于数据的数据,是用于定义和描述其他数据的数据。 4.4
元数据元素 metadata element 元数据的基本单元。
注1:与统一建模语言(Unified Modeling Language,简称UML,下同)术语中的“属性”同义。
4.5
元数据实体 metadata entity
说明数据同一方面特性的一组元数据元素。
注1:与UML术语中的“类”同义,可以包含一个或一个以上元数据实体。
4.6
元数据子集 metadata section
元数据的子集合,由相关的元数据实体和元素组成。 4.7
地震数据 earthquake-related data
1
SDS/T ×××—200×
与地震的孕育、发生、地震动传播及地震所造成的后果以及减轻地震灾害相关联的数据。这些数据主要是在我国防震减灾四个基本环节(地震监测预报、地震灾害预防、地震应急、震后救灾与重建)及相关的科学研究中形成的。
[DB/T11.1-2000中第2章] 4.8
地震科学数据 earthquake-related data for scientific research 地震数据中直接或间接用于科学研究的那部分数据。 5 约定
5.1 元数据实体和元素的描述方法
本标准采用三种方式定义和描述元数据实体和元素:摘要表示、字典和UML图。 5.1.1 摘要表示
在以摘要表示的方式定义和描述元数据实体和元素时,本标准采用以下属性,包括定义、英文名称、数据类型、值域、短名、注解、子元素和扩展巴氏范式。 5.1.1.1 定义
描述元数据元素的基本内容和属性。 5.1.1.2 英文名称
元数据元素的英文名称,一般用英文全称。 5.1.1.3 数据类型
元数据元素的有效值域和允许对该值域内的值进行有效操作的规定。 例如整型、实型、布尔型、字符串、日期等。 5.1.1.4 值域
说明元数据元素可以取值的范围。 5.1.1.5 短名
元数据元素的英文缩写名称,具体缩写规则参见第5.2节。 5.1.1.6 注解
对元数据元素含义的进一步解释,包括该元数据元素的约束/条件(必选、可选或条件必选)和最大出现次数。当该元数据元素为条件必选时,应注明其约束条件。 5.1.1.6.1 约束/条件
说明元数据实体或元数据元素是否必须选取的属性。包括必选(M)、可选(O)和条件必选(C)。 必选 M
表明该元数据实体或元数据元素必须选择。 可选 O
根据实际应用可以选择也可以不选的元数据实体或元数据元素。
如果一个可选元数据实体未被使用,则该实体所包含的元素(包括必选元素)也不选用。可选元数据实体可以有必选元素,但只当可选实体被选用时它们才成为必选的。
条件必选 C
当满足约束条件中定义的条件时必须选择。条件必选用于以下三种可能性之一: ——表示在2或3个选项中进行选择。至少一个选项必选,且必须使用。 ——当另一个元数据元素已经使用时,选用一个元数据实体或元数据元素。 ——当另一个元数据元素已经选择了一个特定值时,选用一个元数据元素。 5.1.1.6.2 最大出现次数
说明元数据实体或元数据元素可以具有的最大实例数目。只出现一次的用“1”表示,重复出现的用“N”表示。允许不为1的固定出现次数用相应的数字表示,如“2”、“3”、“4”等。
2
EDS/T 1—2006
5.1.1.7 子元素
通过一定的表示规则以确定一个元数据子集或元数据实体与其下一级的元数据实体或元数据元素之间的关系。每一条表示规则均由“标识符 = 表达式”表示。表示规则中各符号的含义如下:
表1 表示规则的符号含义
符 号 = + | 0{a}1 0{a}n a 1{a}n 含 义 由??替换、生成,由??组成 与 或(选择)——在由“|”分开的两项之中选择其一 表示{}中的元数据元素a为可选项/条件必选项,且最大出现次数为1;若为条件必选项,约束/条件具体参见其注解 表示{}中的元数据元素a为可选项/条件必选项,且最大出现次数为N;若为条件必选项,约束/条件具体参见其注解 表示元数据元素a为必选项,且最大出现次数为1 表示{}中的元数据元素a为必选项,且最大出现次数为N 在子元素表示中,{}中均使用元数据元素的中文名称。 5.1.1.8 扩展巴氏范式
扩展巴氏范式可以更加规范化地表示一个元数据子集或元数据实体与其下一级的元数据实体或元数据元素之间的关系,便于系统实现。与子元素的表示法不同的是,扩展巴氏范式用“,”代替子元素中的“+”表示“与”关系,{}中均使用该元数据元素的短名。 5.1.2 字典
本标准以字典形式提供了地震科学共享数据元数据实体和元素的定义。字典中的实体和元素用以下七个属性定义。
5.1.2.1 名称/角色名称
赋予元数据实体或元数据元素的一个标记,分为中文名称和英文名称。元数据实体英文名称开头为大写字母,而元数据元素的英文名称开头为小写字母,以示区别。英文名称中没有空格。取而代之的是将多个单词连接,其中每一个新的单词开头为大写字母(如:XnnnYmmm)。元数据实体名称在本标准的整个数据字典中是唯一的;元数据元素名称在元数据实体中是唯一的,而在本标准的整个数据字典中可能不唯一。角色名称用于标识元数据的抽象模型关联,并由“角色名称:”打头,以区别于其它元数据元素。 5.1.2.2 短名
英文短名在本标准中是唯一的,可以通过可扩展标记语言(XML)、ISO 8879 (SGML) 或其它类似的执行技术使用这些英文短名。按照与产生实体和元素英文名称相类似的命名规则产生英文短名。 5.1.2.3 定义
参见5.1.1.1节。 5.1.2.4 约束/条件
参见5.1.1.6.1节。 5.1.2.5 最大出现次数
参见5.1.1.6.2节。 5.1.2.6 数据类型
参见5.1.1.3节。 5.1.2.7 域
3
SDS/T ×××—200×
对于一个元数据实体,域说明该实体所包含的元素所在行的行号。
对于一个元数据元素,域说明该元素允许的值或使用自由文本。“自由文本”表明对字段的内容没有限制。应使用基于整型的代码表示包含代码表的域。 5.1.3 UML图
本标准采用统一建模语言(UML)来进行模型的构建,并用以表示元数据子集、元数据实体和元数据元素之间的关系。
UML中有包、类和属性的概念。包是将一些有共性的类组合在一起。类是包装信息和行为的项目。属性是类所包含的信息。 5.1.3.1 统一建模语言符号
本标准采用UML静态结构图表示元数据实体间的关系。图1为本标准使用的UML符号。
图1 统一建模语言(UML)符号
5.1.3.2 统一建模语言模型关系
本标准涉及UML定义的下列几种模型关系: (1) 关联
关联用于描述两个或更多类之间的关系。UML定义了三种不同类型关系:关联、聚合和组合。这三种类型具有不同的语义。
通常的关联用于两个类之间的一般关系。
聚合关联和组合关联用于创建两个类之间的部分与整体的关系。
聚合关联表示两个类之间的关系。在该关系中,一个类担当容器角色,另一个类担当容器的构件角色。
组合关联是强聚合。在组合关联中,如果删除一个容器对象,则它的所有容器构件也被删除。当没有容器对象,表示容器对象局部的对象就不可能存在时,应当使用组合关联。
关联的方向必须说明。如果不指明方向,则假定为双向关联。如果是单向关联,关联方向可以在线段终点用箭头来标记。 (2) 泛化
泛化表示超类与可以替代它的子类之间的关系。超类是泛化类,而子类则定义为特化类。 (3) 角色
模型中可以使用“角色名称”描述源对象与目标对象之间的关系。在双向关联中,提供两个角色名称。图2说明在UML模型中如何表示角色名称和基数。
4