XML规范 - 中文版

2019-04-22 08:30

xml规范(1)

Extensible Markup Language (XML) 1.0

本文档是W3C建议XML 1.0的中文版,其中可能有错误和不妥之处。 英文版是唯一的正式版,位于:

http://www.w3.org/TR/1998/REC-xml-19980210 http://www.w3.org/TR/REC-xml/ 本文档位于:

http://lightning.prohosting.com/~qqiu/xml/trans/REC-xml-19980210-cn.html 著作权声明位于:http://www.w3.org/Consortium/Legal/copyright-documents.html

Copyright ? 1998 W3C (MIT, INRIA, Keio ), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply.

REC-xml-19980210-cn 可扩展标记语言(XML) 1.0 W3C建议 1998年2月10日 本版本:

http://www.w3.org/TR/1998/REC-xml-19980210 http://www.w3.org/TR/1998/REC-xml-19980210.xml http://www.w3.org/TR/1998/REC-xml-19980210.html http://www.w3.org/TR/1998/REC-xml-19980210.pdf http://www.w3.org/TR/1998/REC-xml-19980210.ps 最新版本:

http://www.w3.org/TR/REC-xml 上一版本:

http://www.w3.org/TR/PR-xml-971208 编者:

Tim Bray (Textuality and Netscape) Jean Paoli (Microsoft)

C. M. Sperberg-McQueen (University of Illinois at Chicago) 摘要

本 文档完整地描述了可扩展标记语言(Extensible Markup Language,XML),它是标准通用标记语言 (Standard Generic Markup Language,SGML)的一个子集。其目的在于使得在Web上能以现有超文本标记语言 (Hypertext Markup Language,HTML)的使用方式提供,接收和处理通用的SGML成为可能。XML的设计既考虑了实现的方

便 性,同时也顾及了与SGML和HTML的互操作性。

本文档的状态

本文档已由W3C组织成员和其他相关各方审阅,并已被组织理事批准为W3C建议。这是一个稳定的文档,可以用作参考材料,也可以作为其他文档的正式参考文献。W3C在建议制定过程中的作用是吸引对本规范的注意并促进它的广泛使用。这能增强Web的功能和互操作性。

本 文档规定了一种用于World Wide Web的语法,此语法是通过取一个业已存在并已广泛使用的文本处理国际标准(标准通用标记语言,经增补和更正的 ISO 8879:1986(E))的子集而创建的。它是W3C XML行动组(XML Activity)的工作成果,关于XML行动组的详细信息可以 在http://www.w3.org/XML找到。在http://www.w3.org/TR可以找到现有W3C建议和其他技术文档的一个列表。

本规范中使用了[Berners-Lee等人]定义的一个术语URI,他们正在从事的的工作将更新[IETF RFC1738]和[IETF RFC1808]。

本规范的已知错误列表可以在http://www.w3.org/XML/xml-19980210-errata找到。 请将本文档中的错误报告给xml-editor@w3.org。 可扩展标记语言(XML) 1.0 目录 1. 绪论

1.1 开发者和开发目标 1.2 术语 2. 文件

2.1 规范的XML文件 2.2 字符

2.3 通用语法成分 2.4 字符数据和标记 2.5 注释 2.6 处理指令 2.7 CDATA段

2.8 序和文件类型声明 2.9 独立文件声明 2.10 空白处理 2.11 行尾处理 2.12 语言标识 3. 逻辑结构

3.1 起始标签,结束标签和空元素标签 3.2 元素类型声明

3.2.1 元素型内容 3.2.2 混合型内容 3.3 属性表声明 3.3.1 属性类型 3.3.2 属性的缺省值 3.3.3 属性-值对的规范化 3.4 条件段 4. 物理结构

4.1 字符和实体引用 4.2 实体声明 4.2.1 内部实体 4.2.2 外部实体 4.3 已析实体 4.3.1 文本声明 4.3.2 规范的已析实体 4.3.3 实体中的字符编码

4.4 XML处理器对实体和引用的处理 4.4.1 不被识别 4.4.2 被包含

4.4.3 进行验证时被包含 4.4.4 被禁止

4.4.5 被包含在常量中 4.4.6 通知 4.4.7 不处理 4.4.8 作为PE被包含 4.5 内部实体置换文本的构建 4.6 预定义实体 4.7 记法声明 4.8 文件实体 5. 一致性

5.1 进行验证和不进行验证的处理器 5.2 使用XML处理器

6. 记法 附录 A. 参考文献 A.1 正式参考文献 A.2 其他参考文献 B. 字符的分类

C. XML和SGML(非正式)

D. 实体和字符引用的展开(非正式) E. 确定型内容模型(非正式) F. 字符编码的自动检测(非正式) G. W3C XML工作组(非正式)

-------------------------------------------------------------------------------- 1. 绪论

可 扩展标记语言,缩写为XML,描述了一类称为XML文件的数据对象,同时也部分地描述了处理这些数据对象的计算机程序的动作。XML是SGML(标准通用 标记语言[ISO 8879])针对应用的一个子集,或者说是SGML的一种受限形式。根据定义,XML文件是合乎规范的SGML文件。

XML 文件由称为实体的存储单元组成,实体可以包含已析数据或未析数据。已析数据由字符组成,其中一些字符组成字符数据,另一些字符组成标记。标记中包含了对文 件存储格式(storage layout)和逻辑结构的描述。XML提供了一种机制用于约束存储格式和逻辑结构。

称为XML处理器的软件模块用于读取XML文件,存取其中的内容和结构。XML处理器被设想为是为另一个称为应用的模块作处理。本规范从XML处理器应如何读取XML数据以及应向应用提供哪些信息的这两个方面,描述了要求XML处理器作出的动作。

1.1 开发者和开发目标

XML 由XML工作组(原先的SGML编辑审查委员会)开发,此工作组由World Wide Web Consortium(W3C)在1996年主持成立。 工作组由Sun Microsystems的Jon Bosak负责,同样由W3C组织的 XML SIG(Special Interest Group)(原先的SGML工作组)积极参与了XML工作组的工作。XML工作组的成员在附录中给 出。工作组与W3C的联系人是Dan Connolly。

XML的设计目标如下:

XML应该可以直接用于因特网(Internet)。 XML应该支持大量不同的应用。 XML应该与SGML兼容。

处理XML文件的程序应该容易编写。

XML中的可选项应无条件地保持最少,理想状况下应该为0个。 XML文件应该是人可以直接阅读的,应该是条理清楚的。

XML的设计应快速完成。

XML的设计应该是形式化的,简洁的。 XML文件应易于创建。

XML标记的简洁性是最后考虑的目标。

本 规范与其他相关的标准一起(Unicode和ISO/IEC 10646定义了字符集,Internet RFC1766定义了语言识别 码,ISO 639定义了语言名称代码,ISO 3166定义了国家名称代码),提供了理解XML版本1.0和构建相应计算机处理程序所需的所有信息。

在完整保留所有文本和法律注意事项的前提下,本版本的XML规范可以自由分发。 1.2 术语

用于描述 XML 文件的术语在此规范的正文中定义。在这些定义中以及描述一个XML处理器的动作时,使用了下表中的术语:

可以(may):允许合乎规范的文件和XML处理器按所描述的方式工作,但不要求必须如此。 必须(must):要求合乎规范的文件和XML处理器按所描述的方式工作; 否则它们出现错误。

错误(error):对本规范中的规则的违反; 其结果不确定。合乎规范的软件可以检测和报告错误,并可以从中恢复。

严重错误(fatal error):合乎规范的XML处理器必须检测到,并向应用报告的一类错误。在遇到严重错误之后,处理器可以继续处理数据以发现更多的错误并可以向应用报告这些错误。为了 支持错误的更正,处理器可以向应用提供文件中未经处理的数据(字符数据和标记的混合体)。但是,一旦检测到一个严重错误,处理器必须停止正常的处理(也就 是说,它必须停止以正常的方式向应用提供与文件逻辑结构有关的数据和信息)。

由用户选择(at user option):合乎规范的软件可以或者必须(取决于句子中的情态动词)按所描述的方式工作; 如果它满足这个条件,它必须同时提供用户一种手段,使得用户能够启用和禁用所描述的工作方式。

有效性约束(validity constraint):适用于所有有效的XML文件的一种规则。违反有效性约束属于错误;进行验证的XML处理器必须,由用户选择,报告这些错误。

规范性约束(well-formedness constraint):适用于所有规范的XML文件的一种规则。违反规范性约束属于严重错误。

匹配(match):(对于字符串和名字:)被比较的两个字符串或名字必须完全相同。在ISO/IEC 10646中有多种可能表示方式的字符(例如,既有预定义(precomposed)形式和基字符(base)+变音符形式的字符)只在两个字符串中的表示方式相同时才匹配。由用户选择,处理器可以将这些字符规 范成某种规范形式。不进行字符的大小写转换。(对于文法中的字符串和规则:)如果一个字符串属于一个文法产生式产生的语言,则它匹配这个产生式。(对于内 容和内容模型:)当一个元素符合\元素有效性\约束中的描述时,它匹配其声明.

出于兼容性考虑(for compatibility):仅用于保证与SGML兼容的XML特性。

出于互操作性考虑(for interoperability):是一个不具约束性的建议,目的是增加XML文件能被在ISO 8879的WebSGML改编附件之前已有的SGML处理器处理的可能性

2. 文件

如果一个数据对象满足本规范中规范的定义时,它是一个XML文件。一个规范的XML文件可以更进一步是有效的如果它满足某些进一步的约束。

每一个XML文件都有逻辑和物理结构。物理上而言,文件由称为实体的单元组成。一个实体可以引用(refer)其他实体,将它们包含在文件中。文件开始于\根(root)\或文件实体中。逻辑上而言,文件由声明,元素,注释,


XML规范 - 中文版.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:威斯敏斯特小要理问答

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: