xml格式(XML语言格式规范、文档组成)
文章插图
一、格式良好的 xml1、语法规范:
1)、必须有 XML 文档声明:
说明:
XML standalone 定义了外部定义的 DTD 文件的存在性. standalone element 有效值
是 yes 和 no. 如下是一个例子:
......... 值 no 表示这个 XML 文档不是独立的而是依赖于外部所定义的一个 DTD. 值 yes 表
示这个 XML 文档是自包含的(self-contained).
注意文本文件保存时候默认的编码格式是ANSI,需用记事本把它手动改为UTF-8保存 。
2)、必须有且仅有一个根元素
【XML语言格式规范、文档组成 xml格式】3)、严格区分大小写
4)、属性值用引号(双引号或单引号) :等号分开的名称-值对;在一个元素上,相同的属
性只能出现一次
5)、标记成对;
6)、空标记关闭;
7)、元素正确嵌套 。
2、元素命名规则
1)、名称中可以包含字母、数字或者其他可见字符;
2)、名称不能以数字开头;
3)、不能以 XML/xml/Xml…开头;
4)、名称中不能含空格;
5)、名称中不能含冒号(注:冒号留给命名空间使用)
3、实体
实体叫 ENTITY,实体的作用是避免重复输入 。作用相当于宏或者变量 。
1)内置的 5 种实体
实体 符号
< <
> >
& &
" "
' '
2)自定义实体
]> 使用已定义的实体:&实体名; ]> 明明
文档类型定义——DOCTYPE,文档类型声明,紧跟 XML 声明之后,包含所有实体声明
二、XML 文档组成1、构成
所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:
元素
属性
实体
PCDATA
CDATA
CDATA 节(character data)
2、CDATA
用于把整段文本解释为纯字符数据而不是标记的情况 。如包含大量的<、>、&、或者"
字符 。CDATA 节中的所有字符都会被当做元素字符数据的常量部分,而不是 XML 标记,
可以输入除]]>外任意字符,不能嵌套 。
3、PCDATA
PCDATA 的意思是被解析的字符数据(parsed character data) 。可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本 。
PCDATA 是会被解析器解析的文本 。这些文本将被解析器检查实体以及标记 。
文本中的标签会被当作标记来处理,而实体会被展开 。
不过,被解析的字符数据不应当包含任何 &、< 或者 > 字符;需要使用 &、< 以及 >
的内置实体来分别替换它们 。
- 聊一聊专业的邮件格式 email格式
- 最奇怪的语言文字 世界上最特殊的语言
- 面对别人语言的挑衅怎么办 挑衅是什么意思
- 世界上最古老的语言排名 语言的进化与发展
- 语言的魅力演讲稿3分钟 关于语言方面的演讲稿
- allomorph词汇学名词解释 allomorph语言学定义
- 语言表达能力 表达能力的近义词
- 用c语言程序猜商品价格,c语言计算单价乘以数量
- 文字语言的定义 语言的定义与特点
- 区别语言和言语的例子 试述语言和言语的区别