`
阿尔萨斯
  • 浏览: 4173732 次
社区版块
存档分类
最新评论

【XML】DTD

 
阅读更多

什么是XML约束

在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。

常用的约束技术

  1. XML DTD
  2. XML Schema

DTD约束

DTD(Document Type Definition),全称为文档类型定义。

DTD文件应使用UTF-8或Unicode

DTD约束位置:

即可以作为一个单独的文件编写,也可以在XML文件内编写。

在xml文件内编写DTD

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<!DOCTYPE 书架 [
	<!ELEMENT 书架 (书+)>
	<!ELEMENT 书 (书名,作者,售价)>
	<!ELEMENT 书名 (#PCDATA)>
	<!ELEMENT 作者 (#PCDATA)>
	<!ELEMENT 售价 (#PCDATA)>
]>
<书架>
	<书>
		<书名>Java就业培训教程</书名>
		<作者>redarmy</作者>
		<售价>39.00元</售价>
	</书>
	...
</书架>

单独写:

文件清单:book.dtd

<!ELEMENT 书架 (书+)>
	<!ELEMENT 书 (书名,作者,售价)>
	<!ELEMENT 书名 (#PCDATA)>
	<!ELEMENT 作者 (#PCDATA)>
	<!ELEMENT 售价 (#PCDATA)>


文件清单:book.xml

<?xml version="1.0" ?>
<!DOCTYPE 书架 SYSTEM "book.dtd">
<书架>
	<书>
		<书名>Java就业培训教程</书名>
		<作者>redarmy</作者>
		<售价>39.00元</售价>
	</书>
	<书>
		<书名>JavaScript网页开发</书名>
		<作者>redarmy</作者>
		<售价>28.00元</售价>
	</书>
</书架>

XML文件使用 DOCTYPE 声明语句来指明它所遵循的DTD文件,DOCTYPE声明语句有两种形式:

  1. 当引用的文件在本地时,采用如下方式:
    <!DOCTYPE 文档根结点 SYSTEM "DTD文件的URL">
    例如: <!DOCTYPE 书架 SYSTEM “book.dtd”>。在xml文件中手写一下。
  2. 当引用的文件是一个公共的文件时,采用如下方式:
    <!DOCTYPE 文档根结点 PUBLIC "DTD名称" "DTD文件的URL">
    例如:<!DOCTYPE web-app PUBLIC
    "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN"
    "
    http://java.sun.com/dtd/web-app_2_3.dtd
    ">

DTD约束语法细节

  1. 元素定义
    • 在DTD文档中使用ELEMENT声明一个XML元素,语法格式如下所示:
      <!ELEMENT 元素名称 元素类型>

    • 元素类型可以是元素内容、或类型

      • 如为元素内容:则需要使用()括起来,如
        <!ELEMENT 书架 (书名,作者,售价)>
        <!ELEMENT 书名 (#PCDATA)>
      • 如为元素类型,则直接书写,DTD规范定义了如下几种类型:
        • EMPTY:用于定义空元素,例如<br/> <hr/>
        • ANY:表示元素内容为任意类型。
    • 元素内容中可以使用如下方式,描述内容的组成关系

      1. 用逗号分隔,表示内容的出现顺序必须与声明时一致。<!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>

      2. 用|分隔,表示任选其一,即多个只能出现一个
        <!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>

      3. 在元素内容中也可以使用+、*、?等符号表示元素出现的次数:
        +: 一次或多次 (书+)
        ?: 0次或一次 (书?)
        *: 0次或多次 (书*)
        也可使用圆括号( )批量设置,例
        <!ELEMENT MYFILE ((TITLE*, AUTHOR?, EMAIL)* | COMMENT)>

  2. 属性定义
    • xml文档中的标签属性需通过ATTLIST为其设置属性

    • 语法格式:
      <!ATTLIST 元素名
      属性名1 属性值类型 设置说明
      属性名2 属性值类型 设置说明
      ……
      >
      属性声明举例:
      <!ATTLIST 商品
      类别 CDATA #REQUIRED
      颜色 CDATA #IMPLIED
      >
      对应XML文件:
      <商品 类别="服装" 颜色="黄色">…</商品>
      <商品 类别="服装">…</商品>

    • 属性的定义
      • 设置说明:
        1. #REQUIRED:必须设置该属性
        2. #IMPLIED:可以设置也可以不设置
        3. #FIXED:说明该属性的取值固定为一个值,在 XML 文件中不能为该属性设置其它值。但需要为该属性提供这个值
        4. 直接使用默认值:在 XML 中可以设置该值也可以不设置该属性值。若没设置则使用默认值。
           <!ATTLIST 页面作者 
          	     姓名 CDATA #IMPLIED 
          	     年龄 CDATA #IMPLIED 
          	     联系信息 CDATA #REQUIRED 
          	     网站职务 CDATA #FIXED "页面作者" 
          	     个人爱好 CDATA "上网"
                 > 

      • 常用属性值类型

      1. CDATA:表示属性值为普通文本字符串。

      2. ENUMERATED (枚举)

        属性的类型可以是一组取值的列表,在 XML 文件中设置的属性值只能是这个列表中的某个值(枚举)

        <?xml version = "1.0" encoding="GB2312" standalone="yes"?>
        <!DOCTYPE 购物篮 [
        	<!ELEMENT 肉 EMPTY>
        	<!ATTLIST 肉 品种 ( 鸡肉 | 牛肉 | 猪肉 | 鱼肉 ) "鸡肉">
        ]> 
        <购物篮>
        	<肉 品种="鱼肉"/>
        	<肉 品种="牛肉"/>
        	<肉/>
        </购物篮>
      3. ID
        表示属性的设置值为一个唯一值
        ID 属性的值只能由字母,下划线开始,不能出现空白字符

        <?xml version = "1.0" encoding="GB2312" ?>
        
        <!DOCTYPE 联系人列表[
        	<!ELEMENT 联系人列表 ANY>
        	<!ELEMENT 联系人(姓名,EMAIL)>
        	<!ELEMENT 姓名(#PCDATA)>
        	<!ELEMENT EMAIL(#PCDATA)>
        	<!ATTLIST 联系人 编号 ID #REQUIRED>
        ]>
        
        <联系人列表>
        	<联系人 编号="1">
        		<姓名>张三</姓名>
        		<EMAIL>zhang@it315.org</EMAIL>
             </联系人>
        	<联系人 编号="2">
        		<姓名>李四</姓名>
        		<EMAIL>li@it315.org</EMAIL>
        	</联系人>
        </联系人列表>
      4. ENTITY(实体)

        • 实体用于为一段内容创建一个别名,以后在XML文档中就可以使用别名引用这段内容了。

        • 在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。

        • 实体可分为两种类型:引用实体和参数实体。

          1. 引用实体:主要在 XML 文档中被应用

            语法格式:

            <!ENTITY 实体名称 “实体内容” >:直接转变成实体内容

            引用方式:

            &实体名称;

            举例:
            <!ENTITY copyright “I am a programmer">
            ……
            &copyright;

          2. 参数实体:被 DTD 文件自身使用

            语法格式:

            <!ENTITY % 实体名称 "实体内容" >

            引用方式:

            %实体名称;

            举例1:

            <!ENTITY % TAG_NAMES "姓名 | EMAIL | 电话 | 地址">
            
            <!ELEMENT 个人信息 (%TAG_NAMES; | 生日)>
            <!ELEMENT 客户信息 (%TAG_NAMES; | 公司名)>
            


            举例2:

            <!ENTITY % common.attributes
            " id ID #IMPLIED 
            account CDATA #REQUIRED "
            >
            ...
            <!ATTLIST purchaseOrder %common.attributes;>
            <!ATTLIST item %common.attributes;>
            

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics