XML Schema(XSD) 实例

本章节会为您演示如何编写一个 XML Schema。

您还将学习到编写 schema 的不同方法。


XML 文档

让我们看看这个名为 "shiporder.xml" 的 XML 文档:

  1. <?xml version="1.0" encoding="utf-8"?>
  2. <shiporder orderid="889923"
  3. xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  4. xsi:noNamespaceSchemaLocation="shiporder.xsd">
  5. <orderperson>George Bush</orderperson>
  6. <shipto>
  7. <name>John Adams</name>
  8. <address>Oxford Street</address>
  9. <city>London</city>
  10. <country>UK</country>
  11. </shipto>
  12. <item>
  13. <title>Empire Burlesque</title>
  14. <note>Special Edition</note>
  15. <quantity>1</quantity>
  16. <price>10.90</price>
  17. </item>
  18. <item>
  19. <title>Hide your heart</title>
  20. <quantity>1</quantity>
  21. <price>9.90</price>
  22. </item>
  23. </shiporder>

上面的XML文档包括根元素 "shiporder",其中包含必须名为 "orderid" 的属性。"shiporder" 元素包含三个不同的子元素:"orderperson"、"shipto" 以及 "item"。"item" 元素出现了两次,它含有一个 "title"、一个可选 "note" 元素、一个 "quantity" 以及一个 "price" 元素。

上面这一行 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance",告知XML解析器根据某个 schema 来验证此文档。这一行:xsi:noNamespaceSchemaLocation="shiporder.xsd" 规定了 schema 的位置(在这里,它与 "shiporder.xml" 处于相同的文件夹)。


创建一个 XML Schema

现在,我们需要为上面这个 XML 文档创建一个 schema。我们可以通过打开一个新的文件来开始,并把这个文件命名为 "shiporder.xsd"。要创建schema,我们仅仅需要简单地遵循 XML 文档中的结构,定义我们所发现的每个元素。首先我们开始定义一个标准的 XML 声明:

  1. <?xml version="1.0" encoding="utf-8" ?>
  2. <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
  3. ...
  4. ...
  5. </xs:schema>

在上面的 schema 中,我们使用了标准的命名空间 (xs),与此命名空间相关联的 URI 是 Schema 的语言定义(Schema language definition),其标准值是 http://www.w3.org/2001/XMLSchema。接下来,我们需要定义 "shiporder" 元素。此元素拥有一个属性,其中包含其他的元素,因此我们将它认定为复合类型。"shiporder" 元素的子元素被 xs:sequence 元素包围,定义了子元素的次序:

  1. <xs:element name="shiporder">
  2. <xs:complexType>
  3. <xs:sequence>
  4. ...
  5. ...
  6. </xs:sequence>
  7. ...
  8. </xs:complexType>
  9. </xs:element>

然后我们需要把 "orderperson" 元素定义为简易类型(这是因为它不包含任何属性或者其他的元素)。类型 (xs:string) 的前缀是由命名空间的前缀规定的,此命名空间与指示预定义的 schema 数据类型的 XML schema 相关联:

  1. <xs:element name="orderperson" type="xs:string"/>

接下来,我需要把两个元素定义为复合类型:"shipto" 和 "item"。我们从定义 "shipto" 元素开始:

  1. <xs:element name="shipto">
  2. <xs:complexType>
  3. <xs:sequence>
  4. <xs:element name="name" type="xs:string"/>
  5. <xs:element name="address" type="xs:string"/>
  6. <xs:element name="city" type="xs:string"/>
  7. <xs:element name="country" type="xs:string"/>
  8. </xs:sequence>
  9. </xs:complexType>
  10. </xs:element>

通过 schema,我们可使用 maxOccurs 和 minOccurs 属性来定义某个元素可能出现的次数。maxOccurs 定义某元素出现次数的最大值,而 minOccurs 则定义某元素出现次数的最小值。maxOccurs 和 minOccurs 的默认值都是 1!

现在,我们可以定义 "item" 元素了。这个元素可在 "shiporder" 元素内部出现多次。这是通过把 "item" 元素的 maxOccurs 属性的值设定为 "unbounded" 来实现的,这样 "item"元素就可出现创作者所希望的任意多次。请注意,"note" 元素是可选元素。我们已经把此元素的 minOccurs 属性设定为 0 了:

  1. <xs:element name="item" maxOccurs="unbounded">
  2. <xs:complexType>
  3. <xs:sequence>
  4. <xs:element name="title" type="xs:string"/>
  5. <xs:element name="note" type="xs:string" minOccurs="0"/>
  6. <xs:element name="quantity" type="xs:positiveInteger"/>
  7. <xs:element name="price" type="xs:decimal"/>
  8. </xs:sequence>
  9. </xs:complexType>
  10. </xs:element>

现在,我们可以声明 "shiporder" 元素的属性了。由于这是一个必选属性,我们规定 use="required"。

注释:此属性的声明必须被置于最后:

  1. <xs:attribute name="orderid" type="xs:string" use="required"/>

这是这个名为 "shiporder.xsd" 的 schema 文件的文档清单:

  1. <?xml version="1.0" encoding="utf-8" ?>
  2. <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
  3. <xs:element name="shiporder">
  4. <xs:complexType>
  5. <xs:sequence>
  6. <xs:element name="orderperson" type="xs:string"/>
  7. <xs:element name="shipto">
  8. <xs:complexType>
  9. <xs:sequence>
  10. <xs:element name="name" type="xs:string"/>
  11. <xs:element name="address" type="xs:string"/>
  12. <xs:element name="city" type="xs:string"/>
  13. <xs:element name="country" type="xs:string"/>
  14. </xs:sequence>
  15. </xs:complexType>
  16. </xs:element>
  17. <xs:element name="item" maxOccurs="unbounded">
  18. <xs:complexType>
  19. <xs:sequence>
  20. <xs:element name="title" type="xs:string"/>
  21. <xs:element name="note" type="xs:string" minOccurs="0"/>
  22. <xs:element name="quantity" type="xs:positiveInteger"/>
  23. <xs:element name="price" type="xs:decimal"/>
  24. </xs:sequence>
  25. </xs:complexType>
  26. </xs:element>
  27. </xs:sequence>
  28. <xs:attribute name="orderid" type="xs:string" use="required"/>
  29. </xs:complexType>
  30. </xs:element>
  31. </xs:schema>

分割 Schema

前面的设计方法非常容易,但当文档很复杂时却难以阅读和维护。

接下来介绍的设计方法基于首先对所有元素和属性的定义,然后再使用 ref 属性来引用它们。

这是用新方法设计的 schema 文件:

  1. <?xml version="1.0" encoding="utf-8" ?>
  2. <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
  3. <!-- 简易元素的定义 -->
  4. <xs:element name="orderperson" type="xs:string"/>
  5. <xs:element name="name" type="xs:string"/>
  6. <xs:element name="address" type="xs:string"/>
  7. <xs:element name="city" type="xs:string"/>
  8. <xs:element name="country" type="xs:string"/>
  9. <xs:element name="title" type="xs:string"/>
  10. <xs:element name="note" type="xs:string"/>
  11. <xs:element name="quantity" type="xs:positiveInteger"/>
  12. <xs:element name="price" type="xs:decimal"/>
  13. <!-- 属性的定义 -->
  14. <xs:attribute name="orderid" type="xs:string"/>
  15. <!-- 复合元素的定义 -->
  16. <xs:element name="shipto">
  17. <xs:complexType>
  18. <xs:sequence>
  19. <xs:element ref="name"/>
  20. <xs:element ref="address"/>
  21. <xs:element ref="city"/>
  22. <xs:element ref="country"/>
  23. </xs:sequence>
  24. </xs:complexType>
  25. </xs:element>
  26. <xs:element name="item">
  27. <xs:complexType>
  28. <xs:sequence>
  29. <xs:element ref="title"/>
  30. <xs:element ref="note" minOccurs="0"/>
  31. <xs:element ref="quantity"/>
  32. <xs:element ref="price"/>
  33. </xs:sequence>
  34. </xs:complexType>
  35. </xs:element>
  36. <xs:element name="shiporder">
  37. <xs:complexType>
  38. <xs:sequence>
  39. <xs:element ref="orderperson"/>
  40. <xs:element ref="shipto"/>
  41. <xs:element ref="item" maxOccurs="unbounded"/>
  42. </xs:sequence>
  43. <xs:attribute ref="orderid" use="required"/>
  44. </xs:complexType>
  45. </xs:element>
  46. </xs:schema>

使用指定的类型(Named Types)

第三种设计方法定义了类或者类型,这样使我们有能力重复使用元素的定义。具体的方式是:首先对简易元素和复合元素进行命名,然后通过元素的 type 属性来指向它们。

这是利用第三种方法设计的 schema 文件 ("shiporder.xsd"):

  1. <?xml version="1.0" encoding="utf-8" ?>
  2. <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
  3. <xs:simpleType name="stringtype">
  4. <xs:restriction base="xs:string"/>
  5. </xs:simpleType>
  6. <xs:simpleType name="inttype">
  7. <xs:restriction base="xs:positiveInteger"/>
  8. </xs:simpleType>
  9. <xs:simpleType name="dectype">
  10. <xs:restriction base="xs:decimal"/>
  11. </xs:simpleType>
  12. <xs:simpleType name="orderidtype">
  13. <xs:restriction base="xs:string">
  14. <xs:pattern value="[0-9]{6}"/>
  15. </xs:restriction>
  16. </xs:simpleType>
  17. <xs:complexType name="shiptotype">
  18. <xs:sequence>
  19. <xs:element name="name" type="stringtype"/>
  20. <xs:element name="address" type="stringtype"/>
  21. <xs:element name="city" type="stringtype"/>
  22. <xs:element name="country" type="stringtype"/>
  23. </xs:sequence>
  24. </xs:complexType>
  25. <xs:complexType name="itemtype">
  26. <xs:sequence>
  27. <xs:element name="title" type="stringtype"/>
  28. <xs:element name="note" type="stringtype" minOccurs="0"/>
  29. <xs:element name="quantity" type="inttype"/>
  30. <xs:element name="price" type="dectype"/>
  31. </xs:sequence>
  32. </xs:complexType>
  33. <xs:complexType name="shipordertype">
  34. <xs:sequence>
  35. <xs:element name="orderperson" type="stringtype"/>
  36. <xs:element name="shipto" type="shiptotype"/>
  37. <xs:element name="item" maxOccurs="unbounded" type="itemtype"/>
  38. </xs:sequence>
  39. <xs:attribute name="orderid" type="orderidtype" use="required"/>
  40. </xs:complexType>
  41. <xs:element name="shiporder" type="shipordertype"/>
  42. </xs:schema>

restriction 元素显示出数据类型源自于 W3C XML Schema 命名空间的数据类型。

因此,下面的片段也就意味着元素或属性的值必须是字符串类型的值:

  1. <xs:restriction base="xs:string">

restriction 元素常被用于向元素施加限制。请看下面这些来自以上 schema 的片段:

  1. <xs:simpleType name="orderidtype">
  2. <xs:restriction base="xs:string">
  3. <xs:pattern value="[0-9]{6}"/>
  4. </xs:restriction>
  5. </xs:simpleType>

以上代码指示出,元素或属性的值必须为字符串,并且必须是连续的六个字符,同时这些字符必须是 0-9 的数字。