1.xml

1.1概述【理解】

  • 万维网联盟(W3C)万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。建立者: Tim Berners-Lee (蒂姆·伯纳斯·李)。是Web技术领域最具权威和影响力的国际中立性技术标准机构。到目前为止,W3C已发布了200多项影响深远的Web技术标准及实施指南,
    • 如广为业界采用的超文本标记语言HTML(标准通用标记语言下的一个应用)、
    • 可扩展标记语言XML(标准通用标记语言下的一个子集)
    • 以及帮助残障人士有效获得Web信息的无障碍指南(WCAG)等

01_w3c概述.png

  • xml概述XML的全称为(EXtensible Markup Language),是一种可扩展的标记语言标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的
  • 作用
    • 用于进行存储数据和传输数据
    • 作为软件的配置文件
  • 作为配置文件的优势

    • 可读性好
    • 可维护性高

      1.2标签的规则【应用】

  • 标签由一对尖括号和合法标识符组成

  • 标签必须成对出现

    1. <student> </student>
    2. 前边的是开始标签,后边的是结束标签
  • 特殊的标签可以不成对,但是必须有结束标记

  • 标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来
  • 标签需要正确的嵌套
    1. 这是正确的: <student id="1"> <name>张三</name> </student>
    2. 这是错误的: <student id="1"><name>张三</student></name>

1.3语法规则【应用】

  • 语法规则

    • XML文件的后缀名为:xml
    • 文档声明必须是第一行第一列<?xml version=”1.0” encoding=”UTF-8” standalone=”yes”?>

      1. version:该属性是必须存在的<br /> encoding:该属性不是必须的 <br />打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)<br />standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no
    • 必须存在一个根标签,有且只能有一个

    • XML文件中可以定义注释信息
    • XML文件中可以存在以下特殊字符

      1. &lt; < 小于
      2. &gt; > 大于
      3. &amp; & 和号
      4. &apos; ' 单引号
      5. &quot; " 引号
    • XML文件中可以存在CDATA区

      1. <![CDATA[ …内容… ]]>
  • 示例代码 ```xml <?xml version=”1.0” encoding=”UTF-8” ?>

    张三 23 学生< >>>>>>>>>>>的信息 <![CDATA[内容 <<<<<< >>>>>> ]]]> 李四 24

  1. <a name="WoncR"></a>
  2. ### 1.4xml解析【应用】
  3. - 概述
  4. xml解析就是从xml中获取到数据
  5. - 常见的解析思想
  6. DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值<br />![02_dom解析概述.png](https://cdn.nlark.com/yuque/0/2023/png/22016332/1684754666427-a1abc663-0de9-475a-8349-84fb6d58fe70.png#averageHue=%23faf4f4&clientId=u4093414f-e3b1-4&from=paste&height=487&id=u644bf36e&originHeight=609&originWidth=1085&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=104162&status=done&style=none&taskId=ub8dc1032-43c4-452f-88e9-361118bb4e7&title=&width=868)
  7. - 常见的解析工具
  8. - JAXP: SUN公司提供的一套XML的解析的API
  9. - JDOM: 开源组织提供了一套XML的解析的API-jdom
  10. - DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java
  11. - pull: 主要应用在Android手机端解析XML
  12. - 解析的准备工作
  13. 1. 我们可以通过网站:[https://dom4j.github.io/](https://dom4j.github.io/) 去下载dom4j今天的资料中已经提供,我们不用再单独下载了,直接使用即可
  14. 2. 将提供好的dom4j-1.6.1.zip解压,找到里面的dom4j-1.6.1.jar
  15. 3. 在idea中当前模块下新建一个libs文件夹,将jar包复制到文件夹中
  16. 4. 选中jar包 -> 右键 -> 选择add as library即可
  17. - 需求
  18. - 解析提供好的xml文件
  19. - 将解析到的数据封装到学生对象中
  20. - 并将学生对象存储到ArrayList集合中
  21. - 遍历集合
  22. - 代码实现
  23. ```java
  24. <?xml version="1.0" encoding="UTF-8" ?>
  25. <!--注释的内容-->
  26. <!--本xml文件用来描述多个学生信息-->
  27. <students>
  28. <!--第一个学生信息-->
  29. <student id="1">
  30. <name>张三</name>
  31. <age>23</age>
  32. </student>
  33. <!--第二个学生信息-->
  34. <student id="2">
  35. <name>李四</name>
  36. <age>24</age>
  37. </student>
  38. </students>
  39. // 上边是已经准备好的student.xml文件
  40. public class Student {
  41. private String id;
  42. private String name;
  43. private int age;
  44. public Student() {
  45. }
  46. public Student(String id, String name, int age) {
  47. this.id = id;
  48. this.name = name;
  49. this.age = age;
  50. }
  51. public String getId() {
  52. return id;
  53. }
  54. public void setId(String id) {
  55. this.id = id;
  56. }
  57. public String getName() {
  58. return name;
  59. }
  60. public void setName(String name) {
  61. this.name = name;
  62. }
  63. public int getAge() {
  64. return age;
  65. }
  66. public void setAge(int age) {
  67. this.age = age;
  68. }
  69. @Override
  70. public String toString() {
  71. return "Student{" +
  72. "id='" + id + '\'' +
  73. ", name='" + name + '\'' +
  74. ", age=" + age +
  75. '}';
  76. }
  77. }
  78. /**
  79. * 利用dom4j解析xml文件
  80. */
  81. public class XmlParse {
  82. public static void main(String[] args) throws DocumentException {
  83. //1.获取一个解析器对象
  84. SAXReader saxReader = new SAXReader();
  85. //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
  86. Document document = saxReader.read(new File("myxml\\xml\\student.xml"));
  87. //3.获取到根标签
  88. Element rootElement = document.getRootElement();
  89. //4.通过根标签来获取student标签
  90. //elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
  91. //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集合中并返回
  92. //List list = rootElement.elements();
  93. List<Element> studentElements = rootElement.elements("student");
  94. //System.out.println(list.size());
  95. //用来装学生对象
  96. ArrayList<Student> list = new ArrayList<>();
  97. //5.遍历集合,得到每一个student标签
  98. for (Element element : studentElements) {
  99. //element依次表示每一个student标签
  100. //获取id这个属性
  101. Attribute attribute = element.attribute("id");
  102. //获取id的属性值
  103. String id = attribute.getValue();
  104. //获取name标签
  105. //element("标签名"):获取调用者指定的子标签
  106. Element nameElement = element.element("name");
  107. //获取这个标签的标签体内容
  108. String name = nameElement.getText();
  109. //获取age标签
  110. Element ageElement = element.element("age");
  111. //获取age标签的标签体内容
  112. String age = ageElement.getText();
  113. // System.out.println(id);
  114. // System.out.println(name);
  115. // System.out.println(age);
  116. Student s = new Student(id,name,Integer.parseInt(age));
  117. list.add(s);
  118. }
  119. //遍历操作
  120. for (Student student : list) {
  121. System.out.println(student);
  122. }
  123. }
  124. }

1.5DTD约束【理解】

  • 什么是约束

    1. 用来限定xml文件中可使用的标签以及属性
  • 约束的分类

    • DTD
    • schema
  • 编写DTD约束

    • 步骤

      1. 创建一个文件,这个文件的后缀名为.dtd
      2. 看xml文件中使用了哪些元素

        1. <!ELEMENT> 可以定义元素
      3. 判断元素是简单元素还是复杂元素

简单元素:没有子元素。
复杂元素:有子元素的元素;

  • 代码实现
    1. <!ELEMENT persons (person)>
    2. <!ELEMENT person (name,age)>
    3. <!ELEMENT name (#PCDATA)>
    4. <!ELEMENT age (#PCDATA)>
  • 引入DTD约束
    • 引入DTD约束的三种方法
      • 引入本地dtd
      • 在xml文件内部引入
      • 引入网络dtd
    • 代码实现
      • 引入本地DTD约束 ```xml // 这是persondtd.dtd文件中的内容,已经提前写好 <!ELEMENT persons (person)> <!ELEMENT person (name,age)> <!ELEMENT name (#PCDATA)> <!ELEMENT age (#PCDATA)>

// 在person1.xml文件中引入persondtd.dtd约束 <?xml version=”1.0” encoding=”UTF-8” ?> <!DOCTYPE persons SYSTEM ‘persondtd.dtd’>

张三 23

  1. - xml文件内部引入
  2. ```xml
  3. <?xml version="1.0" encoding="UTF-8" ?>
  4. <!DOCTYPE persons [
  5. <!ELEMENT persons (person)>
  6. <!ELEMENT person (name,age)>
  7. <!ELEMENT name (#PCDATA)>
  8. <!ELEMENT age (#PCDATA)>
  9. ]>
  10. <persons>
  11. <person>
  12. <name>张三</name>
  13. <age>23</age>
  14. </person>
  15. </persons>
  1. - 引入网络dtd
  1. <?xml version="1.0" encoding="UTF-8" ?>
  2. <!DOCTYPE persons PUBLIC "dtd文件的名称" "dtd文档的URL">
  3. <persons>
  4. <person>
  5. <name>张三</name>
  6. <age>23</age>
  7. </person>
  8. </persons>
  • DTD语法
    • 定义元素
    • 定义一个元素的格式为:<!ELEMENT 元素名 元素类型>
    • 简单元素:

EMPTY: 表示标签体为空
ANY: 表示标签体可以为空也可以不为空
PCDATA: 表示该元素的内容部分为字符串

  • 复杂元素:

直接写子元素名称. 多个子元素可以使用”,”或者”|”隔开;
“,”表示定义子元素的顺序 ; “|”: 表示子元素只能出现任意一个
“?”零次或一次, “+”一次或多次, “*”零次或多次;如果不写则表示出现一次
03_DTD语法定义元素.png

  • 定义属性

格式
定义一个属性的格式为:<!ATTLIST 元素名称 属性名称 属性的类型 属性的约束>
属性的类型:
CDATA类型:普通的字符串
属性的约束:
// #REQUIRED: 必须的
// #IMPLIED: 属性不是必需的
// #FIXED value:属性值是固定的

  • 代码实现 ```xml <!ELEMENT persons (person+)> <!ELEMENT person (name,age)> <!ELEMENT name (#PCDATA)> <!ELEMENT age (#PCDATA)> <!ATTLIST person id CDATA #REQUIRED>

<?xml version=”1.0” encoding=”UTF-8” ?> <!DOCTYPE persons SYSTEM ‘persondtd.dtd’>

张三 23

张三 23

  1. ```
  2. <a name="TdtCm"></a>
  3. ### 1.6schema约束【理解】
  4. - schema和dtd的区别
  5. 1. schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd
  6. 2. 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于java包名)
  7. 3. dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个数据类型
  8. 4. schema 语法更加的复杂
  9. ![04_schema约束介绍.png](https://cdn.nlark.com/yuque/0/2023/png/22016332/1684754733998-a6b76004-123c-45c8-8ddd-23c18365e105.png#averageHue=%23f4f2f2&clientId=u4093414f-e3b1-4&from=paste&height=157&id=u26901539&originHeight=196&originWidth=844&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=18834&status=done&style=none&taskId=u9054f30c-37a7-4456-b535-d66aaf58f0f&title=&width=675.2)
  10. - 编写schema约束
  11. 步骤
  12. - 1,创建一个文件,这个文件的后缀名为.xsd。
  13. - 2,定义文档声明
  14. - 3,schema文件的根标签为: <schema>
  15. - 4,在<schema>中定义属性:
  16. xmlns=[http://www.w3.org/2001/XMLSchema](http://www.w3.org/2001/XMLSchema)
  17. - 5,在<schema>中定义属性 :
  18. targetNamespace =唯一的url地址,指定当前这个schema文件的名称空间。
  19. - 6,在<schema>中定义属性 :
  20. elementFormDefault="qualified“,表示当前schema文件是一个质量良好的文件。
  21. - 7,通过element定义元素
  22. - 8,判断当前元素是简单元素还是复杂元素
  23. ![05_schema约束编写.png](https://cdn.nlark.com/yuque/0/2023/png/22016332/1684754768830-91fdaf42-518b-457b-a4ba-a689f653dc1c.png#averageHue=%23f7f6f6&clientId=u4093414f-e3b1-4&from=paste&height=487&id=u9be36d10&originHeight=609&originWidth=1087&originalType=binary&ratio=1.25&rotation=0&showTitle=false&size=163675&status=done&style=none&taskId=ud1e34928-5f78-46cc-ab20-9355b41de63&title=&width=869.6)
  24. - 代码实现
  25. ```xml
  26. <?xml version="1.0" encoding="UTF-8" ?>
  27. <schema
  28. xmlns="http://www.w3.org/2001/XMLSchema"
  29. targetNamespace="http://www.itheima.cn/javase"
  30. elementFormDefault="qualified"
  31. >
  32. <!--定义persons复杂元素-->
  33. <element name="persons">
  34. <complexType>
  35. <sequence>
  36. <!--定义person复杂元素-->
  37. <element name = "person">
  38. <complexType>
  39. <sequence>
  40. <!--定义nameage简单元素-->
  41. <element name = "name" type = "string"></element>
  42. <element name = "age" type = "string"></element>
  43. </sequence>
  44. </complexType>
  45. </element>
  46. </sequence>
  47. </complexType>
  48. </element>
  49. </schema>
  • 引入schema约束

步骤

  • 1,在根标签上定义属性xmlns=”http://www.w3.org/2001/XMLSchema-instance
  • 2,通过xmlns引入约束文件的名称空间
  • 3,给某一个xmlns属性添加一个标识,用于区分不同的名称空间

    格式为: xmlns:标识=“名称空间地址” ,标识可以是任意的,但是一般取值都是xsi

  • 4,通过xsi:schemaLocation指定名称空间所对应的约束文件路径

    1. 格式为:xsi:schemaLocation = "名称空间url 文件路径“
  • 代码实现 ```xml <?xml version=”1.0” encoding=”UTF-8” ?>

张三 23

  1. ```
  2. - schema约束定义属性
  3. - 代码示例
  4. ```xml
  5. <?xml version="1.0" encoding="UTF-8" ?>
  6. <schema
  7. xmlns="http://www.w3.org/2001/XMLSchema"
  8. targetNamespace="http://www.itheima.cn/javase"
  9. elementFormDefault="qualified"
  10. >
  11. <!--定义persons复杂元素-->
  12. <element name="persons">
  13. <complexType>
  14. <sequence>
  15. <!--定义person复杂元素-->
  16. <element name = "person">
  17. <complexType>
  18. <sequence>
  19. <!--定义nameage简单元素-->
  20. <element name = "name" type = "string"></element>
  21. <element name = "age" type = "string"></element>
  22. </sequence>
  23. <!--定义属性,required( 必须的)/optional( 可选的)-->
  24. <attribute name="id" type="string" use="required"></attribute>
  25. </complexType>
  26. </element>
  27. </sequence>
  28. </complexType>
  29. </element>
  30. </schema>
  31. <?xml version="1.0" encoding="UTF-8" ?>
  32. <persons
  33. xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  34. xmlns="http://www.itheima.cn/javase"
  35. xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
  36. >
  37. <person id="001">
  38. <name>张三</name>
  39. <age>23</age>
  40. </person>
  41. </persons>

```