1.xml

1.1 概述【理解】

  • XML概述
    • XML的全称为(EXtensible Markup Language),是一种可扩展的标记语言
    • 标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素)
    • 可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的
  • 作用
    • 用于进行存储数据和传输数据 JSON
    • 作为软件的配置文件
  • 作为配置文件的优势
    • 可读性好
    • 可维护性高

1.2 标签的规则【应用】

  • 标签由一对尖括号和合法标识符组成

    1. <student>
  • 标签必须成对出现

    1. <student> </student>
    2. 前边的是开始标签,后边的是结束标签
  • 特殊的标签可以不成对,但是必须有结束标记

    1. <address/>
  • 标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来

    1. <student id="1"> </student>
  • 标签需要正确的嵌套

    1. 这是正确的: <student id="1"> <name>张三</name> </student>
    2. 这是错误的: <student id="1"><name>张三</student></name>

1.3 语法规则【应用】

  • 语法规则

    • XML文件的后缀名为:xml
    • 文档声明必须是第一行第一列
      version:该属性是必须存在的
      encoding:该属性不是必须的,打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)
      standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no
    • 必须存在一个根标签,有且只能有一个
    • XML文件中可以定义注释信息
    • XML文件中可以存在以下特殊字符

      1. &lt; < 小于
      2. &gt; > 大于
      3. &amp; & 和号
      4. &apos; ' 单引号
      5. &quot; " 引号
    • XML文件中可以存在CDATA区

  • 示例代码

    1. <?xml version="1.0" encoding="UTF-8" ?>
    2. <!--注释的内容-->
    3. <!--本xml文件用来描述多个学生信息-->
    4. <students>
    5. <!--第一个学生信息-->
    6. <student id="1">
    7. <name>张三</name>
    8. <age>23</age>
    9. <info>学生&lt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;的信息</info>
    10. <message> <![CDATA[内容 <<<<<< >>>>>>]]></message>
    11. </student>
    12. <!--第二个学生信息-->
    13. <student id="2">
    14. <name>李四</name>
    15. <age>24</age>
    16. </student>
    17. </students>

1.4 xml解析【应用】

  • 概述
    xml解析就是从xml中获取到数据
  • 常见的解析思想
    DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。
    会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值02_dom解析概述.png
  • 常见的解析工具
    • JAXP:SUN公司提供的解析器,支持DOM和SAX两种思想
    • DOM4J:开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java
    • Jsoup:
      • Jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。
      • 它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。
    • PULL:Android操作系统内置的解析器,SAX方式的。
  • 解析的准备工作
    1. 我们可以通过网站:https://dom4j.github.io/ 去下载dom4j
    2. 将提供好的dom4j-1.6.1.zip解压,找到里面的dom4j-1.6.1.jar
    3. 在idea中当前模块下新建一个libs文件夹,将jar包复制到文件夹中
    4. 选中jar包 -> 右键 -> 选择add as library即可
  • 需求
    • 解析提供好的xml文件
    • 将解析到的数据封装到学生对象中
    • 并将学生对象存储到ArrayList集合中
    • 遍历集合
  • 代码实现 ```java <?xml version=”1.0” encoding=”UTF-8” ?>

    张三 23 李四 24

// 上边是已经准备好的student.xml文件 public class Student { private String id; private String name; private int age;

  1. public Student() {
  2. }
  3. public Student(String id, String name, int age) {
  4. this.id = id;
  5. this.name = name;
  6. this.age = age;
  7. }
  8. public String getId() {
  9. return id;
  10. }
  11. public void setId(String id) {
  12. this.id = id;
  13. }
  14. public String getName() {
  15. return name;
  16. }
  17. public void setName(String name) {
  18. this.name = name;
  19. }
  20. public int getAge() {
  21. return age;
  22. }
  23. public void setAge(int age) {
  24. this.age = age;
  25. }
  26. @Override
  27. public String toString() {
  28. return "Student{" +
  29. "id='" + id + '\'' +
  30. ", name='" + name + '\'' +
  31. ", age=" + age +
  32. '}';
  33. }

}

/**

  • 利用dom4j解析xml文件 */ public class XmlParse { public static void main(String[] args) throws DocumentException {

    1. //1.获取一个解析器对象
    2. SAXReader saxReader = new SAXReader();
    3. //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
    4. Document document = saxReader.read(new File("myxml\\xml\\student.xml"));
    5. //3.获取到根标签
    6. Element rootElement = document.getRootElement();
    7. //4.通过根标签来获取student标签
    8. //elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
    9. //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集合中并返回
    10. //List list = rootElement.elements();
    11. List<Element> studentElements = rootElement.elements("student");
    12. //System.out.println(list.size());
    13. //用来装学生对象
    14. ArrayList<Student> list = new ArrayList<>();
    15. //5.遍历集合,得到每一个student标签
    16. for (Element element : studentElements) {
    17. //element依次表示每一个student标签
    18. //获取id这个属性
    19. Attribute attribute = element.attribute("id");
    20. //获取id的属性值
    21. String id = attribute.getValue();
    22. //获取name标签
    23. //element("标签名"):获取调用者指定的子标签
    24. Element nameElement = element.element("name");
    25. //获取这个标签的标签体内容
    26. String name = nameElement.getText();
    27. //获取age标签
    28. Element ageElement = element.element("age");
    29. //获取age标签的标签体内容
    30. String age = ageElement.getText();

// System.out.println(id); // System.out.println(name); // System.out.println(age); Student s = new Student(id,name,Integer.parseInt(age)); list.add(s); } //遍历操作 for (Student student : list) { System.out.println(student); } } }

  1. <a name="97d41160"></a>
  2. ### 1.5 DTD约束【理解】
  3. - 什么是约束<br />用来限定xml文件中可使用的标签以及属性
  4. - 约束的分类
  5. - DTD
  6. - schema
  7. - 编写DTD约束
  8. - 步骤
  9. 1. 创建一个文件,这个文件的后缀名为.dtd
  10. 1. 看xml文件中使用了哪些元素 可以定义元素
  11. 1. 判断元素是简单元素还是复杂元素<br />简单元素:没有子元素。<br />复杂元素:有子元素的元素;
  12. - 代码实现
  13. ```java
  14. <!ELEMENT students (student)>
  15. <!ELEMENT student (name,age)>
  16. <!ELEMENT name (#PCDATA)>
  17. <!ELEMENT age (#PCDATA)>
  • 引入DTD约束

    • 引入DTD约束的三种方法

      • 引入本地dtd

        1. <!DOCTYPE 根元素名称 SYSTEM ‘DTD文件的路径'>
      • 在xml文件内部引入

        1. <!DOCTYPE 根元素名称 [ dtd文件内容 ]>
      • 引入网络dtd

        1. <!DOCTYPE 根元素的名称 PUBLIC "DTD文件名称" "DTD文档的URL">
    • 代码实现

      • 引入本地DTD约束 ```xml // 这是persondtd.dtd文件中的内容,已经提前写好 <!ELEMENT persons (person)> <!ELEMENT person (name,age)> <!ELEMENT name (#PCDATA)> <!ELEMENT age (#PCDATA)>

// 在person1.xml文件中引入persondtd.dtd约束 <?xml version=”1.0” encoding=”UTF-8” ?> <!DOCTYPE persons SYSTEM ‘persondtd.dtd’>

张三 23

  1. - xml文件内部引入
  2. ```xml
  3. <?xml version="1.0" encoding="UTF-8" ?>
  4. <!DOCTYPE persons [
  5. <!ELEMENT persons (person)>
  6. <!ELEMENT person (name,age)>
  7. <!ELEMENT name (#PCDATA)>
  8. <!ELEMENT age (#PCDATA)>
  9. ]>
  10. <persons>
  11. <person>
  12. <name>张三</name>
  13. <age>23</age>
  14. </person>
  15. </persons>
  1. - 引入网络dtd
  1. <?xml version="1.0" encoding="UTF-8" ?>
  2. <!DOCTYPE persons PUBLIC "dtd文件的名称" "dtd文档的URL">
  3. <persons>
  4. <person>
  5. <name>张三</name>
  6. <age>23</age>
  7. </person>
  8. </persons>
  • DTD语法
    • 定义元素
      定义一个元素的格式为:
      简单元素:
      EMPTY: 表示标签体为空
      ANY: 表示标签体可以为空也可以不为空
      PCDATA: 表示该元素的内容部分为字符串
      复杂元素:
      直接写子元素名称. 多个子元素可以使用”,”或者”|”隔开;
      “,”表示定义子元素的顺序 ; “|”: 表示子元素只能出现任意一个
      “?”零次或一次, “+”一次或多次, “*”零次或多次;如果不写则表示出现一次03_DTD语法定义元素.png
    • 定义属性
      格式
      定义一个属性的格式为:
      属性的类型:
      CDATA类型:普通的字符串
      属性的约束:
      #REQUIRED: 必须的
      #IMPLIED: 属性不是必需的
      #FIXED value:属性值是固定的
    • 代码实现 ```java <!ELEMENT persons (person+)> <!ELEMENT person (name,age)> <!ELEMENT name (#PCDATA)> <!ELEMENT age (#PCDATA)> <!ATTLIST person id CDATA #REQUIRED>

<?xml version=”1.0” encoding=”UTF-8” ?> <!DOCTYPE persons SYSTEM ‘persondtd.dtd’>

张三 23

  1. <person id = "002">
  2. <name>张三</name>
  3. <age>23</age>
  4. </person>

  1. ```
  2. <a name="0ddfcd87"></a>
  3. ### 1.6 schema约束【理解】
  4. - schema和dtd的区别![05_schema约束编写.png](https://cdn.nlark.com/yuque/0/2021/png/13018777/1618830763797-5aceebd4-0be1-4afa-93ce-1c36316d7e48.png#align=left&display=inline&height=609&margin=%5Bobject%20Object%5D&name=05_schema%E7%BA%A6%E6%9D%9F%E7%BC%96%E5%86%99.png&originHeight=609&originWidth=1087&size=163675&status=done&style=none&width=1087)
  5. 1. schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd
  6. 1. 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于java包名)
  7. 1. dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个数据类型
  8. 1. schema 语法更加的复杂
  9. ![04_schema约束介绍.png](https://cdn.nlark.com/yuque/0/2021/png/13018777/1618830745410-62aecc5e-562f-44c6-851f-2cafe7570ee9.png#align=left&display=inline&height=196&margin=%5Bobject%20Object%5D&name=04_schema%E7%BA%A6%E6%9D%9F%E4%BB%8B%E7%BB%8D.png&originHeight=196&originWidth=844&size=18834&status=done&style=none&width=844)
  10. - 编写schema约束
  11. - 步骤<br />1,创建一个文件,这个文件的后缀名为.xsd。<br />2,定义文档声明<br />3,schema文件的根标签为: <br />4,在中定义属性:<br /> xmlns=http://www.w3.org/2001/XMLSchema<br />5,在中定义属性 :<br /> targetNamespace =唯一的url地址,指定当前这个schema文件的名称空间。<br />6,在中定义属性 :<br /> elementFormDefault="qualified“,表示当前schema文件是一个质量良好的文件。<br />7,通过element定义元素<br />8,判断当前元素是简单元素还是复杂元素![05_schema约束编写.png](https://cdn.nlark.com/yuque/0/2021/png/13018777/1618830773468-12b0ec1e-36c2-4680-b2a2-89e8da902083.png#align=left&display=inline&height=609&margin=%5Bobject%20Object%5D&name=05_schema%E7%BA%A6%E6%9D%9F%E7%BC%96%E5%86%99.png&originHeight=609&originWidth=1087&size=163675&status=done&style=none&width=1087)
  12. - 代码实现
  13. ```java
  14. <?xml version="1.0" encoding="UTF-8" ?>
  15. <schema
  16. xmlns="http://www.w3.org/2001/XMLSchema"
  17. targetNamespace="http://www.itheima.cn/javase"
  18. elementFormDefault="qualified">
  19. <!--定义persons复杂元素-->
  20. <element name="persons">
  21. <complexType>
  22. <sequence>
  23. <!--定义person复杂元素-->
  24. <element name = "person">
  25. <complexType>
  26. <sequence>
  27. <!--定义nameage简单元素-->
  28. <element name = "name" type = "string"></element>
  29. <element name = "age" type = "string"></element>
  30. </sequence>
  31. </complexType>
  32. </element>
  33. </sequence>
  34. </complexType>
  35. </element>
  36. </schema>
  • 引入schema约束

    • 步骤
      1,在根标签上定义属性xmlns=”http://www.w3.org/2001/XMLSchema-instance
      2,通过xmlns引入约束文件的名称空间
      3,给某一个xmlns属性添加一个标识,用于区分不同的名称空间
      格式为: xmlns:标识=“名称空间地址” ,标识可以是任意的,但是一般取值都是xsi
      4,通过xsi:schemaLocation指定名称空间所对应的约束文件路径
      格式为:xsi:schemaLocation = “名称空间url 文件路径“
    • 代码实现
      1. <?xml version="1.0" encoding="UTF-8" ?>
      2. <persons
      3. xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      4. xmlns="http://www.itheima.cn/javase"
      5. xsi:schemaLocation="http://www.itheima.cn/javase person.xsd">
      6. <person>
      7. <name>张三</name>
      8. <age>23</age>
      9. </person>
      10. </persons>
  • schema约束定义属性

<?xml version=”1.0” encoding=”UTF-8” ?>

张三 23 ```