XML簡明教程

、XML是什么？

萬維網協會推出的一套數據交換標準——XML，是一種可擴展的標記語言，被設計用來傳輸和存儲數據。XML 可用于定義 Web 網頁上的文檔元素以及復雜數據的表述和傳輸。

Extensible Markup Language，簡稱 XML，中文含義是可擴展標記語言，該語言與 HTML 類似，主要功能是傳輸數據、儲存數據和共享數據。XML 語言沒有規定的標簽體，需要自定義標簽，是一種自我描述的語言。XML 與 HTML 有著本質的區別，XML 傳輸和存儲數據，而 HTML 用來顯示數據。

XML 的最大特點是自我描述和任意擴展，當用其描述數據時，用戶可以根據需要，組織符合 XML 規范形式的任意內容，并且標簽的名稱也可以由用戶指定。

圖片來源網絡

二、XML的結構

例如，一個描述書籍的XML文檔可能如下：

<?xml version="1.0" encoding="UTF-8" ?> <!-- 文檔聲明，默認編碼為UTF-8 --><!DOCTYPE note SYSTEM "book.dtd"><book id="1">    <name>Java核心技術</name>    <author>Cay S. Horstmann</author>    <isbn lang="CN">1234567</isbn>    <tags>        <tag>Java</tag>        <tag>Network</tag>    </tags>    <pubDate/></book>

XML有固定的結構，首行必定是<?xml version="1.0"?>，可以加上可選的編碼。緊接著，如果以類似<!DOCTYPE note SYSTEM "book.dtd">聲明的是文檔定義類型（DTD：Document Type Definition），DTD是可選的。接下來是XML的文檔內容，一個XML文檔有且僅有一個根元素，根元素可以包含任意個子元素，元素可以包含屬性，例如，<isbn lang="CN">1234567</isbn>包含一個屬性lang="CN"，且元素必須正確嵌套。如果是空元素，可以用<tag/>表示。

XML有幾個特點：一是純文本，默認使用UTF-8編碼，二是可嵌套，適合表示結構化數據。如果把XML內容存為文件，那么它就是一個XML文件，例如book.xml。此外，XML內容經常通過網絡作為消息傳輸。

三、一些重要語法規則和知識

所有 XML 元素都須有關閉標簽

在 HTML，經常會看到沒有關閉標簽的元素：

<p>This is a paragraph<p>This is another paragraph

在 XML 中，省略關閉標簽是非法的。所有元素都必須有關閉標簽：

<p>This is a paragraph</p><p>This is another paragraph</p>

注釋：您也許已經注意到 XML 聲明沒有關閉標簽。這不是錯誤。聲明不屬于XML本身的組成部分。它不是 XML 元素，也不需要關閉標簽。

XML 標簽對大小寫敏感

XML 元素使用 XML 標簽進行定義。

XML 標簽對大小寫敏感。在 XML 中，標簽 <Letter> 與標簽 <letter> 是不同的。

必須使用相同的大小寫來編寫打開標簽和關閉標簽：

<Message>這是錯誤的。</message><message>這是正確的。</message>

注釋：打開標簽和關閉標簽通常被稱為開始標簽和結束標簽。不論您喜歡哪種術語，它們的概念都是相同的。

XML 必須正確地嵌套

在 HTML 中，常會看到沒有正確嵌套的元素：

<b><i>This text is bold and italic</b></i>

在 XML 中，所有元素都必須彼此正確地嵌套：

<b><i>This text is bold and italic</i></b>

在上例中，正確嵌套的意思是：由于 <i> 元素是在 <b> 元素內打開的，那么它必須在 <b> 元素內關閉。

XML 文檔必須有根元素

所有的 XML 文檔有且只有一個根元素來定義整個文檔。

XML 文檔必須有一個元素是所有其他元素的父元素。該元素稱為根元素。

<root>  <child>    <subchild>.....</subchild>  </child></root>

XML 的屬性值須加引號

與 HTML 類似，XML 也可擁有屬性（名稱/值的對）。

在 XML 中，XML 的屬性值須加引號。請研究下面的兩個 XML 文檔。第一個是錯誤的，第二個是正確的：

<note date=08/08/2008><to>George</to><from>John</from></note> <note date="08/08/2008"><to>George</to><from>John</from></note>

在第一個文檔中的錯誤是，note 元素中的 date 屬性沒有加引號。

實體引用

在 XML 中，一些字符擁有特殊的意義。

如果你把字符 "<" 放在 XML 元素中，會發生錯誤，這是因為解析器會把它當作新元素的開始。

這樣會產生 XML 錯誤：

<message>if salary < 1000 then</message>

為了避免這個錯誤，請用實體引用來代替 "<" 字符：

<message>if salary < 1000 then</message>

在 XML 中，有 5 個預定義的實體引用：

<<小于>>大于&&和號''單引號""引號

注釋：在 XML 中，只有字符 "<" 和 "&" 確實是非法的。大于號是合法的，但是用實體引用來代替它是一個好習慣。

XML 中的注釋

在 XML 中編寫注釋的語法與 HTML 的語法很相似：

<!-- This is a comment -->

在 XML 中，空格會被保留

HTML 會把多個連續的空格字符裁減（合并）為一個.在 XML 中，文檔中的空格不會被刪節。

XML 以 LF 存儲換行

在 Windows 應用程序中，換行通常以一對字符來存儲：回車符 (CR) 和換行符 (LF)。這對字符與打字機設置新行的動作有相似之處。在 Unix 應用程序中，新行以 LF 字符存儲。而 Macintosh 應用程序使用 CR 來存儲新行。

什么是 XML 元素？

XML 元素指的是從（且包括）開始標簽直到（且包括）結束標簽的部分。

元素可包含其他元素、文本或者兩者的混合物。元素也可以擁有屬性。

<bookstore><book category="CHILDREN">  <title>Harry Potter</title>   <author>J K. Rowling</author>   <year>2005</year>   <price>29.99</price> </book><book category="WEB">  <title>Learning XML</title>   <author>Erik T. Ray</author>   <year>2003</year>   <price>39.95</price> </book></bookstore>

在上例中，<bookstore> 和<book>都擁有元素內容，因為它們包含了其他元素。<author>只有文本內容，因為它僅包含文本。

在上例中，只有 <book> 元素擁有屬性 (category="CHILDREN")。

XML 命名規則

XML 元素必須遵循以下命名規則：

名稱可以含字母、數字以及其他的字符
名稱不能以數字或者標點符號開始
名稱不能以字符 “xml”（或者 XML、Xml）開始
名稱不能包含空格

可使用任何名稱，沒有保留的字詞。

最佳命名習慣

使名稱具有描述性。使用下劃線的名稱也很不錯。

名稱應當比較簡短，比如：<book_title>，而不是：<the_title_of_the_book>。

避免 "-" 字符。如果您按照這樣的方式進行命名："first-name"，一些軟件會認為你需要提取第一個單詞。

避免 "." 字符。如果您按照這樣的方式進行命名："first.name"，一些軟件會認為 "name" 是對象 "first" 的屬性。

避免 ":" 字符。冒號會被轉換為命名空間來使用（稍后介紹）。

XML 文檔經常有一個對應的數據庫，其中的字段會對應 XML 文檔中的元素。有一個實用的經驗，即使用數據庫的名稱規則來命名 XML 文檔中的元素。

非英語的字母比如 éòá 也是合法的 XML 元素名，不過需要留意當軟件開發商不支持這些字符時可能出現的問題。

XML 屬性

從 HTML，你會回憶起這個：<img src="computer.gif">。"src" 屬性提供有關<img> 元素的額外信息。

在 HTML 中（以及在 XML 中），屬性提供有關元素的額外信息：

<img src="computer.gif"><a href="demo.asp">

屬性通常提供不屬于數據組成部分的信息。在下面的例子中，文件類型與數據無關，但是對需要處理這個元素的軟件來說卻很重要：

<file type="gif">computer.gif</file>

XML 屬性必須加引號

屬性值必須被引號包圍，不過單引號和雙引號均可使用。比如一個人的性別，person 標簽可以這樣寫：

<person sex="female">

或者這樣也可以：

<person sex='female'>

注釋：如果屬性值本身包含雙引號，那么有必要使用單引號包圍它，就像這個例子：

<gangster name='George "Shotgun" Ziegler'>

或者可以使用實體引用：

<gangster name="George "Shotgun" Ziegler">

四、XML拓展和高級用法

JDK 中的 XML API
DOM 解析 XML
SAX解析XML
DOM4j解析XML
XML CDATA
……

可參閱：

w3school:https://www.w3school.com.cn/xml/index.asp
C語言中文網：http://c.biancheng.net/view/1632.html
廖雪峰Java教程：https://www.liaoxuefeng.com/wiki/1252599548343744/1255945389334784

本文由以上文章整理

點擊下方“了解更多”查看網頁原文，謝謝您的關注！

SVG（Scalable Vector Graphics）是一種基于XML的2D矢量圖形格式，可以實現圖像的無損縮放和高清晰度顯示。在HTML中嵌入SVG圖像，可以使網頁更加生動有趣，提高用戶體驗

<svg width="54" height="54" class="c-nav--footer__svgicon c-slackhash" viewBox="0 0 54 54" xmlns="http://www.w3.org/2000/svg">
<g fill="none" fill-rule="evenodd">
<path d="M19.712.133a5.381 5.381 0 0 0-5.376 5.387 5.381 5.381 0 0 0 5.376 5.386h5.376V5.52A5.381 5.381 0 0 0 19.712.133m0 14.365H5.376A5.381 5.381 0 0 0 0 19.884a5.381 5.381 0 0 0 5.376 5.387h14.336a5.381 5.381 0 0 0 5.376-5.387 5.381 5.381 0 0 0-5.376-5.386" fill="#44BEDF">
</path>
<path d="M53.76 19.884a5.381 5.381 0 0 0-5.376-5.386 5.381 5.381 0 0 0-5.376 5.386v5.387h5.376a5.381 5.381 0 0 0 5.376-5.387m-14.336 0V5.52A5.381 5.381 0 0 0 34.048.133a5.381 5.381 0 0 0-5.376 5.387v14.364a5.381 5.381 0 0 0 5.376 5.387 5.381 5.381 0 0 0 5.376-5.387" fill="#2EB67D">
</path>
<path d="M34.048 54a5.381 5.381 0 0 0 5.376-5.387 5.381 5.381 0 0 0-5.376-5.386h-5.376v5.386A5.381 5.381 0 0 0 34.048 54m0-14.365h14.336a5.381 5.381 0 0 0 5.376-5.386 5.381 5.381 0 0 0-5.376-5.387H34.048a5.381 5.381 0 0 0-5.376 5.387 5.381 5.381 0 0 0 5.376 5.386" fill="#ECB22E">
</path>
<path d="M0 34.249a5.381 5.381 0 0 0 5.376 5.386 5.381 5.381 0 0 0 5.376-5.386v-5.387H5.376A5.381 5.381 0 0 0 0 34.25m14.336-.001v14.364A5.381 5.381 0 0 0 19.712 54a5.381 5.381 0 0 0 5.376-5.387V34.25a5.381 5.381 0 0 0-5.376-5.387 5.381 5.381 0 0 0-5.376 5.387" fill="#E01E5A">
</path>
</g>
</svg>

ML；
是什么？
Extensible Markup Languare 可擴展標記型語言

為什么要有XML？
1.HTML的標簽是固定的，不可以改變，也不可以進行一個···擴展
2.HTML語法松散

作用；
制作配置文件；如組件類。。。。。
存儲數據；存儲少量的數據

◆◆◆注；XML不是HTML的升級版，因為應用的領域不一樣。
XML是描寫關系型的數據
HTML是描述頁面的數據顯示效果

--------------------------------------------ＸＭＬ和ＨＴＭＬ的區別--------------------------------------------------------------------

XML和HTML的區別；
A、HTML是將數據和顯示的效果混合在一起，描述了數據的顯示效果，
-----而且標簽是固定，而且語法松散

B、XML是將數據和顯示的效果是分離的，只是描述了數據之間的關系和存儲的格式，
-----沒有描述數據的顯示效果，沒有一套具體的標簽，只是一個規范。

XML適用金融，科學等有關系型的領域

XML的重點是；處理數據，和數據結構

◆注；引入外部CSS文件，對XML標簽進行一個修飾，
<>xml-stylesheet tyep="text/css" href="">

--------------------------------------------ＸＭＬ的特點--------------------------------------------------------------------

XML特點；
1.語法嚴謹，區分大小寫
2.標簽名可以是中文
3.文件后綴是 .xml
4.換行也是算一個元素
5.可以自定義標簽
6.id不可以以數字開頭

存儲數據的方式；
* XML 存儲關系型的數據
* properties 存儲key，value的數據
* 文本什么都可以存儲
* 數據庫

--------------------------------------------ＸＭＬ的語法--------------------------------------------------------------------

XML語法；
1.文檔聲明 Document declaration；
版本編碼集是否與其他文件關聯
<?xml vaersion="1.0" encoding="編碼集" standalone="no默認" ?>

2.元素 Element；
1.自定義標簽；建議標簽名全部小寫，保持與HTML的書寫習慣，
因為出現同名的大小寫不便于閱讀
2.成對出現
3.閉合標簽和結束體標簽
4.符合邏輯嵌套

3.屬性 Attribute；
1.屬性名小寫，屬性也是可以自定義的，
2.屬性值要使用 "" 或 ''，id不可以以數字開頭
3.多個屬性要使用空格隔開
4.可以將屬性作為一個子標簽，因為XML用途不是用于顯示頁面的

4.注釋 Comment；
1. 和HTML一樣
2.注釋不可以嵌套

5.CDATA；
1.XML的轉義字符基本和HTML一致。
2.如果需要轉義的字符太多了則可以使 CDATA
3.CDATA可以將一段字符串原樣的輸出

<![CDATA[字符串]]>

6.處理指令；
1.處理指令時告知解析引擎是要如何處理文檔的。
2.處理指令必須使用 <? ?>

<?xml-stylesheet type="text/css" href="路徑">

◆注；
1.XML必須要有一個根節點
2.XML不會在頁面顯示
3.縮進寫法適合閱讀

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓ＸＭＬ—— 文件結構↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

◆◆◆注； XML文檔必須要有一個根節點◆◆◆

XML文件結構；
Node
|--- Element
|--- Attr
|--- Comment
|--- Text
|--- Document

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓ＸＭＬ—— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

xml解析；
為什么要有？
因為XML主要是用于存儲數據，做配置文件.......
那么XML的數據的···取出···可以通過解析技術可以實現.....

而讀取XML文件；
1.IO ---- 讀取出來的數據不是理想的數據。
2.DOM解析 ---- DOM4J 是一個開源的解析技術
3.SAX解析 ---- SAX 是SUN公司定義的，比較規范，SAX里面也是有使用了DOM4J的技術

解析技術；
1.DOM4J 是一個開源組織的
2.JAXP 是SUN公司定義的
|-- DOM
|-- SAX

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓ＤＯＭ—— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

DOM解析；
特點；1.是一次性裝載這個文件到內存中，不利于大文件存取操作，
2.適合增刪改查，因為一次是整個文件加載，無需在到硬盤對文件中的內容一個一個去查找
3.在內存中是一棵倒掛的樹
4.DOM是解析XML的底層接口之一
5.是W3C定義的
6.DOM是一個規范，而DOM4J是一個實現了這個規范的解析技術

DOM4J；
1.是DOM解析的一個實現解析技術（如同實現類）
2.特點和DOM一樣，也是一棵倒立的樹型形狀。
3.不是W3C定義的，是一個開源團隊發布的

DOM4J；也是一個組件，而這個組件也是需要下載的，

-----------------------------------------------ＤＯＭ４Ｊ獲取XML文件的方式--------------------------------------------------------------------

◆◆◆注；注意導包的路徑。

DOM4J獲取文件的三種方式；
1.通過解析器的方法傳入一個絕對路徑

a.創建解析器
★ SAXReader sr=new SAXReader();

b.調用解析器的read方法獲取XML文檔，使用文檔對象接收

★ Document doc=sr.read("絕對路徑");

2.通過解析器的方法傳入一個相對路徑

a.創建解析器
★ SAXReader sr=new SAXReader();

b.調用解析器的read()方法，獲取到XML文檔，使用文檔對象接收

★ Document doc=sr.read("相對路徑");

3.通過類的getResourceAsStream("/文件名")方法

a.通過運行時類的對象的getResourceAsStream()的方法
---獲取到這個XML文檔的流

★InputStream is=類名.class.getResourceStream("/文件名");

b.創建解析器
★ SAXReader sr=new SAXReader();

c.調用解析器的read()方法傳入獲取到的XML文件流，使用文檔對象接收

★ Document doc=sr.read(is);

------------------------------------------ＤＯＭ４Ｊ獲取XML文件的元素方法--------------------------------------------------------------------

◆◆◆注；必須要先獲取到根節點，在根據根節點獲取到其他節點 ◆◆◆

DOM4J獲取元素方法； --- 使用Element Object調用

1.getRootElement() 獲取到根節點

2.elements(寫/沒寫) 只能寫子標簽，不可以寫孫標簽
沒寫；獲取到所有的子標簽標簽返回的是一個集合
寫了；獲取到指定標簽名的所有標簽

3.getName(); 獲取到標簽名
4.elementText() 獲取到標簽的內容
5.element() 獲取到指定標簽
6.elementById() 獲取到指定的Id標簽
7.elementIterator() 獲取到標簽迭代器
8.getQName() 獲取到標簽名

獲取屬性的方法；----使用 Element Object調用

1.attributeValue() 獲取到指定的屬性的值
2.attirbutes() 獲取到所有的屬性

添加的方法；----使用 Element Object 調用

1.addElement() 添加元素
2.addAttribute() 添加屬性
3.addCDATA() 添加CDATA
4.addText() 添加標簽內容

直接刪除元素方法；使用獲取到的元素對象，
◆ 調用detach()方法可以刪除這個元素和這個元素的所有子元素。

如；element.detach()

------------------------------------------ＤＯＭ４Ｊ刷新文件--------------------------------------------------------------------

DOM4J刷新文件；
1.聲明文件內容的寫入格式。
a.縮進格式；
OutputFormat of=OutputFormat.createPrettyPrint();

b.行內格式；
OutputFormat of=OutputFormat.createCompactFormat();

2.創建寫入器
XMLWriter writer=new XMLWriter("FileStream_Path","OutputFormat_Obj");

3.調用寫入器的方法寫入重寫寫入文件
writer.write("Document_Obj");

◆注；
1.將獲取到的XML文檔對象的內容轉換成一個字符串
String Document.asXML();

2.將字符串轉換成一個XML文檔對象
Document.DocumentHanper.parseText("String_Obj");

------------------------------------------ＤＯＭ４Ｊ創建 --> 寫入過程--------------------------------------------------------------------

◆◆◆注意導包◆◆◆

1.創建解析器對象；
SAXReader reader=new SAXReader()

2.調用解析器方法獲取到XML文檔；
Document doc=reader.read("String_Path");

3.獲取到根路徑；
Element doc.getRootElement();

---4.1；將獲取到的文檔對象轉換成字符串
String doc.asXML();

---4.2；將字符串解析成一個XML文檔對象
Document DocumnetHanper.parseText("String");

5.規定寫入XML文件的格式；
1.OutputFormat of=OutputFormat.createPattryPrint(); --- 縮進格式
2.OutputFormat of=OutputFormat.createCompactFormat(); --- 行內格式

6.創建寫入器；
XMLWriter writer=new XMLWriter("FileStream_Path",OutputFormat);

7.調用寫入器的寫入XML文件的方法；
writer.wirte(Document);

8.關閉流；
writer.close();

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓Ｘｐａｔｈ—— 查詢表達式↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

Xpath；
為什么要有？
在DOM4J中加載文件時，直接加載整個文件到內存中的，不便于獲取某一個指定的節點。

什么是Xpath？
1、是一個查詢表達式語言，也是一個開源的語言
2、在DOM4J中融合了這個Xpath這個查詢表達式語言
3、這個語言也是一個組件來的，但是在DOM4J組件中已經附帶了
dom4J --- lib --- jaxen-1.1-beta-6.jar

作用；
可以通過Xpath表達式快速定位到某一個XML文件的節點。

------------------------------------------Ｘｐａｔｈ—— 表達式符號　--------------------------------------------------------------------

表達式符號；
//x 相對定位到某節點
/x 絕對定位絕對定位到某一個節點
/* 是所有節點
[num] 第N個節點
[@x] 選中到某一個屬性
normalize-span 去空格
[text()] 獲取到內容

------------------------------------------Ｘｐａｔｈ—— 使用　--------------------------------------------------------------------

Xpath的使用；
DOM4J的selectNodes("表達式"); 方法
DOM4J的selectSingleNode("表達式"); 方法

Document .selectNodes() ------ 是返回所有節點的集合
Document .selectSingleNode("表達式") ----- 返回某一個具體的節點

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓ＪＡＸＰ —— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

JAXP解析技術；
是Sun公司開發的，是XML文檔解析技術的一個集合統稱。

包含；
DOM解析
一次性讀取整個文件到內存中。

SAX解析
讀取一行，解析一行，處理一行。

這2項解析技術都是由SUN公司制定的，較規范

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓ＪＡＸＰ——ＳＡＸ —— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

SAX解析技術；
為什么要有？
1.DOM4J不適合大文件的讀取，因為一次性加載整個文件。

是什么？
1.Simple API For XML 簡單的解析XML文檔API，是由SUN公司定義的一個解析技術，較規范。
2.也是融合了DOM4J的部分技術。

作用；
用于解析XML文檔的一個解析技術

特點；
一次讀取一行，解析一行，處理一行。

適合大文件的存取，不適合增刪改查。

◆注；由于是SUN公司開發的，而在Eclipse或MyEclipse中已經有了組件。

◆◆◆◆◆注；SAX解析主要是用于查詢，一般都不使用寫入操作，因為一般的XML文件都不會太大

-----------------------------------------ＳＡＸ獲取XML文件的方式--------------------------------------------------------------------

SAX獲取XML文件的方式；
只有 2 種，傳入的字符串是···絕對路徑···或···相對路徑···

-----------------------------------------ＳＡＸ獲取XML文件的流程 --------------------------------------------------------------------

SAX獲取XML文件的流程；
因為是SUN公司定義的所以也較規范，也定義了獲取XML文件的流程

1.獲取到解析器工廠對象
SAXParserFactory spf=SAXParserFactory.newInstance();

2.通過解析器工廠對象獲取到具體的解析器對象
SAXParser sp=spf.newSAXParser();

3.通過具體的解析器對象，獲取到讀取器
XMLReader reader=sp.getXMLReader()

4.通過調用讀取器的setContentHandler(obj)方法設置事件處理
reader.setContentHandler(obj);

5.調用讀取器的解析方法，解析XML文件
reader.parse("絕對路徑/相對路徑");

◆注；具體的事件處理在繼承事件處理接口·下·的具體實現類，的類中定義

事件處理；
在SAX中引入了一個事件處理的概念，是用于對文件的內容進行的處理。

1.在調用解析文件parse()的方法，時會觸發事件處理方法中的對象的···主要三個方法···

2.而事件處理ContenHandler是一個接口，
如果實現這個了接口則需要實現這個接口的所有方法
所以可以實現這個接口的具體的實現類。

主要三個方法；
startElement(String uri, String localName, String qName,
Attributes attributes) ----- 獲取到開始標簽

characters(char[] ch, int start, int length) ----- 獲取到標簽內容

endElement(String uri, String localName, String qName)
----- 獲取到結束標簽

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓ＪＡＸＰ——ＤＯＭ —— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

JAXP-DOM解析技術；
為什么要有？
1.在SUN公司定義了一個SAX解析，而這個解析的特點是，每次讀取一行，
而不便于增刪改。。。。。
2.而不用DOM4J，因為如果是使用SUN公司定義的標準較規范，

3.使得代碼便于閱讀，因為在閱讀是不必查看是使用什么技術。。。。。

4.在未來的開發中統一使用SUN公司的技術，可以使得兼容性問題的風險降低。。

是什么？
JAXP-DOM解析技術是由SUN公司開發的，里面融合了DOM4J的部分技術

作用；
可以用于解析XML文檔。

特點；
1.一次性加載整個XML文檔到內存中。
2.不適合大的文檔存取，適合增刪改查
3.也是一個倒立的樹型結構。

4.也是遵循DOM規范的。

------------------------------ ＪＡＸＰ——ＤＯＭ —— 創建->獲取ＸＭＬ文檔流程 -------------------------------------------------------------------

Jaxp-DOM創建流程；
1.獲取到Jaxp_DOM解析工廠對象
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();

2.通過解析工廠對象獲取到具體的解析器對象
DomcumentBuilder db=dbf.newDocumentBuilder();

3.通過解析器的解析XML文檔的方法獲取到XML文檔
Document doc=db.parse("絕對路徑/相對路徑")

操作文檔元素的方法；
參考；Java_API ---> Document對象，中的方法
和DOM4J/SAX類似

◆◆◆注；不可以使用通過類名獲取到文件輸入流對象

Node n=doc.getElementsByTagName("節點名")[num];

-------------------------------- ＪＡＸＰ——ＤＯＭ —— 創建->寫入ＸＭＬ文檔流程 --------------------------------------------------------------------

JAXP-DOM創建-寫入；
1.獲取到JAXP-DOM解析工廠接口對象
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();

2.通過解析工廠的對象獲取到具體的解析器對象
DocumentBuilder bd=dbf.newDocumentBuilder();

3.使用解析器對象的parse()方法，獲取到XML文檔的對象
Document doc=bd.parse(絕對路徑/相對路徑);

4.1.在JAXP-DOM的中加入了插入的insertBefore();的方法
a.創建節點
Element_Obj.createElement("結點名");

b.獲取到參考節點

c.獲取到某一個節點（父節點）
Element ele=doc.getDocumentElement();

d.通過父節點插入某一個節點
ele.insertBefore(插入的節點,參考節點);

5.創建寫入工廠對象【transformer 轉換模型】
TransformerFactory tff=TransformerFactory.newInstance();

6.通過工廠對象獲取到具體的寫入對象
Transformer tf=tff.newTransformer();

<------
7.調用寫入對象的write方法寫入
▲--> tf.write(new DOMSource("源文件路徑"),new StreamResult(new FileOutputStream("目標路徑")));

◆◆◆注；
1.new DOMSource() 是一個類，而這個類可以關聯要轉換的Document對象
2.new StreamResult() 是一個類，可以表示數據寫出的目的地。

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓　ＸＭＬ —— 約束↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

XML約束；
為什么要有？
在XML文檔中的標簽可以隨意定義，使得文檔不規范，
也避免用戶輸入有誤，提高用戶的體驗性。

如；在描述人職業的XML文檔中，用戶不小心寫錯了或有人故意破壞，寫了個動物標簽。

什么是XML約束？
規定（規范）XML文檔的書寫格式。

作用；
使得文檔變得規范，便于閱讀，提高用戶的體驗性。

主流約束；
DTD
是一個控制不是很精準的一個約束技術
文件后綴是 .dtd

Scheme
是一個控制精準的一個約束技術，逐步的取代DTD
文件后綴是 .xsd

◆◆◆注；叫是叫Scheme而在書寫scheme約束文檔時是寫schema
----因為Schema的意思更加具體。

schema ：模式，計劃
scheme ：計劃，策劃，體制

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓　ＤＴＤ —— 約束↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

DTD約束；
是什么？
Document Type Definition 文檔類型定義

作用；
用于規定（規范）一個XML文檔的書寫格式

特點；
對文檔的內容控制不夠精準是，如做不到內容的控制等。

--------------------------------------------ＤＴＤ文檔定義 --------------------------------------------------------------------

DTD文檔定義；
1.常用的數據類型；
(#PCDATA) 可變長度的字符串
EMPTY 空類型【一般用于定義閉合標簽】
ANY 任意類型

2.常用的定義符號；
? 0或1
+ 1或N
* 0或N
() 必須出現 1次

3.常用的定義元素的關鍵字；
ELEMENT 定義元素
ATTLIST 定義元素的屬性

◆注；
1.都是大寫
2.一個標簽名可以同時使用2個，
因為；ELMENT是定義元素
ATTLIST 是定義元素的屬性

4.定義屬性常用的關鍵字；
1.#REQUIRED 必須給這個標簽定義該屬性
2.#IMPLIED 這個屬性可寫可不寫
3.#Fixed 給這個屬性定義一個固定值

--------------------------------------------ＤＴＤ文檔引入方式 --------------------------------------------------------------------

DTD文檔引入方式；
1.外部引入；
<!DOCTYPE 根名 SYSTEM "文件名">

2.內部定義；
<!DOCTYPE 根名[
<!ELEMENT 根名(子標簽)>
<!ELEMENT 子 (#PCDATA)>
]>

3.外部引入；key --- value
<!DOCTYPE 根名 PUBLIC "名稱空間【唯一】" "文件名">

--------------------------------------------ＤＴＤ文檔定義 --------------------------------------------------------------------

1.文件后綴是DTD

<!ELEMENT 書名 (作者+，價格?)>
<!ElEMENT 作者 (#PCDATA)>
<!ATTLIST 作者 titile CDATA #IMPLIED>
<!ELEMENT 價格 (#PCDATA)>

2.DTD文件沒有注釋

■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓　Ｓｃｈｅｍｅ —— 約束↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■

Scheme約束；
為什么要有？
1.DTD約束對XML的格式控制不夠精準
2.使得用戶可選擇性更多，因為Scheme也比較麻煩

是什么？
Scheme；體制，策劃

作用；
規范（規定）XML的文檔書寫格式

為什么說Scheme控制更加精準？
1.可選擇規定的內容類型更多
2.內容類型的控制
3.內容的規定
特點；
1.文件后綴是.xsd
2.scheme文件的也是屬于一個XML文件，因為聲明處與XML一樣
3.文件的根節點一定是【schema】

◆◆◆注；不要寫成scheme ，
scheme 是策劃，計劃，體制
schema 是計劃，模式

--------------------------------------------Ｓｃｈｅｍｅ文檔定義 --------------------------------------------------------------------

Scheme文檔定義；
1.可以指定一個自定義名

2.xmlns 的W3C域名是固定的格式，不可以改變

3.targetNamespace 域名名稱空間可以自定義，但是是要求唯一的

4.elementFormDefault 是固定的格式

5.根標簽一定要是【schema】

常用關鍵字解析；
sequence 序列；
是指定約束XML文件定義節點時
按照一個什么順序進行一個定義

complextype 復雜類型；
是在xsd文檔聲明這個節點下有子節點。

name；
是標簽名
type；
是標簽內容類型

★注；type如果設置成數值型（double，decimal....）的，一般都是要顯示的賦值

常見的單詞
Ocuurs 重視的意思
decimal 小數

--------------------------------------------Ｓｃｈｅｍｅ文檔開頭解析 --------------------------------------------------------------------

xs是自定義的一個標識符
名稱空間是一個key，保證唯一性用于約束XML文檔時，XML文檔找到這個文檔

<?xml version="1.0" encoding="UTD-8"> ----- 指定文檔類型
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" ----- 固定的格式

targetNamespace="自定義" ----- 自定義域名，用于標識，
|====一般是域名，保證在網絡上的唯一性

elementFormDefault="qualified" ----- 固定格式，qualified；合格
>

</xs:schema>

----------------------------------ＸＭＬ文檔　——　引用 ——　Ｓｃｈｅｍｅ文檔 --------------------------------------------------------------------

1.my ----- 是自定義的一個名字，可以用于在引入多個約束文件時，可以區分

2.xis ----- 是自定義的，也是可以用于在引入多個約束文件時區分，

3.xmlns:xis="http://www.w3.org/2001/XMLSchema-instance"
----- 是固定格式

4.xis:schemaLacation ----- 引入一個本地的文件，通過使用名稱空間 + 文件名指定 key + value

<my:schema 【根名】 xmlns:my="scheme文檔的名稱空間值"
xmlns:xis="http://www.w3.org/2001/XMLSchema-instance"
xis:schemaLacation="scheme文檔名稱空間文件名"
>

</my:scheme>

在線咨詢

上一篇：實現一個前端路由，如何實現瀏覽器的前進與后退？
下一篇：CSS之燈光照射動態顯示文字效果詳解

您的項目需求

*請認真填寫需求信息，我們會在24小時內與您取得聯系。