萬維網協會推出的一套數據交換標準——XML,是一種可擴展的標記語言,被設計用來傳輸和存儲數據。XML 可用于定義 Web 網頁上的文檔元素以及復雜數據的表述和傳輸。
Extensible Markup Language,簡稱 XML,中文含義是可擴展標記語言,該語言與 HTML 類似,主要功能是傳輸數據、儲存數據和共享數據。XML 語言沒有規定的標簽體,需要自定義標簽,是一種自我描述的語言。XML 與 HTML 有著本質的區別,XML 傳輸和存儲數據,而 HTML 用來顯示數據。
XML 的最大特點是自我描述和任意擴展,當用其描述數據時,用戶可以根據需要,組織符合 XML 規范形式的任意內容,并且標簽的名稱也可以由用戶指定。
圖片來源網絡
例如,一個描述書籍的XML文檔可能如下:
<?xml version="1.0" encoding="UTF-8" ?> <!-- 文檔聲明,默認編碼為UTF-8 --><!DOCTYPE note SYSTEM "book.dtd"><book id="1"> <name>Java核心技術</name> <author>Cay S. Horstmann</author> <isbn lang="CN">1234567</isbn> <tags> <tag>Java</tag> <tag>Network</tag> </tags> <pubDate/></book>
XML有固定的結構,首行必定是<?xml version="1.0"?>,可以加上可選的編碼。緊接著,如果以類似<!DOCTYPE note SYSTEM "book.dtd">聲明的是文檔定義類型(DTD:Document Type Definition),DTD是可選的。接下來是XML的文檔內容,一個XML文檔有且僅有一個根元素,根元素可以包含任意個子元素,元素可以包含屬性,例如,<isbn lang="CN">1234567</isbn>包含一個屬性lang="CN",且元素必須正確嵌套。如果是空元素,可以用<tag/>表示。
XML有幾個特點:一是純文本,默認使用UTF-8編碼,二是可嵌套,適合表示結構化數據。如果把XML內容存為文件,那么它就是一個XML文件,例如book.xml。此外,XML內容經常通過網絡作為消息傳輸。
所有 XML 元素都須有關閉標簽
在 HTML,經常會看到沒有關閉標簽的元素:
<p>This is a paragraph<p>This is another paragraph
在 XML 中,省略關閉標簽是非法的。所有元素都必須有關閉標簽:
<p>This is a paragraph</p><p>This is another paragraph</p>
注釋:您也許已經注意到 XML 聲明沒有關閉標簽。這不是錯誤。聲明不屬于XML本身的組成部分。它不是 XML 元素,也不需要關閉標簽。
XML 標簽對大小寫敏感
XML 元素使用 XML 標簽進行定義。
XML 標簽對大小寫敏感。在 XML 中,標簽 <Letter> 與標簽 <letter> 是不同的。
必須使用相同的大小寫來編寫打開標簽和關閉標簽:
<Message>這是錯誤的。</message><message>這是正確的。</message>
注釋:打開標簽和關閉標簽通常被稱為開始標簽和結束標簽。不論您喜歡哪種術語,它們的概念都是相同的。
XML 必須正確地嵌套
在 HTML 中,常會看到沒有正確嵌套的元素:
<b><i>This text is bold and italic</b></i>
在 XML 中,所有元素都必須彼此正確地嵌套:
<b><i>This text is bold and italic</i></b>
在上例中,正確嵌套的意思是:由于 <i> 元素是在 <b> 元素內打開的,那么它必須在 <b> 元素內關閉。
XML 文檔必須有根元素
所有的 XML 文檔有且只有一個根元素來定義整個文檔。
XML 文檔必須有一個元素是所有其他元素的父元素。該元素稱為根元素。
<root> <child> <subchild>.....</subchild> </child></root>
XML 的屬性值須加引號
與 HTML 類似,XML 也可擁有屬性(名稱/值的對)。
在 XML 中,XML 的屬性值須加引號。請研究下面的兩個 XML 文檔。第一個是錯誤的,第二個是正確的:
<note date=08/08/2008><to>George</to><from>John</from></note> <note date="08/08/2008"><to>George</to><from>John</from></note>
在第一個文檔中的錯誤是,note 元素中的 date 屬性沒有加引號。
實體引用
在 XML 中,一些字符擁有特殊的意義。
如果你把字符 "<" 放在 XML 元素中,會發生錯誤,這是因為解析器會把它當作新元素的開始。
這樣會產生 XML 錯誤:
<message>if salary < 1000 then</message>
為了避免這個錯誤,請用實體引用來代替 "<" 字符:
<message>if salary < 1000 then</message>
在 XML 中,有 5 個預定義的實體引用:
<<小于>>大于&&和號''單引號""引號
注釋:在 XML 中,只有字符 "<" 和 "&" 確實是非法的。大于號是合法的,但是用實體引用來代替它是一個好習慣。
XML 中的注釋
在 XML 中編寫注釋的語法與 HTML 的語法很相似:
<!-- This is a comment -->
在 XML 中,空格會被保留
HTML 會把多個連續的空格字符裁減(合并)為一個.在 XML 中,文檔中的空格不會被刪節。
XML 以 LF 存儲換行
在 Windows 應用程序中,換行通常以一對字符來存儲:回車符 (CR) 和換行符 (LF)。這對字符與打字機設置新行的動作有相似之處。在 Unix 應用程序中,新行以 LF 字符存儲。而 Macintosh 應用程序使用 CR 來存儲新行。
什么是 XML 元素?
XML 元素指的是從(且包括)開始標簽直到(且包括)結束標簽的部分。
元素可包含其他元素、文本或者兩者的混合物。元素也可以擁有屬性。
<bookstore><book category="CHILDREN"> <title>Harry Potter</title> <author>J K. Rowling</author> <year>2005</year> <price>29.99</price> </book><book category="WEB"> <title>Learning XML</title> <author>Erik T. Ray</author> <year>2003</year> <price>39.95</price> </book></bookstore>
在上例中,<bookstore> 和<book>都擁有元素內容,因為它們包含了其他元素。<author>只有文本內容,因為它僅包含文本。
在上例中,只有 <book> 元素擁有屬性 (category="CHILDREN")。
XML 命名規則
XML 元素必須遵循以下命名規則:
可使用任何名稱,沒有保留的字詞。
最佳命名習慣
使名稱具有描述性。使用下劃線的名稱也很不錯。
名稱應當比較簡短,比如:<book_title>,而不是:<the_title_of_the_book>。
避免 "-" 字符。如果您按照這樣的方式進行命名:"first-name",一些軟件會認為你需要提取第一個單詞。
避免 "." 字符。如果您按照這樣的方式進行命名:"first.name",一些軟件會認為 "name" 是對象 "first" 的屬性。
避免 ":" 字符。冒號會被轉換為命名空間來使用(稍后介紹)。
XML 文檔經常有一個對應的數據庫,其中的字段會對應 XML 文檔中的元素。有一個實用的經驗,即使用數據庫的名稱規則來命名 XML 文檔中的元素。
非英語的字母比如 éòá 也是合法的 XML 元素名,不過需要留意當軟件開發商不支持這些字符時可能出現的問題。
XML 屬性
從 HTML,你會回憶起這個:<img src="computer.gif">。"src" 屬性提供有關<img> 元素的額外信息。
在 HTML 中(以及在 XML 中),屬性提供有關元素的額外信息:
<img src="computer.gif"><a href="demo.asp">
屬性通常提供不屬于數據組成部分的信息。在下面的例子中,文件類型與數據無關,但是對需要處理這個元素的軟件來說卻很重要:
<file type="gif">computer.gif</file>
XML 屬性必須加引號
屬性值必須被引號包圍,不過單引號和雙引號均可使用。比如一個人的性別,person 標簽可以這樣寫:
<person sex="female">
或者這樣也可以:
<person sex='female'>
注釋:如果屬性值本身包含雙引號,那么有必要使用單引號包圍它,就像這個例子:
<gangster name='George "Shotgun" Ziegler'>
或者可以使用實體引用:
<gangster name="George "Shotgun" Ziegler">
可參閱:
本文由以上文章整理
點擊下方“了解更多”查看網頁原文,謝謝您的關注!
SVG(Scalable Vector Graphics)是一種基于XML的2D矢量圖形格式,可以實現圖像的無損縮放和高清晰度顯示。在HTML中嵌入SVG圖像,可以使網頁更加生動有趣,提高用戶體驗
<svg width="54" height="54" class="c-nav--footer__svgicon c-slackhash" viewBox="0 0 54 54" xmlns="http://www.w3.org/2000/svg">
<g fill="none" fill-rule="evenodd">
<path d="M19.712.133a5.381 5.381 0 0 0-5.376 5.387 5.381 5.381 0 0 0 5.376 5.386h5.376V5.52A5.381 5.381 0 0 0 19.712.133m0 14.365H5.376A5.381 5.381 0 0 0 0 19.884a5.381 5.381 0 0 0 5.376 5.387h14.336a5.381 5.381 0 0 0 5.376-5.387 5.381 5.381 0 0 0-5.376-5.386" fill="#44BEDF">
</path>
<path d="M53.76 19.884a5.381 5.381 0 0 0-5.376-5.386 5.381 5.381 0 0 0-5.376 5.386v5.387h5.376a5.381 5.381 0 0 0 5.376-5.387m-14.336 0V5.52A5.381 5.381 0 0 0 34.048.133a5.381 5.381 0 0 0-5.376 5.387v14.364a5.381 5.381 0 0 0 5.376 5.387 5.381 5.381 0 0 0 5.376-5.387" fill="#2EB67D">
</path>
<path d="M34.048 54a5.381 5.381 0 0 0 5.376-5.387 5.381 5.381 0 0 0-5.376-5.386h-5.376v5.386A5.381 5.381 0 0 0 34.048 54m0-14.365h14.336a5.381 5.381 0 0 0 5.376-5.386 5.381 5.381 0 0 0-5.376-5.387H34.048a5.381 5.381 0 0 0-5.376 5.387 5.381 5.381 0 0 0 5.376 5.386" fill="#ECB22E">
</path>
<path d="M0 34.249a5.381 5.381 0 0 0 5.376 5.386 5.381 5.381 0 0 0 5.376-5.386v-5.387H5.376A5.381 5.381 0 0 0 0 34.25m14.336-.001v14.364A5.381 5.381 0 0 0 19.712 54a5.381 5.381 0 0 0 5.376-5.387V34.25a5.381 5.381 0 0 0-5.376-5.387 5.381 5.381 0 0 0-5.376 5.387" fill="#E01E5A">
</path>
</g>
</svg>
ML;
是什么?
Extensible Markup Languare 可擴展標記型語言
為什么要有XML?
1.HTML的標簽是固定的,不可以改變,也不可以進行一個···擴展
2.HTML語法松散
作用;
制作配置文件;如組件類。。。。。
存儲數據;存儲少量的數據
◆◆◆注;XML不是HTML的升級版,因為應用的領域不一樣。
XML是描寫關系型的數據
HTML是描述頁面的數據顯示效果
--------------------------------------------XML和HTML的區別--------------------------------------------------------------------
XML和HTML的區別;
A、HTML是將數據和顯示的效果混合在一起,描述了數據的顯示效果,
-----而且標簽是固定,而且語法松散
B、XML是將數據和顯示的效果是分離的,只是描述了數據之間的關系和存儲的格式,
-----沒有描述數據的顯示效果,沒有一套具體的標簽,只是一個規范。
XML適用金融,科學等有關系型的領域
XML的重點是;處理數據,和數據結構
◆注;引入外部CSS文件,對XML標簽進行一個修飾,
<>xml-stylesheet tyep="text/css" href="">
--------------------------------------------XML的特點--------------------------------------------------------------------
XML特點;
1.語法嚴謹,區分大小寫
2.標簽名可以是中文
3.文件后綴是 .xml
4.換行也是算一個元素
5.可以自定義標簽
6.id不可以以數字開頭
存儲數據的方式;
* XML 存儲關系型的數據
* properties 存儲key,value的數據
* 文本 什么都可以存儲
* 數據庫
--------------------------------------------XML的語法--------------------------------------------------------------------
XML語法;
1.文檔聲明 Document declaration;
版本 編碼集 是否與其他文件關聯
<?xml vaersion="1.0" encoding="編碼集" standalone="no默認" ?>
2.元素 Element;
1.自定義標簽;建議標簽名全部小寫,保持與HTML的書寫習慣,
因為出現同名的大小寫不便于閱讀
2.成對出現
3.閉合標簽和結束體標簽
4.符合邏輯嵌套
3.屬性 Attribute;
1.屬性名小寫,屬性也是可以自定義的,
2.屬性值要使用 "" 或 '',id不可以以數字開頭
3.多個屬性要使用 空格 隔開
4.可以將屬性作為一個子標簽,因為XML用途不是用于顯示頁面的
4.注釋 Comment;
1.<!-- --> 和HTML一樣
2.注釋不可以嵌套
5.CDATA;
1.XML的轉義字符基本和HTML一致。
2.如果需要轉義的字符太多了則可以使 CDATA
3.CDATA可以將一段字符串原樣的輸出
<![CDATA[字符串]]>
6.處理指令;
1.處理指令時告知解析引擎是要如何處理文檔的。
2.處理指令必須使用 <? ?>
<?xml-stylesheet type="text/css" href="路徑">
◆注;
1.XML必須要有一個根節點
2.XML不會在頁面顯示
3.縮進寫法適合閱讀
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓XML—— 文件結構↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
◆◆◆注; XML文檔必須要有一個根節點◆◆◆
XML文件結構;
Node
|--- Element
|--- Attr
|--- Comment
|--- Text
|--- Document
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓XML—— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
xml解析;
為什么要有?
因為XML主要是用于存儲數據,做配置文件.......
那么XML的數據的···取出···可以通過解析技術可以實現.....
而讀取XML文件;
1.IO ---- 讀取出來的數據不是理想的數據。
2.DOM解析 ---- DOM4J 是一個開源的解析技術
3.SAX解析 ---- SAX 是SUN公司定義的,比較規范,SAX里面也是有使用了DOM4J的技術
解析技術;
1.DOM4J 是一個開源組織的
2.JAXP 是SUN公司定義的
|-- DOM
|-- SAX
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓DOM—— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
DOM解析;
特點;1.是一次性裝載這個文件到內存中,不利于大文件存取操作,
2.適合增刪改查,因為一次是整個文件加載,無需在到硬盤對文件中的內容一個一個去查找
3.在內存中是一棵倒掛的樹
4.DOM是解析XML的底層接口之一
5.是W3C定義的
6.DOM是一個規范,而DOM4J是一個實現了這個規范的解析技術
DOM4J;
1.是DOM解析的一個實現解析技術(如同實現類)
2.特點和DOM一樣,也是一棵倒立的樹型形狀。
3.不是W3C定義的,是一個開源團隊發布的
DOM4J;也是一個組件,而這個組件也是需要下載的,
-----------------------------------------------DOM4J獲取XML文件的方式--------------------------------------------------------------------
◆◆◆注;注意導包的路徑。
DOM4J獲取文件的三種方式;
1.通過解析器的方法傳入一個絕對路徑
a.創建解析器
★ SAXReader sr=new SAXReader();
b.調用解析器的read方法獲取XML文檔,使用文檔對象接收
★ Document doc=sr.read("絕對路徑");
2.通過解析器的方法傳入一個相對路徑
a.創建解析器
★ SAXReader sr=new SAXReader();
b.調用解析器的read()方法,獲取到XML文檔,使用文檔對象接收
★ Document doc=sr.read("相對路徑");
3.通過類的getResourceAsStream("/文件名")方法
a.通過運行時類的對象的getResourceAsStream()的方法
---獲取到這個XML文檔的流
★InputStream is=類名.class.getResourceStream("/文件名");
b.創建解析器
★ SAXReader sr=new SAXReader();
c.調用解析器的read()方法傳入獲取到的XML文件流,使用文檔對象接收
★ Document doc=sr.read(is);
------------------------------------------DOM4J獲取XML文件的元素方法--------------------------------------------------------------------
◆◆◆注;必須要先獲取到根節點,在根據根節點獲取到其他節點 ◆◆◆
DOM4J獲取元素方法; --- 使用Element Object調用
1.getRootElement() 獲取到根節點
2.elements(寫/沒寫) 只能寫子標簽,不可以寫孫標簽
沒寫;獲取到所有的子標簽標簽 返回的是一個集合
寫了;獲取到指定標簽名的所有標簽
3.getName(); 獲取到標簽名
4.elementText() 獲取到標簽的內容
5.element() 獲取到指定標簽
6.elementById() 獲取到指定的Id標簽
7.elementIterator() 獲取到標簽迭代器
8.getQName() 獲取到標簽名
獲取屬性的方法;----使用 Element Object調用
1.attributeValue() 獲取到指定的屬性的值
2.attirbutes() 獲取到所有的屬性
添加的方法;----使用 Element Object 調用
1.addElement() 添加元素
2.addAttribute() 添加屬性
3.addCDATA() 添加CDATA
4.addText() 添加標簽內容
直接刪除元素方法;使用獲取到的元素對象,
◆ 調用detach()方法可以刪除這個元素和這個元素的所有子元素。
如;element.detach()
------------------------------------------DOM4J刷新文件--------------------------------------------------------------------
DOM4J刷新文件;
1.聲明文件內容的寫入格式。
a.縮進格式;
OutputFormat of=OutputFormat.createPrettyPrint();
b.行內格式;
OutputFormat of=OutputFormat.createCompactFormat();
2.創建寫入器
XMLWriter writer=new XMLWriter("FileStream_Path","OutputFormat_Obj");
3.調用寫入器的方法寫入重寫寫入文件
writer.write("Document_Obj");
◆注;
1.將獲取到的XML文檔對象的內容轉換成一個字符串
String Document.asXML();
2.將字符串轉換成一個XML文檔對象
Document.DocumentHanper.parseText("String_Obj");
------------------------------------------DOM4J創建 --> 寫入過程--------------------------------------------------------------------
◆◆◆注意導包◆◆◆
1.創建解析器對象;
SAXReader reader=new SAXReader()
2.調用解析器方法獲取到XML文檔;
Document doc=reader.read("String_Path");
3.獲取到根路徑;
Element doc.getRootElement();
---4.1;將獲取到的文檔對象轉換成字符串
String doc.asXML();
---4.2;將字符串解析成一個XML文檔對象
Document DocumnetHanper.parseText("String");
5.規定寫入XML文件的格式;
1.OutputFormat of=OutputFormat.createPattryPrint(); --- 縮進格式
2.OutputFormat of=OutputFormat.createCompactFormat(); --- 行內格式
6.創建寫入器;
XMLWriter writer=new XMLWriter("FileStream_Path",OutputFormat);
7.調用寫入器的寫入XML文件的方法;
writer.wirte(Document);
8.關閉流;
writer.close();
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓Xpath—— 查詢表達式↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
Xpath;
為什么要有?
在DOM4J中加載文件時,直接加載整個文件到內存中的,不便于獲取某一個指定的節點。
什么是Xpath?
1、是一個查詢表達式語言,也是一個開源的語言
2、在DOM4J中融合了這個Xpath這個查詢表達式語言
3、這個語言也是一個組件來的,但是在DOM4J組件中已經附帶了
dom4J --- lib --- jaxen-1.1-beta-6.jar
作用;
可以通過Xpath表達式快速定位到某一個XML文件的節點。
------------------------------------------Xpath—— 表達式符號 --------------------------------------------------------------------
表達式符號;
//x 相對定位到某節點
/x 絕對定位絕對定位到某一個節點
/* 是所有節點
[num] 第N個節點
[@x] 選中到某一個屬性
normalize-span 去空格
[text()] 獲取到內容
------------------------------------------Xpath—— 使用 --------------------------------------------------------------------
Xpath的使用;
DOM4J的selectNodes("表達式"); 方法
DOM4J的selectSingleNode("表達式"); 方法
Document .selectNodes() ------ 是返回所有節點的集合
Document .selectSingleNode("表達式") ----- 返回某一個具體的節點
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓JAXP —— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
JAXP解析技術;
是Sun公司開發的,是XML文檔解析技術的一個集合統稱。
包含;
DOM解析
一次性讀取整個文件到內存中。
SAX解析
讀取一行,解析一行,處理一行。
這2項解析技術都是由SUN公司制定的,較規范
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓JAXP——SAX —— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
SAX解析技術;
為什么要有?
1.DOM4J不適合大文件的讀取,因為一次性加載整個文件。
是什么?
1.Simple API For XML 簡單的解析XML文檔API,是由SUN公司定義的一個解析技術,較規范。
2.也是融合了DOM4J的部分技術。
作用;
用于解析XML文檔的一個解析技術
特點;
一次讀取一行,解析一行,處理一行。
適合大文件的存取,不適合增刪改查。
◆注;由于是SUN公司開發的,而在Eclipse或MyEclipse中已經有了組件。
◆◆◆◆◆注;SAX解析主要是用于查詢,一般都不使用寫入操作,因為一般的XML文件都不會太大
-----------------------------------------SAX獲取XML文件的方式--------------------------------------------------------------------
SAX獲取XML文件的方式;
只有 2 種,傳入的字符串是···絕對路徑···或···相對路徑···
-----------------------------------------SAX獲取XML文件的流程 --------------------------------------------------------------------
SAX獲取XML文件的流程;
因為是SUN公司定義的所以也較規范,也定義了獲取XML文件的流程
1.獲取到解析器工廠對象
SAXParserFactory spf=SAXParserFactory.newInstance();
2.通過解析器工廠對象獲取到具體的解析器對象
SAXParser sp=spf.newSAXParser();
3.通過具體的解析器對象,獲取到讀取器
XMLReader reader=sp.getXMLReader()
4.通過調用讀取器的setContentHandler(obj)方法設置事件處理
reader.setContentHandler(obj);
5.調用讀取器的解析方法,解析XML文件
reader.parse("絕對路徑/相對路徑");
◆注;具體的事件處理在繼承事件處理接口·下·的具體實現類,的類中定義
事件處理;
在SAX中引入了一個事件處理的概念,是用于對文件的內容進行的處理。
1.在調用解析文件parse()的方法,時會觸發事件處理方法中的對象的···主要三個方法···
2.而事件處理ContenHandler是一個接口,
如果實現這個了接口則需要實現這個接口的所有方法
所以可以實現這個接口的具體的實現類。
主要三個方法;
startElement(String uri, String localName, String qName,
Attributes attributes) ----- 獲取到開始標簽
characters(char[] ch, int start, int length) ----- 獲取到標簽內容
endElement(String uri, String localName, String qName)
----- 獲取到結束標簽
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓JAXP——DOM —— 解析技術↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
JAXP-DOM解析技術;
為什么要有?
1.在SUN公司定義了一個SAX解析,而這個解析的特點是,每次讀取一行,
而不便于增刪改。。。。。
2.而不用DOM4J,因為如果是使用SUN公司定義的標準較規范,
3.使得代碼便于閱讀,因為在閱讀是不必查看是使用什么技術。。。。。
4.在未來的開發中統一使用SUN公司的技術,可以使得兼容性問題的風險降低。。
是什么?
JAXP-DOM解析技術是由SUN公司開發的,里面融合了DOM4J的部分技術
作用;
可以用于解析XML文檔。
特點;
1.一次性加載整個XML文檔到內存中。
2.不適合大的文檔存取,適合增刪改查
3.也是一個倒立的樹型結構。
4.也是遵循DOM規范的。
------------------------------ JAXP——DOM —— 創建->獲取XML文檔流程 -------------------------------------------------------------------
Jaxp-DOM創建流程;
1.獲取到Jaxp_DOM解析工廠對象
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
2.通過解析工廠對象獲取到具體的解析器對象
DomcumentBuilder db=dbf.newDocumentBuilder();
3.通過解析器的解析XML文檔的方法獲取到XML文檔
Document doc=db.parse("絕對路徑/相對路徑")
操作文檔元素的方法;
參考;Java_API ---> Document對象,中的方法
和DOM4J/SAX類似
◆◆◆注;不可以使用通過類名獲取到文件輸入流對象
Node n=doc.getElementsByTagName("節點名")[num];
-------------------------------- JAXP——DOM —— 創建->寫入XML文檔流程 --------------------------------------------------------------------
JAXP-DOM創建-寫入;
1.獲取到JAXP-DOM解析工廠接口對象
DocumentBuilderFactory dbf=DocumentBuilderFactory.newInstance();
2.通過解析工廠的對象獲取到具體的解析器對象
DocumentBuilder bd=dbf.newDocumentBuilder();
3.使用解析器對象的parse()方法,獲取到XML文檔的對象
Document doc=bd.parse(絕對路徑/相對路徑);
4.1.在JAXP-DOM的中加入了插入的insertBefore();的方法
a.創建節點
Element_Obj.createElement("結點名");
b.獲取到參考節點
c.獲取到某一個節點(父節點)
Element ele=doc.getDocumentElement();
d.通過父節點插入某一個節點
ele.insertBefore(插入的節點,參考節點);
5.創建寫入工廠對象 【transformer 轉換模型】
TransformerFactory tff=TransformerFactory.newInstance();
6.通過工廠對象獲取到具體的寫入對象
Transformer tf=tff.newTransformer();
<------
7.調用寫入對象的write方法寫入
▲--> tf.write(new DOMSource("源文件路徑"),new StreamResult(new FileOutputStream("目標路徑")));
◆◆◆注;
1.new DOMSource() 是一個類,而這個類可以關聯要轉換的Document對象
2.new StreamResult() 是一個類,可以表示數據寫出的目的地。
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓ XML —— 約束↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
XML約束;
為什么要有?
在XML文檔中的標簽可以隨意定義,使得文檔不規范,
也避免用戶輸入有誤,提高用戶的體驗性。
如;在描述人職業的XML文檔中,用戶不小心寫錯了或有人故意破壞,寫了個動物標簽。
什么是XML約束?
規定(規范)XML文檔的書寫格式。
作用;
使得文檔變得規范,便于閱讀,提高用戶的體驗性。
主流約束;
DTD
是一個控制不是很精準的一個約束技術
文件后綴是 .dtd
Scheme
是一個控制精準的一個約束技術,逐步的取代DTD
文件后綴是 .xsd
◆◆◆注;叫是叫Scheme而在書寫scheme約束文檔時是寫schema
----因為Schema的意思更加具體。
schema :模式,計劃
scheme :計劃,策劃,體制
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓ DTD —— 約束↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
DTD約束;
是什么?
Document Type Definition 文檔類型定義
作用;
用于規定(規范)一個XML文檔的書寫格式
特點;
對文檔的內容控制不夠精準是,如做不到內容的控制等。
--------------------------------------------DTD文檔定義 --------------------------------------------------------------------
DTD文檔定義;
1.常用的數據類型;
(#PCDATA) 可變長度的字符串
EMPTY 空類型 【一般用于定義閉合標簽】
ANY 任意類型
2.常用的定義符號;
? 0或1
+ 1或N
* 0或N
() 必須出現 1次
3.常用的定義元素的關鍵字;
ELEMENT 定義元素
ATTLIST 定義元素的屬性
◆注;
1.都是大寫
2.一個標簽名可以同時使用2個,
因為;ELMENT是定義元素
ATTLIST 是定義元素的屬性
4.定義屬性常用的關鍵字;
1.#REQUIRED 必須給這個標簽定義該屬性
2.#IMPLIED 這個屬性可寫可不寫
3.#Fixed 給這個屬性定義一個固定值
--------------------------------------------DTD文檔引入方式 --------------------------------------------------------------------
DTD文檔引入方式;
1.外部引入;
<!DOCTYPE 根名 SYSTEM "文件名">
2.內部定義;
<!DOCTYPE 根名[
<!ELEMENT 根名(子標簽)>
<!ELEMENT 子 (#PCDATA)>
]>
3.外部引入;key --- value
<!DOCTYPE 根名 PUBLIC "名稱空間【唯一】" "文件名">
--------------------------------------------DTD文檔定義 --------------------------------------------------------------------
1.文件后綴是DTD
<!ELEMENT 書名 (作者+,價格?)>
<!ElEMENT 作者 (#PCDATA)>
<!ATTLIST 作者 titile CDATA #IMPLIED>
<!ELEMENT 價格 (#PCDATA)>
2.DTD文件沒有注釋
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■↓↓↓↓↓↓ Scheme —— 約束↓↓↓↓↓↓↓↓■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
Scheme約束;
為什么要有?
1.DTD約束對XML的格式控制不夠精準
2.使得用戶可選擇性更多,因為Scheme也比較麻煩
是什么?
Scheme;體制,策劃
作用;
規范(規定)XML的文檔書寫格式
為什么說Scheme控制更加精準?
1.可選擇規定的內容類型更多
2.內容類型的控制
3.內容的規定
特點;
1.文件后綴是.xsd
2.scheme文件的也是屬于一個XML文件,因為聲明處與XML一樣
3.文件的根節點一定是【schema】
◆◆◆注;不要寫成scheme ,
scheme 是策劃,計劃,體制
schema 是 計劃,模式
--------------------------------------------Scheme文檔定義 --------------------------------------------------------------------
Scheme文檔定義;
1.可以指定一個自定義名
2.xmlns 的W3C域名是固定的格式,不可以改變
3.targetNamespace 域名名稱空間可以自定義,但是是要求唯一的
4.elementFormDefault 是固定的格式
5.根標簽一定要是 【schema】
常用關鍵字解析;
sequence 序列;
是指定約束XML文件定義節點時
按照一個什么順序進行一個定義
complextype 復雜類型;
是在xsd文檔聲明這個節點下有子節點。
name;
是標簽名
type;
是標簽內容類型
★注;type如果設置成數值型(double,decimal....)的,一般都是要顯示的賦值
常見的單詞
Ocuurs 重視的意思
decimal 小數
--------------------------------------------Scheme文檔開頭解析 --------------------------------------------------------------------
xs是自定義的一個標識符
名稱空間是一個key,保證唯一性用于約束XML文檔時,XML文檔找到這個文檔
<?xml version="1.0" encoding="UTD-8"> ----- 指定文檔類型
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" ----- 固定的格式
targetNamespace="自定義" ----- 自定義域名,用于標識,
|====一般是域名,保證在網絡上的唯一性
elementFormDefault="qualified" ----- 固定格式,qualified;合格
>
</xs:schema>
----------------------------------XML文檔 —— 引用 —— Scheme文檔 --------------------------------------------------------------------
1.my ----- 是自定義的一個名字,可以用于在引入多個約束文件時,可以區分
2.xis ----- 是自定義的,也是可以用于在引入多個約束文件時區分,
3.xmlns:xis="http://www.w3.org/2001/XMLSchema-instance"
----- 是固定格式
4.xis:schemaLacation ----- 引入一個本地的文件,通過使用 名稱空間 + 文件名 指定 key + value
<my:schema 【根名】 xmlns:my="scheme文檔的名稱空間值"
xmlns:xis="http://www.w3.org/2001/XMLSchema-instance"
xis:schemaLacation="scheme文檔名稱空間 文件名"
>
</my:scheme>
*請認真填寫需求信息,我們會在24小時內與您取得聯系。