文介紹如何通過Java后端程序代碼來展示如何將html轉為XML。此功能通過采用Word API- Free Spire.Doc for Java 提供的Document.saveToFile()方法來實現;該方法支持的目標文檔格式多達 30余種。另外,該API也提供了多種方法,如Document.saveToEpub()、Document.saveToFile()、Document.saveToImages()、Document.saveToSVG()、Document.saveToTxt()、Document.saveToTiff()等,可用于將源文件轉為Epub、圖片、文本文件等目標文檔格式。
下面,將以html轉為xml格式為例,介紹如何實現轉換。以下是詳細方法及步驟。
通過 Maven倉庫 下載導入,如下配置pom.xml:
<repositories>
<repository>
<id>com.e-iceblue</id>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.doc.free</artifactId>
<version>5.2.0</version>
</dependency>
</dependencies>
如需手動導入,需要下載 jar包 到本地,然后解壓,找到lib文件夾下的Spire.Doc.jar文件。在IDEA中打開“Project Structure”界面,執行如圖步驟將本地路徑下的jar文件手動引入Java程序:
轉換時,可參考如下代碼步驟:
Java
import com.spire.doc.*;
public class HTMLtoXML {
public static void main(String[] args) {
//創建Document類的對象
Document doc = new Document();
//加載html文件
doc.loadFromFile("sample.html",FileFormat.Html);
//保存為XML格式
doc.saveToFile("HTMLtoXML.xml", FileFormat.Xml);
}
}
轉換效果:
—END—
原文出處:https://www.cnblogs.com/Yesi/p/16392430.html
如果本文對你有幫助,別忘記給我個3連 ,點贊,轉發,評論,
學習更多JAVA知識與技巧,關注與私信博主(555),即可免費領取
文以C#及VB.NET后端程序代碼示例展示如何將HTML轉為XML文件。轉換時,調用Word API -Free Spire.Doc for .NET 提供的文檔加載方法及文檔保存的方法來實現。轉換的代碼步驟很簡單,具體可參考以下內容。
1.通過NuGet安裝dll(2種方法)
1.1可以在Visual Studio中打開“解決方案資源管理器”,鼠標右鍵點擊“引用”,“管理NuGet包”,然后搜索“Free Spire.Doc”,點擊“安裝”。等待程序安裝完成。
1.2將以下內容復制到PM控制臺安裝:
Install-Package FreeSpire.Doc -Version 10.2
2.手動添加dll引用
可通過手動下載包到本地,然后解壓,找到BIN文件夾下的Spire.Doc.dll。然后在Visual Studio中打開“解決方案資源管理器”,鼠標右鍵點擊“引用”,“添加引用”,將本地路徑BIN文件夾下的dll文件添加引用至程序。
轉換時,可參考如下代碼來進行:
C#
using Spire.Doc;
namespace HTMLtoXML
{
class Program
{
static void Main(string[] args)
{
//創建Document類的對象
Document doc = new Document();
//加載html文件
doc.LoadFromFile("sample.html",FileFormat.Html);
//保存為XML格式
doc.SaveToFile("HTMLtoXML.xml", FileFormat.Xml);
System.Diagnostics.Process.Start("HTMLtoXML.xml");
}
}
}
vb.net
Imports Spire.Doc
Namespace HTMLtoXML
Class Program
Private Shared Sub Main(args As String())
'創建Document類的對象
Dim doc As New Document()
'加載html文件
doc.LoadFromFile("sample.html", FileFormat.Html)
'保存為XML格式
doc.SaveToFile("HTMLtoXML.xml", FileFormat.Xml)
System.Diagnostics.Process.Start("HTMLtoXML.xml")
End Sub
End Class
End Namespace
轉換效果:
—End—
于ASP.NET API的Aspose.PDF廣泛支持XML轉換功能,因為根據API用戶的要求,它包含許多相關的增強功能,可以使用將XML導出為PDF的高效功能來提升.NET應用程序。
在本文中,我們將使用C#將XML文件轉換為PDF。考慮以下與使用C#進行XML轉換有關的用例:
目前,.NET版Aspose.PDF升級到v20.6版,優化提取的頁面丟失問題,修復PDF轉換為HTML時的一些問題,感興趣的朋友可點擊下載最新版。(點擊文末“了解更多”下載最新版)
要將XML轉換為PDF,您需要遵循Aspose.PDF for .NET API的XML Schema,該XML Schema是XSD文件。以下是一個XML文件,我們將其轉換為PDF,作為Hello World演示。
<?xml version="1.0" encoding="utf-8" ?> <Document xmlns="Aspose.Pdf"> <Page id="mainSection"> <HtmlFragment> <![CDATA[ <font style="font-family:Tahoma; font-size:40px;">This is Html String.</font> ]]> </HtmlFragment> </Page> </Document>
需要按照以下步驟將XML轉換為PDF文件:
以下代碼段顯示了如何在C#中將XML轉換為PDF:
// Instantiate Document object
Document doc = new Document();
// Bind source XML file
doc.BindXml(dataDir + "XML.xml");
// Convert XML to PDF
doc.Save(dataDir + "XMLToPDF.pdf");
有時可能需要先將XML中的HTML轉換為HTML。.NET API的Aspose.PDF也支持此功能。但是,HTML和XML標簽非常相似。因此,需要指定CDATA標記,以便不將HTML解析為XML標記。下面的示例XML文件包括用CDATA表示的HTML,以避免出現任何異常:
<?xml version="1.0" encoding="utf-8" ?>
<Document xmlns="Aspose.Pdf">
<Page id="mainPage">
<TextFragment>
<TextSegment>Hello</TextSegment>
</TextFragment>
<TextFragment>
<TextSegment>World!</TextSegment>
</TextFragment>
</Page>
</Document>
通過以下步驟將此XML文件轉換為PDF:
下面的代碼片段顯示了如何在C#中將包含HTML的XML文件轉換為PDF:
// Instantiate Document object
Document doc = new Document();
// Bind source XML file
doc.BindXml(dataDir + "XML.xml");
// Convert XML to PDF
doc.Save(dataDir + "XMLToPDF.pdf");
有時,可能已有一個包含重要應用程序數據的XML文件,并且想使用該XML文件生成PDF報告。在這種情況下,可以創建XSLT文件,以將現有XML文檔轉換為Aspose.PDF的兼容XML文檔。然后,可以繼續將XML轉換為PDF。讓我們通過簡單而基本的示例來學習這一點:
<?xml version="1.0" encoding="utf-8" ?>
<Contents>
<Content>Hello World!</Content>
</Contents>
<?xml version="1.0" encoding="utf-8" ?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:template match="text()"/>
<xsl:template match="/Contents">
<html>
<Document xmlns="Aspose.Pdf" IsAutoHyphenated="false">
<PageInfo>
<DefaultTextState
Font = "Helvetica" FontSize="8" LineSpacing="4"/>
<Margin Left="5cm" Right="5cm" Top="3cm" Bottom="15cm" />
</PageInfo>
<Page id="mainSection">
<TextFragment>
<TextSegment>
<xsl:value-of select="Content"/>
</TextSegment>
</TextFragment>
</Page>
</Document>
</html>
</xsl:template>
</xsl:stylesheet>
我們會注意到,該XML文件不遵循Aspose.PDF for .NET API的XML模式。但是,XSLT文件將其轉換為所需的兼容性。現在,可以按照以下步驟使用XSLT將此類XML轉換為PDF:
下面的代碼段基于以下步驟,這些步驟顯示了如何在C#中將XML轉換為PDF:
//Create pdf document
Aspose.Pdf.Document pdf = new Aspose.Pdf.Document();
//Bind XML and XSLT files to the document
try
{
pdf.BindXml(dataDir + "\\HelloWorld.xml", dataDir + "\\HelloWorld.xslt");
}
catch (System.Exception)
{
throw;
}
//Save the document
pdf.Save(dataDir + "HelloWorldUsingXmlAndXslt.pdf");
如果您有任何疑問或需求,請隨時加入Aspose技術交流群(642018183),我們很高興為您提供查詢和咨詢。
*請認真填寫需求信息,我們會在24小時內與您取得聯系。