家好!你是否曾為HTML格式的文件無法在Word中打開而徹夜難眠?今天,我將為大家分享一個無所不能的“超強HTML轉(zhuǎn)Word轉(zhuǎn)換器”,讓你輕松將HTML文件轉(zhuǎn)換為Word格式!
一、HTML轉(zhuǎn)Word工具是什么?
HTML轉(zhuǎn)Word工具是一種應(yīng)用程序或在線服務(wù),用于將HTML網(wǎng)頁或文檔轉(zhuǎn)換為Microsoft Word格式(.doc或.docx),以便于編輯、共享和打印,并保持原始樣式和格式的完整性。
二、HTML轉(zhuǎn)Word工具怎么用?
打開半文魚新標(biāo)簽頁,點擊添加小組件,在組件庫中搜索“HTML轉(zhuǎn)Word”,立即獲取這個免費版在線神器!
1、點擊添加文件,然后從你的電腦中找到你要轉(zhuǎn)換的HTML文件,然后從你的電腦中找到你要轉(zhuǎn)換的HTML文件~?
2、文件上傳完畢后,點擊“開始處理”按鈕,等待文件轉(zhuǎn)換即可。你也可以繼續(xù)添加文件一起處理。
3、網(wǎng)頁轉(zhuǎn)換完畢后,文件后方的“等待處理”字樣會變成“處理成功”,此時只需要點擊右下角的打包下載就可以啦。左下角還可以看到本次的處理時間哦~
4、打包下載成功后,界面上會提示你“文件下載成功”。你可以在設(shè)定的輸出文件夾中找到轉(zhuǎn)換后的Word文件。
在線HTML網(wǎng)頁格式轉(zhuǎn)Word文檔,能最大限度的保留網(wǎng)頁中的樣式和鏈接。支持最大10個文件批量轉(zhuǎn)換,不妨來半文魚工具大全試試吧!
時遇到文檔格式轉(zhuǎn)換的問題還真不少,PDF轉(zhuǎn)成Word、PPT轉(zhuǎn)成PDF、PDF轉(zhuǎn)成Excel等,都是一些很常見的格式轉(zhuǎn)換需求。而且網(wǎng)上搜也是能搜到一堆的教程,如果想要將Word轉(zhuǎn)成HTML網(wǎng)頁格式,應(yīng)該如何實現(xiàn)呢?
HTML網(wǎng)頁文件平時用的比較少,但是在有些時候我們可能需要將word轉(zhuǎn)換為HTML來使用,這里小編就給大家講解一下如何將word轉(zhuǎn)換為html的。
第一步、在電腦上雙擊打開PDF轉(zhuǎn)換器,然后選擇“Word轉(zhuǎn)換”;
第二步、接著在這里選中“Word轉(zhuǎn)HTML”轉(zhuǎn)換功能;
第三步、如圖,點擊添加文件或者直接將轉(zhuǎn)換的文檔添加進(jìn)來即可,可批量添加多個進(jìn)行轉(zhuǎn)換;
第四步、在這里根據(jù)自己的需要設(shè)置輸出目錄;
第五步、最后,點擊“開始轉(zhuǎn)換”就可以了;
第六步、得到以下提示,說明文件轉(zhuǎn)換成功,點擊前往導(dǎo)出文件位置就可以瀏覽轉(zhuǎn)換好的文件;
第七步、如圖,以下就是轉(zhuǎn)換好的HTML網(wǎng)頁文件啦!
近有一個業(yè)務(wù)是前端要上傳word格式的文稿,然后用戶上傳完之后,可以用瀏覽器直接查看該文稿,并且可以在富文本框直接引用該文稿,所以上傳word文稿之后,后端保存到db的必須是html格式才行,所以涉及到word格式轉(zhuǎn)html格式。
通過調(diào)查,這個word和html的處理,有兩種方案,方案1是前端做這個轉(zhuǎn)換。方案2是把word文檔上傳給后臺,后臺轉(zhuǎn)換好之后再返回給前端。至于方案1,看到大家的反饋都說很多問題,所以就沒采用前端轉(zhuǎn)的方案,最終決定是后端轉(zhuǎn)化為html格式并返回給前段預(yù)覽,待客戶預(yù)覽的時候,確認(rèn)格式?jīng)]問題之后,再把html保存到后臺(因為word涉及到的格式太多,比如圖片,visio圖,表格,圖片等等之類的復(fù)雜元素,轉(zhuǎn)html的時候,可能會很多格式問題,所以要有個預(yù)覽的過程)。
對于word中普通的文字,問題倒不大,主要是文本之外的元素的處理,比如圖片,視頻,表格等。針對我本次的文章,只處理了圖片,處理的方式是:后臺從word中找出圖片(當(dāng)然引入的jar包已經(jīng)帶了獲取word中圖片的功能),上傳到服務(wù)器,拿到絕對路徑之后,放入到html里面,這樣,返回給前端的html內(nèi)容,就可以直接預(yù)覽了。
maven引入相關(guān)依賴包如下:
<poi-scratchpad.version>3.14</poi-scratchpad.version>
<poi-ooxml.version>3.14</poi-ooxml.version>
<xdocreport.version>1.0.6</xdocreport.version>
<poi-ooxml-schemas.version>3.14</poi-ooxml-schemas.version>
<ooxml-schemas.version>1.3</ooxml-schemas.version>
<jsoup.version>1.11.3</jsoup.version>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-scratchpad</artifactId>
<version>${poi-scratchpad.version}</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>${poi-ooxml.version}</version>
</dependency>
<dependency>
<groupId>fr.opensagres.xdocreport</groupId>
<artifactId>xdocreport</artifactId>
<version>${xdocreport.version}</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml-schemas</artifactId>
<version>${poi-ooxml-schemas.version}</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>ooxml-schemas</artifactId>
<version>${ooxml-schemas.version}</version>
</dependency>
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>${jsoup.version}</version>
</dependency>
word轉(zhuǎn)html,對于word2003和word2007轉(zhuǎn)換方式不一樣,因為word2003和word2007的格式不一樣,工具類如下:
使用方法如下:
public String uploadSourceNews(MultipartFile file) {
String fileName = file.getOriginalFilename();
String suffixName = fileName.substring(fileName.lastIndexOf("."));
if (!".doc".equals(suffixName) && !".docx".equals(suffixName)) {
throw new UploadFileFormatException();
}
DateTimeFormatter formatter = DateTimeFormatter.ofPattern("yyyyMM");
String dateDir = formatter.format(LocalDate.now());
String directory = imageDir + "/" + dateDir + "/";
String content = null;
try {
InputStream inputStream = file.getInputStream();
if ("doc".equals(suffixName)) {
content = wordToHtmlUtil.Word2003ToHtml(inputStream, imageBucket, directory, Constants.HTTPS_PREFIX + imageVisitHost);
} else {
content = wordToHtmlUtil.Word2007ToHtml(inputStream, imageBucket, directory, Constants.HTTPS_PREFIX + imageVisitHost);
}
} catch (Exception ex) {
logger.error("word to html exception, detail:", ex);
return null;
}
return content;
}
關(guān)于doc和docx的一些存儲格式介紹:
docx 是微軟開發(fā)的基于 xml 的文字處理文件。docx 文件與 doc 文件不同, 因為 docx 文件將數(shù)據(jù)存儲在單獨的壓縮文件和文件夾中。早期版本的 microsoft office (早于 office 2007) 不支持 docx 文件, 因為 docx 是基于 xml 的, 早期版本將 doc 文件另存為單個二進(jìn)制文件。
DOCX is an XML based word processing file developed by Microsoft. DOCX files are different than DOC files as DOCX files store data in separate compressed files and folders. Earlier versions of Microsoft Office (earlier than Office 2007) do not support DOCX files because DOCX is XML based where the earlier versions save DOC file as a single binary file.
可能你會問了,明明是docx結(jié)尾的文檔,怎么成了xml格式了?
很簡單:你隨便選擇一個docx文件,右鍵使用壓縮工具打開,就能得到一個這樣的目錄結(jié)構(gòu):
所以你以為docx是一個完整的文檔,其實它只是一個壓縮文件。
參考:
https://www.cnblogs.com/ct-csu/p/8178932.html
*請認(rèn)真填寫需求信息,我們會在24小時內(nèi)與您取得聯(lián)系。