TML是網頁的標準格式,具有良好的可讀性和可訪問性以及更強的可編輯性。與PDF相比,HTML文檔更容易進行修改和更新。將PDF轉換為HTML后,文檔內容可以在各種瀏覽器和設備上自由查看,為用戶提供更便捷的訪問體驗。
另外將PDF轉成HTML網頁后也有助于提升信息的傳播和分享效率,由于HTML文檔可以直接在瀏覽器中打開,用戶可以方便地與他人分享和傳播文檔內容,無需擔心格式兼容性問題。
那么如何將PDF轉成HTML網頁呢?
方法一:
使用在線轉換工具是最簡單、最快捷的方式之一。一些在線工具例如smallpdf中文版、speedpdf、ilovepdf中文版等都提供了PDF轉HTML的功能;
它們的操作方法也非常簡單,跟其他在線工具不同的是smallpdf中文版還支持一鍵批量轉換和下載,所以下面用smallpdf中文版操作步驟為例:
1、打開瀏覽器輸入smallpdf中文版搜索并找到官網并進入,在首頁找到或直接在右上角的搜索框查找并選擇PDF轉HTML進入轉換;
2、點擊“選擇文件”添加需要轉換的PDF文件;接著勾選“文件名稱”前的邊框,右上角就會出現“批量轉換”按鈕,點擊即可一鍵開始轉換已添加的所有文檔,無需一個一個點擊轉換。等待轉換完成后同樣的一鍵批量下載即可。
方法二:
另外也可以使用轉換器來實現,有一個PDF轉換器是可以將PDF轉成HTML的,例如極速玩轉,操作方法如下:
1、打開極速玩轉轉換器,在“PDF轉換”中找到并選擇“PDF轉HTML”;
2、將所有需要轉換的PDF文件拖到轉換區域后,點擊右下角的開始轉換即可一鍵批量處理。
以上就是將PDF文件轉成網頁的兩種方法,可以根據實際需要選擇合適的方法。
DF文件是工作學習中的常客,在使用過程中,常常需要對PDF格式進行轉換,包括但不限于PDF轉Word、PDF轉PPT、PDF轉圖片等等。
不過WPS雖然應用廣泛,但是里面關于PDF的轉換工具必需要會員才可以使用,但又不愿意只為了轉換一次而花費錢去買會員,本文為大家提供了5款免費在線轉換PDF的網站,建議收藏以備不時之需~
I LOVE PDF是一款免費的PDF網站,界面設計簡潔,首頁沒有廣告,但每個功能的操作界面是有廣告的,不會影響使用。
部分功能:合并PDF、拆分PDF、壓縮PDF、PDF轉換至Word、PDF轉換至PowerPoint、PDF轉換至Excel、word轉換至PDF文件、PowerPoint轉換至PDF、Excel轉換至PDF、PDF轉JPG、JPG轉PDF、頁碼、水印、旋轉PDF、HTML轉換PDF、PDF解密、PDF加密、排版PDF文件、PDF轉換PDF/A、修復PDF
免費的在線文檔格式轉換軟件,不僅有常見的格式,還有諸多不常見文檔格式在這里都有,包括電子書格式轉換,一個網站解決各種文檔格式轉換問題。
部分功能:
文檔轉換→DF轉換至Word、PDF轉換至PowerPoint、PDF轉換至Excel、word轉換至PDF文件、PowerPoint轉換至PDF、Excel轉換至PDF、PDF轉JPG、JPG轉PDF
文檔處理→PDF臺并、PDF分割、PDF解密、PDF增加密碼、PDF修改密碼、PDF圖片獲取、PDF刪除頁、PDF頁面提取、PDF旋轉、PDF頁面編輯、PDF替換文字、PDF添加水印、PDF刪除水印、PDF添加文字、PDF刪除文字、PDF鏈接編輯、PDF添加頁碼、PDF刪除圖片、PDF背景顏色、PDF簽名等
除此之外,還有音視頻格式轉等功能,網站功能免費,頁面沒有廣告,可以放心使用。
轉換為PDF和20多種格式的文件。此外,PDF Candy提供47種在線工具來處理PDF:編輯、拆分、合并、壓縮等等。
ALL TO ALL在線格式轉換,國內最全類型的在線文件轉換平臺,免費、快速,無須下載安裝任何軟件。支持約200多種格式的文件轉換,包括:視頻、音頻、圖片、字體等多媒體文件,以及常見的office文件、PDF、電子書等文檔。
ONLINE2PDF是個完全免費的良心線上PDF編輯網站,需要配合自帶翻譯功能的瀏覽器使用,目前國內訪問正常,功能豐富,操作簡便。
以上就是全部的內容推薦啦,如果有幫助,記得點個贊吖~
兩天有個客戶需要把網頁轉為pdf,之前也沒開發過類似的工具,就在百度搜索了一波,主要有下面三種
在百度(我一般用必應)搜索“在線網頁轉pdf”就有很多可以做這個事的網站,免費的如
各種pdf的操作都有,免費使用,速度一般。
官網地址https://tools.pdf24.org/zh
PDF24 Tools
開源免費項目,使用golang寫的,提供在線轉
官網地址http://doctron.lampnick.com/
doctron在線體驗demo
還有挺多其他的,可以自己搜索,但是都不符合我的預期。
Doctron,這是我今天要介紹的重頭戲。
Doctron是基于Docker、無狀態、簡單、快速、高質量的文檔轉換服務。目前支持將html轉為pdf、圖片(使用chrome(Chromium)瀏覽器內核,保證轉換質量)。支持PDF添加水印。
管他的,先把代碼下載下來再說
git clone https://gitcode.net/mirrors/lampnick/doctron.git
倉庫
運行
go build
./doctron --config conf/default.yaml
運行截圖
轉pdf,訪問http://127.0.0.1:8080/convert/html2pdf?u=doctron&p=lampnick&url=<url>,更換鏈接中的url為你需要轉換的url即可。
轉換效果
然后就可以寫程序去批量轉換需要的網頁了,但是我需要轉換的網頁有兩個需求
1、網站需要會員登錄,不然只能看得到一部分
2、需要把網站的頭和尾去掉的
這就為難我了,不會go語言啊,硬著頭皮搞了,肯定有個地方打開這個url的,就去代碼慢慢找,慢慢調試,功夫不負有心人,終于找到調用的地方了。
第一步:添加網站用戶登錄cookie
添加cookie之前
添加cookie之后
第二步:去掉網站頭尾
chromedp.Evaluate(`$('.header').css("display" , "none");
$('.btn-group').css("display" , "none");
$('.container .container:first').css("display" , "none");
$('.breadcrumb').css("display" , "none");
$('.footer').css("display" , "none")`, &ins.buf),
打開網頁后執行js代碼把頭尾隱藏掉
第三步:程序化,批量自動生成pdf
public static void createPDF(String folder , String cl , String pdfFile, String urlhref) {
try {
String fileName = pdfFile.replace("/", ":");
String filePath = folder + fileName;
File srcFile = new File(filePath);
File newFolder = new File("/Volumes/disk2/myproject" + File.separator + cl);
File destFile = new File(newFolder, fileName);
if(destFile.exists()){
return;
}
if(srcFile.exists()){
//移動到對應目錄
if(!newFolder.exists()){
newFolder.mkdirs();
}
FileUtils.moveFile(srcFile , destFile);
return;
}
if(!newFolder.exists()){
newFolder.mkdirs();
}
String url = "http://127.0.0.1:8888/convert/html2pdf?u=doctron&p=lampnick&url="+urlhref;
HttpEntity<String> entity = new HttpEntity<String>(null, null);
RestTemplate restTemplate = new RestTemplate();
ResponseEntity<byte[]> bytes = restTemplate.exchange(url, HttpMethod.GET, entity, byte[].class);
if (bytes.getBody().length <= 100) {
if(urlList.containsKey(urlhref)){
Integer failCount = urlList.get(urlhref);
if(failCount > 3){
System.out.println("下載失敗:" + cl + " / " + pdfFile +" " + urlhref);
return;
}
failCount++;
urlList.put(urlhref , failCount);
}else{
urlList.put(urlhref , 1);
}
createPDF(folder , cl , pdfFile , urlhref);
}else{
if (!destFile.exists()) {
try {
destFile.createNewFile();
} catch (Exception e) {
e.printStackTrace();
}
}
try (FileOutputStream out = new FileOutputStream(destFile);) {
out.write(bytes.getBody(), 0, bytes.getBody().length);
out.flush();
} catch (Exception e) {
e.printStackTrace();
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
最終成果:
文件夾分類存放
pdf文件
*請認真填寫需求信息,我們會在24小時內與您取得聯系。