整合營銷服務商

          電腦端+手機端+微信端=數據同步管理

          免費咨詢熱線:

          網頁轉pdf,這個工具真好用

          兩天有個客戶需要把網頁轉為pdf,之前也沒開發過類似的工具,就在百度搜索了一波,主要有下面三種

          1. 在線轉pdf
          2. 使用瀏覽器打印功能轉pdf
          3. 使用本地軟件工具轉pdf

          在線轉pdf

          在百度(我一般用必應)搜索“在線網頁轉pdf”就有很多可以做這個事的網站,免費的如

          • PDF24Tools

          各種pdf的操作都有,免費使用,速度一般。

          官網地址https://tools.pdf24.org/zh

          PDF24 Tools

          • doctron

          開源免費項目,使用golang寫的,提供在線轉

          官網地址http://doctron.lampnick.com/

          doctron在線體驗demo

          還有挺多其他的,可以自己搜索,但是都不符合我的預期。

          使用瀏覽器打印功能轉pdf

          1. 在瀏覽器右鍵,點擊打印或者ctrl+p
          2. 在彈出的打印對話框中找到目標打印機選擇“另存為PDF”
          3. 點擊“保存”按鈕即可下載pdf了

          使用本地軟件工具轉pdf

          Doctron,這是我今天要介紹的重頭戲。

          Doctron是基于Docker、無狀態、簡單、快速、高質量的文檔轉換服務。目前支持將html轉為pdf、圖片(使用chrome(Chromium)瀏覽器內核,保證轉換質量)。支持PDF添加水印。

          • 使用chrome內核保證高質量將HTML轉為pdf/圖片。
          • 簡易部署(提供docker鏡像,Dockerfile以及k8s yaml配置文件)。支持豐富的轉換參數。轉為pdf和圖片支持自定義大小。
          • 無狀態服務支持。

          管他的,先把代碼下載下來再說

          git clone https://gitcode.net/mirrors/lampnick/doctron.git

          倉庫

          運行

          go build
          ./doctron --config conf/default.yaml

          運行截圖

          轉pdf,訪問http://127.0.0.1:8080/convert/html2pdf?u=doctron&p=lampnick&url=<url>,更換鏈接中的url為你需要轉換的url即可。

          轉換效果

          然后就可以寫程序去批量轉換需要的網頁了,但是我需要轉換的網頁有兩個需求

          1、網站需要會員登錄,不然只能看得到一部分

          2、需要把網站的頭和尾去掉的

          這就為難我了,不會go語言啊,硬著頭皮搞了,肯定有個地方打開這個url的,就去代碼慢慢找,慢慢調試,功夫不負有心人,終于找到調用的地方了。

          第一步:添加網站用戶登錄cookie

          添加cookie之前

          添加cookie之后

          第二步:去掉網站頭尾

          chromedp.Evaluate(`$('.header').css("display" , "none");
          		$('.btn-group').css("display" , "none");
          		$('.container .container:first').css("display" , "none");
          		$('.breadcrumb').css("display" , "none");
          		$('.footer').css("display" , "none")`, &ins.buf),

          打開網頁后執行js代碼把頭尾隱藏掉

          第三步:程序化,批量自動生成pdf

          public static void createPDF(String folder , String cl ,  String pdfFile, String urlhref) {
                  try {
                      String fileName = pdfFile.replace("/", ":");
                      String filePath = folder + fileName;
                      File srcFile = new File(filePath);
                      File newFolder = new File("/Volumes/disk2/myproject" + File.separator + cl);
                      File destFile = new File(newFolder, fileName);
                      if(destFile.exists()){
                          return;
                      }
                      if(srcFile.exists()){
                          //移動到對應目錄
                          if(!newFolder.exists()){
                              newFolder.mkdirs();
                          }
                          FileUtils.moveFile(srcFile , destFile);
                          return;
                      }
                      if(!newFolder.exists()){
                          newFolder.mkdirs();
                      }
                      String url = "http://127.0.0.1:8888/convert/html2pdf?u=doctron&p=lampnick&url="+urlhref;
                      HttpEntity<String> entity = new HttpEntity<String>(null, null);
                      RestTemplate restTemplate = new RestTemplate();
                      ResponseEntity<byte[]> bytes = restTemplate.exchange(url, HttpMethod.GET, entity, byte[].class);
                      if (bytes.getBody().length <= 100) {
                          if(urlList.containsKey(urlhref)){
                              Integer failCount = urlList.get(urlhref);
                              if(failCount > 3){
                                  System.out.println("下載失敗:" + cl + " / " + pdfFile +"  " + urlhref);
                                  return;
                              }
                              failCount++;
                              urlList.put(urlhref , failCount);
                          }else{
                              urlList.put(urlhref , 1);
                          }
          
                          createPDF(folder , cl ,  pdfFile , urlhref);
                      }else{
                          if (!destFile.exists()) {
                              try {
                                  destFile.createNewFile();
                              } catch (Exception e) {
                                  e.printStackTrace();
                              }
                          }
                          try (FileOutputStream out = new FileOutputStream(destFile);) {
                              out.write(bytes.getBody(), 0, bytes.getBody().length);
                              out.flush();
                          } catch (Exception e) {
                              e.printStackTrace();
                          }
                      }
                  } catch (Exception e) {
                      e.printStackTrace();
                  }
              }

          最終成果:


          文件夾分類存放

          pdf文件

          于程序員來說,每天編寫代碼是他們必做的事。就像從事網課教育行業的小伙伴來說,他們需要在代碼的框架里加入PDF文檔的講義內容。如果采取手動撰寫PDF里的內容會拉低整體的工作效率,但是直接添加將PDF轉換為HTML格式用到程序框架中的話,就可以省掉許多無謂步驟了。那你們知道PDF轉HTML格式怎么弄?下面我就來告訴你們幾個簡單的轉換方法,你們快來看看吧!

          方法一:使用全能PDF轉換助手

          這是一款專業的文件轉換軟件,它能支持很多種文件轉換格式,包括PDF轉HTML、PDF轉Word、PDF轉Excel、PDF轉PPT、WPS轉Word、CAD轉圖片等格式,而且它大部分的轉換功能都支持批量的文件導入,對于辦公人士來說,非常方便。

          操作如下:

          第一步:首先在電腦上打開該軟件,點擊【PDF轉其他】,選擇【PDF轉HTML】,導入一個或者多個需要轉換的PDF文件。

          第二步:根據我們的需要,在文件后面選擇要轉換的頁碼,再點擊右下角的【開始轉換】,稍等片刻,系統就會自動轉換并下載好HTML格式的文件了。

          另外這款軟件還新推出了手機APP版本,可以隨時幫助我們進行轉換文件格式、翻譯、壓縮等操作,如果你們有興趣的話,也可以去下載試一試。

          方法二:使用萬能文字識別軟件

          這個軟件雖然是一個識別軟件,但它的功能也不少。該軟件也支持PDF轉換處理,我們只需使用這個軟件就可以快速地把PDF轉換HTML格式。

          操作如下:

          第一步:首先依次點擊該軟件的【PDF轉換處理】——【PDF轉HTML】,然后導入需要轉換格式的PDF文件。

          第二步:然后根據我們的需要點擊下面的【添加文件】添加多個需要轉換的PDF文件,再點擊【開始轉換】,HTML的格式就轉換好了。

          以上就是今天的內容,現在你們應該都知道PDF轉HTML格式怎么弄了吧?如果大家還知道其他更好的方法,歡迎在評論區留言哦。

          數字化時代,HTML網頁文件已成為我們獲取和分享信息的主要方式。但有時,為了保留網頁的格式和內容,我們可能需要將其轉換為PDF文檔。此時,首助編輯高手軟件將是您的得力助手。下面,就讓我們一起了解如何使用首助編輯高手將HTML網頁文件轉為PDF文檔。

          第一步,打開軟件,在眾多功能板塊中,選擇“PDF編輯工具”中的“批量轉換格式”功能

          第二步,在轉換模式對應的下拉列表中,將選項切換為“HTML轉PDF”

          第三步,通過“添加文件”或者“添加文件夾中的文件”將HTML網頁文件導入,支持導入多個

          第四步,設置新文件保存位置,可以將新文件保存在原文件相同位置,也可以指定位置

          第五步,確定選擇好一系列相關的選項之后,單擊右下角的“開始轉換”按鈕

          第六步,提示轉換成功后,打開文件夾查看,所有HTNL網頁文件都被轉為PDF文檔,最后也可以打開原文件進行對比,原文件均為HTML,說明轉換成功

          總之,軟件以其簡潔的操作界面、強大的功能和高效的轉換速度,成為了將HTML網頁文件轉為PDF文檔的理想選擇。無論您是學生、上班族還是專業人士,都能滿足您的需求,讓您的文檔處理變得更加輕松和高效。趕快下載并體驗首助編輯高手吧!


          主站蜘蛛池模板: 偷拍激情视频一区二区三区| 国产福利91精品一区二区三区| 亚洲一区综合在线播放| 亚洲av综合av一区二区三区| 日韩精品一区二区午夜成人版 | 国产精品一区二区电影| 国产成人AV一区二区三区无码| 国产精品一区二区在线观看| 精品国产一区二区三区麻豆| 狠狠爱无码一区二区三区| 麻豆AV无码精品一区二区 | 精品视频无码一区二区三区| 精品人妻一区二区三区毛片 | 国产在线一区二区三区在线| 无码人妻品一区二区三区精99| 麻豆视传媒一区二区三区| 亚洲AV无码一区二区三区人| 伊人激情AV一区二区三区| 日本中文字幕在线视频一区| 成人毛片一区二区| 国内自拍视频一区二区三区| 高清国产AV一区二区三区| 久久精品中文字幕一区| 亚洲毛片不卡av在线播放一区| 国产日韩精品一区二区在线观看播放 | 国产美女av在线一区| 亚洲乱码av中文一区二区| 亚洲欧洲精品一区二区三区| 亚洲一区二区三区首页| 久久se精品一区精品二区国产| 日本国产一区二区三区在线观看 | 亚洲综合av永久无码精品一区二区| 日本一区二区三区不卡视频| AA区一区二区三无码精片| 无码人妻一区二区三区免费看| 国产精品亚洲一区二区三区在线 | 欧美人妻一区黄a片| 波多野结衣一区二区三区aV高清| 激情综合丝袜美女一区二区| 一区二区三区在线免费 | 3d动漫精品啪啪一区二区免费|