享文章、文檔資料的時候,你還在使用紙質的文件嗎?
現在有一種全新的方法啦!那就是二維碼。
隨著互聯網的飛速發展,二維碼的價值正在被越來越多的人發現和應用。在各行各業,人們使用二維碼來存儲信息、傳遞信息,通過二維碼實現便捷交易,利用二維碼來做宣傳、市場營銷等等。
毋庸置疑的是,二維碼最基本的作用是傳遞信息。那么使用二維碼傳遞信息到底有哪些優勢呢?
一,使用二維碼傳遞信息的優勢有哪些?
1,傳播迅速
掃描二維碼,便可立即查看其內容,不論是跳轉網址、還是查看文檔、視頻、音頻,都可以通過掃描一個二維碼來實現,可以迅速獲知信息的內容。無需登錄某個網站、郵箱、或者查看紙質文件。
2,不受地域限制
只要你在地球上任何一個連網的地方,都能使用二維碼。
3,經濟環保
查看資料、分享知識,一個二維碼就能搞定,從而大大避免了紙張的浪費。所以我們完全可以說,二維碼是環境友好型信息傳遞者。
4,具有保密功能
使用二維碼分享資料的時候,還可以設置密碼。掃碼之后需要輸入密碼才能查看內容,所以是具有一定的保密功能的。
二,哪些場景會需要文檔二維碼呢?
1,教育行業
考試、知識分享、布置作業
2,新媒體運營、作家、編輯等
用來存儲文檔、分享分檔、提交稿子等。
3,招聘求職
提交簡歷作品集、簡歷分享,還有招聘信息發布也能通過二維碼來實現。
4,品牌和產品相關
諸如:品牌活動宣傳、產品電子說明書之類的。
三,如何將文章制作成一個二維碼呢?
第一步,登錄二維彩虹二維碼生成器官方網站
第二步,選擇“文件”選項
并且上傳準備好的文件。這里支持的文本格式包括以下這些類型:
除了Word和TXT格式的文件外,二維彩虹還支持以下格式的辦公文件。
演示文件:pptx、ppt、pot、potx、pps、ppsx、dps、dpt、pptm、potm、ppsm
表格文件:xls、xlt、et、ett、xlsx、xltx、csv、xlsb、xlsm、xltm
文字文件:doc、dot、wps、wpt、docx、dotx、docm、dotm
其他格式文件:jpg、png、pdf、mp3、mp4、 lrc、 c、 cpp、 h、 asm、 s、 java、 asp、 bat、 bas、 prg、 cmd、 rtf、 log、 xml、 htm、 html
第三步,生成動態二維碼
一般我們建議使用動態二維碼。因為動態二維碼在應用過程中是明顯具有優勢的。首先,在二維碼制作完成之后,若是發現文件的內容需要更新,那么直接進入后臺重新更新內容即可,更新之后,再掃描二維碼就能看到最新更新的信息了。
另外,動態二維碼還可以追蹤二維碼的掃描數據,比如掃描時間、數量、位置、設備等。
第四步,美化二維碼
可以對二維碼的樣式進行一些自定義設計。比如調整二維碼樣式、邊框、圖眼,還可以根據自己的喜好設置好看的漸變色,更能上傳logo和頭像。
第五步,測試二維碼
這是非常重要的一步,在美化二維碼之后一定要進行掃描測試,確保二維碼能被識別出來,同時顯示的內容沒有問題。
第六步,下載應用二維碼
第七步,設置密碼
進入追蹤數據一欄,找到對應的二維碼,點擊旁邊的密碼鎖按鈕,即可設置這個二維碼的密碼了。設置完成之后,任何人掃描二維碼想要查看內容,都必須先輸入你設置的密碼才可以查看。
到此,文件二維碼就制作完成了。
當然啦,如果你想要制作圖文并存的二維碼,或者是包含視頻、音頻的二維碼,在二維彩虹也可以輕松實現。詳細的操作步驟,請查看文末的相關閱讀即可。
Tika是一個內容分析工具,自帶全面的parser工具類,能解析基本所有常見格式的文件,得到文件的metadata,content等內容,返回格式化信息。總的來說可以作為一個通用的解析工具。特別對于搜索引擎的數據抓去和處理步驟有重要意義。Tika是Apache的Lucene項目下面的子項目,在lucene的應用中可以使用tika獲取大批量文檔中的內容來建立索引,非常方便,也很容易使用。Apache Tika toolkit可以自動檢測各種文檔(如word,ppt,xml,csv,ppt等)的類型并抽取文檔的元數據和文本內容。Tika集成了現有的文檔解析庫,并提供統一的接口,使針對不同類型的文檔進行解析變得更簡單。Tika針對搜索引擎索引、內容分析、轉化等非常有用。
應用程序員可以很容易地在他們的應用程序集成Tika。Tika提供了一個命令行界面和圖形用戶界面,使它比較人性化。在本章中,我們將討論構成Tika架構的四個重要模塊。下圖顯示了Tika的四個模塊的體系結構:
每當一個文本文件被傳遞到Tika,它將檢測在其中的語言。它接受沒有語言的注釋文件和通過檢測該語言添加在該文件的元數據信息。支持語言識別,Tika 有一類叫做語言標識符在包org.apache.tika.language及語言識別資料庫里面包含了語言檢測從給定文本的算法。Tika 內部使用N-gram算法語言檢測。
Tika可以根據MIME標準檢測文檔類型。Tika默認MIME類型檢測是使用org.apache.tika.mime.mimeTypes。它使用org.apache.tika.detect.Detector 接口大部分內容類型檢測。內部Tika使用多種技術,如文件匹配替換,內容類型提示,魔術字節,字符編碼,以及其他一些技術。
org.apache.tika.parser 解析器接口是Tika解析文檔的主要接口。該接口從提取文檔中的文本和元數據,并總結了其對外部用戶愿意寫解析器插件。采用不同的具體解析器類,具體為各個文檔類型,Tika 支持大量的文件格式。這些格式的具體類不同的文件格式提供支持,無論是通過直接實現邏輯分析器或使用外部解析器庫。
使用的Tika facade類是從Java調用Tika的最簡單和直接的方式,而且也沿用了外觀的設計模式。可以在 Tika API的org.apache.tika包Tika 找到外觀facade類。通過實現基本用例,Tika作為facade的代理。它抽象了的Tika庫的底層復雜性,例如MIME檢測機制,解析器接口和語言檢測機制,并提供給用戶一個簡單的接口來使用。
實現word文檔轉html
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<parent>
<artifactId>springboot-demo</artifactId>
<groupId>com.et</groupId>
<version>1.0-SNAPSHOT</version>
</parent>
<modelVersion>4.0.0</modelVersion>
<artifactId>tika</artifactId>
<properties>
<maven.compiler.source>8</maven.compiler.source>
<maven.compiler.target>8</maven.compiler.target>
</properties>
<dependencies>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-web</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-autoconfigure</artifactId>
</dependency>
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-test</artifactId>
<scope>test</scope>
</dependency>
<dependency>
<groupId>org.apache.tika</groupId>
<artifactId>tika-parsers</artifactId>
<version>1.17</version>
</dependency>
<dependency>
<groupId>org.projectlombok</groupId>
<artifactId>lombok</artifactId>
</dependency>
</dependencies>
</project>
package com.et.tika.controller;
import com.et.tika.convertor.WordToHtmlConverter;
import com.et.tika.dto.ConvertedDocumentDTO;
import lombok.extern.slf4j.Slf4j;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestMethod;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.multipart.MultipartFile;
import java.util.HashMap;
import java.util.Map;
@RestController
@Slf4j
public class HelloWorldController {
@RequestMapping("/hello")
public Map<String, Object> showHelloWorld(){
Map<String, Object> map = new HashMap<>();
map.put("msg", "HelloWorld");
return map;
}
@Autowired
WordToHtmlConverter converter;
/**
* Transforms the Word document into HTML document and returns the transformed document.
*
* @return The content of the uploaded document as HTML.
*/
@RequestMapping(value = "/api/word-to-html", method = RequestMethod.POST)
public ConvertedDocumentDTO convertWordDocumentIntoHtmlDocument(@RequestParam(value = "file", required = true) MultipartFile wordDocument) {
log.info("Converting word document into HTML document");
ConvertedDocumentDTO htmlDocument = converter.convertWordDocumentIntoHtml(wordDocument);
log.info("Converted word document into HTML document.");
log.trace("The created HTML markup looks as follows: {}", htmlDocument);
return htmlDocument;
}
}
package com.et.tika.convertor;
import com.et.tika.dto.ConvertedDocumentDTO;
import com.et.tika.exception.DocumentConversionException;
import lombok.extern.slf4j.Slf4j;
import org.apache.tika.exception.TikaException;
import org.apache.tika.metadata.Metadata;
import org.apache.tika.parser.ParseContext;
import org.apache.tika.parser.Parser;
import org.apache.tika.parser.microsoft.ooxml.OOXMLParser;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.stereotype.Component;
import org.springframework.web.multipart.MultipartFile;
import org.xml.sax.SAXException;
import javax.xml.transform.OutputKeys;
import javax.xml.transform.TransformerException;
import javax.xml.transform.sax.SAXTransformerFactory;
import javax.xml.transform.sax.TransformerHandler;
import javax.xml.transform.stream.StreamResult;
import java.io.IOException;
import java.io.InputStream;
import java.io.StringWriter;
/**
*
*/
@Component
@Slf4j
public class WordToHtmlConverter {
/**
* Converts a .docx document into HTML markup. This code
* is based on <a href="http://stackoverflow.com/a/9053258/313554">this StackOverflow</a> answer.
*
* @param wordDocument The converted .docx document.
* @return
*/
public ConvertedDocumentDTO convertWordDocumentIntoHtml(MultipartFile wordDocument) {
log.info("Converting word document: {} into HTML", wordDocument.getOriginalFilename());
try {
InputStream input = wordDocument.getInputStream();
Parser parser = new OOXMLParser();
StringWriter sw = new StringWriter();
SAXTransformerFactory factory = (SAXTransformerFactory)
SAXTransformerFactory.newInstance();
TransformerHandler handler = factory.newTransformerHandler();
handler.getTransformer().setOutputProperty(OutputKeys.ENCODING, "utf-8");
handler.getTransformer().setOutputProperty(OutputKeys.METHOD, "html");
handler.getTransformer().setOutputProperty(OutputKeys.INDENT, "yes");
handler.setResult(new StreamResult(sw));
Metadata metadata = new Metadata();
metadata.add(Metadata.CONTENT_TYPE, "text/html;charset=utf-8");
parser.parse(input, handler, metadata, new ParseContext());
return new ConvertedDocumentDTO(wordDocument.getOriginalFilename(), sw.toString());
}
catch (IOException | SAXException | TransformerException | TikaException ex) {
log.error("Conversion failed because an exception was thrown", ex);
throw new DocumentConversionException(ex.getMessage(), ex);
}
}
}
package com.et.tika.dto;
import org.apache.commons.lang.builder.ToStringBuilder;
/**
*
*/
public class ConvertedDocumentDTO {
private final String contentAsHtml;
private final String filename;
public ConvertedDocumentDTO(String filename, String contentAsHtml) {
this.contentAsHtml = contentAsHtml;
this.filename = filename;
}
public String getContentAsHtml() {
return contentAsHtml;
}
public String getFilename() {
return filename;
}
@Override
public String toString() {
return new ToStringBuilder(this)
.append("filename", this.filename)
.append("contentAsHtml", this.contentAsHtml)
.toString();
}
}
package com.et.tika.exception;
/**
*
*/
public final class DocumentConversionException extends RuntimeException {
public DocumentConversionException(String message, Exception ex) {
super(message, ex);
}
}
以上只是一些關鍵代碼,所有代碼請參見下面代碼倉庫
啟動Spring Boot應用
ocx是什么格式的文件?docx是微軟公司推出的一種文檔格式,它是Office 2007及以上版本中的默認文件格式。docx文件是基于XML的,可以存儲文本、圖片、表格、圖表等多種數據。
硬件型號:華碩 天選4
系統版本:Windows 11 19045.2965
軟件版本:金舟格式工廠v 2.5.0&&金舟PDF轉換器v 6.7.7.0&&WPS office 11.1.0.14309
一、docx文件格式優點
相比傳統的.doc文件,docx文件格式具有更小的文件大小、更好的兼容性、更豐富的格式支持等優點。
二、docx轉換其他文檔格式
比如,你可以將docx文件轉換為PDF、HTML、TXT、RTF等多種格式,以滿足不同的需求。
三、如何進行轉換
1、打開電腦桌面的金舟格式工廠,點擊首頁面中的“Word轉換”功能;
2、進入功能頁面,將需要轉換的docx文本批量拖拽添加入軟件,點擊左側的功能欄,例如轉換為HTML;
3、點擊“開始轉換”,等待頁面出現完成提示即可。
1、運行金舟PDF轉換器,進入功能首頁面中點擊“Word轉換”;
2、選擇左側功能欄中的“Word轉PPT”,拖拽添加需要轉換的docx文件;
3、選擇想要轉換的演示文檔格式,點擊“開始轉換”,轉換完成提示出現即可。
1、雙擊docx文件,WPS office打開之后,點擊上方的“文件>另存為其他格式”;
2、設置選擇“txt文本格式”保存即可。
右鍵想要修改的docx文件,選擇重命名,將文件后綴“.docx”修改為“.excel”,點擊出現的提示“是”,就可以了。
docx文件格式在辦公軟件中的應用越來越廣泛,它不僅具有更優秀的性能,還可以方便地轉換為其他格式。希望本文能夠幫助你更好地了解docx文件格式,更加高效地使用辦公軟件。
*請認真填寫需求信息,我們會在24小時內與您取得聯系。