日常工作中,我們通常處理的文件格式是PDF,這是因為PDF文件具有傳輸方便、體積小、儲存方便、在不同設備上打開不會出現格式混亂和亂碼等優點。但是,有時候我們需要將PDF文件轉換成其他格式,以滿足不同的工作需求。其中,HTML文件是一種超文本文件,通常只能通過瀏覽器打開。那么,你知道有哪些PDF轉HTML轉換器嗎?今天,我將為大家介紹幾款PDF轉換器,讓我們輕松解決這一問題。
新ABBYY FineReader 14于2017年1月正式發布,它將文檔轉換、PDF管理和文檔對比功能結合到單一的現代界面,提供了一體化商業解決方案,通過基于紙質的PDF文件和掃描文件優化了日常工作任務。安裝ABBYY FineReader 14之前,先要了解一下這個版本對系統的要求都有哪些:
注意:ABBYY FineReader 14對系統的要求相對ABBYY FineReader 12來說有所不同。
ABBYY FineReader 14系統要求:
?Microsoft Windows 10 / 8.1 / 8 / 7 。
?Microsoft Windows Server 2016 / 2012 / 2012 R2 / 2008 R2 。
?界面語言要求Windows支持相應的語言。
?1GHz或者SSE2指令集支持的更快的x86 或 x64處理器。
?1GB內存(建議4GB內存)。
?1.2GB硬盤空間用于標準程序安裝,1.2GB自由空間用于優化程序運行。
?監視器要求:1024x768分辨率或更高
?激活產品時需要聯網。
?鍵盤、鼠標或其他指示設備。
知識補充:ABBYY FineReader 14支持的文件格式:
1、輸入文件格式:
?PDF文檔,包括PDF/A。
?圖像格式—TIFF、JPEG、JPEG 2000、JBIG2、PNG、BMP、PCX、GIF、DjVu、XPS(需要Microsoft .NET Framework 4.0)。
?可編輯的格式(要從可編輯的格式創建PDF文件,要求電腦上安裝Microsoft Office或Apache OpenOffice)—DOC(X)、XLS(X)、PPT(X)、VSD(X)、HTML、RTF、TXT、ODT、ODS、ODP。
2、保存格式:
?PDF(可搜索、僅圖像、文本和圖像),包括PDF/A (1a、1b、2a、2b、2u、3a、3b、3u)。
?圖像格式—TIFF、JPEG、JPEG 2000、JBIG2、PNG、BMP、PCX、DjVu。
?可編輯格式—DOC(X)、XLS(X)、PPT、HTML、RTF、TXT、CSV、ODT。
?電子書格式—EPUB、FB2。
更多有關ABBYY FineReader 14的內容,可點擊ABBYY下載(http://www.abbyychina.com/xiazai.html),安裝最新版本獲取更多信息。
語管理應用
術語管理工具指用于管理術語數據的軟件程序,借助專業的術語管理工具可以進行有效的術語管理。但研究發現國內語言服務企業存在術語管理價值重視程度不足,術語工具普及度較低等問題。本文將從實際應用的角度出發,介紹術語管理工具通常具備的幾大功能以及相關工具。
壹
術語轉換
術語數據轉換功能是指將非結構化的掃描文件轉換為計算機可以識別的、編輯的數據文件,或者從一種特定的數據格式轉換為其他格式。術語管理工具通常可以將術語數據導入或導出為指定的術語格式。
相關工具:
1. Déjà Vu
在Déjà Vu的術語管理模塊中,可以將分隔符分隔的文本文件、Access術語文件、ODBC數據庫術語文件、Excel術語文件以及MultiTerm術語文件導入為DéjàVu術語庫格式文件(.dvtdb),也可將Déjà Vu術語庫格式文件(.dvtdb)導出為分隔符分隔的文本文件、Access術語文件、ODBC數據庫術語文件、Excel術語文件以及MultiTerm術語文件,從而實現了分隔符分隔的文本文件、Access術語文件、ODBC數據庫術語文件、Excel術語文件、MultiTerm術語文件以及Déjà Vu術語庫格式文件(.dvtdb)之間的相互轉換。
Déjà Vu術語轉換頁面
2. SDL MultiTerm Desktop
SDL MultiTerm Desktop支持將術語數據導出為XML、HTML、HTM、RTF、TXT格式的術語文件。用戶可以在導出時設置自己的術語數據導出方式,例如,定義導出哪些條目、導出哪些字段,以及如何進行標記。
但SDL MultiTerm僅可從MultiTerm XML文件導入數據。若要從其他格式導入術語數據,可以使用其產品包自帶的組件SDL MultiTerm Convert將數據轉換成 MultiTerm XML格式。SDL MultiTerm Convert支持的文件格式有:XLS、*.mtw、 TXT、CSV、TBX、*.XML 、*.tdb 文件以及*.mdb 文件。
SDL MultiTerm Convert轉換格式選擇
3. Trados Glossary Converter
Trados Glossary Converter也是SDL旗下的一個應用程序,是相對SDL MultiTerm更簡單輕便的一個術語轉換工具。用戶只需進行簡單操作,便可實現在不同的詞匯表格式(包括各種Excel樣式,TBX和UTX)和MultiTerm術語庫(XTD和XML)之間進行轉換。
4. memoQ
在memoQ的資源控制臺中也可實現術語表的轉化,可導入的文件類型有TBX、CSV和XLSX,可導出的文件類型有CSV、XLSX和Multiterm XML。
memoQ創建術語庫界面
術語標注
貳
術語標注通過自動化的術語管理工具在翻譯文件中自動查找庫中出現過的術語,并以批注的方式插入到文本編輯器中,這是常見的術語標注方法。翻譯之前,可利用術語工具完成術語自動標注工作,從而大大減少術語查詢工作量,提升翻譯效率。
相關工具:
當前國內代表性的術語標注工具有火云術語和語帆術語寶等。以語帆術語寶為例,選擇術語標注上傳要進行標注術語的文檔或者術語要標注的文本,選擇術語庫,就可以在該段文字中將術語標注出來。
語帆術語寶自動標注界面
(圖源:公眾號“語帆術語寶”)
叁
術語提取
術語提取是從術語收集過程中所得材料或數據中分析并識別術語的過程。根據工作主體不同,術語提取可分為人工手動提取和機器自動提取。機器自動提取術語的方法主要包括基于詞典、基于統計、基于語言規則、基于機器學習的方法以及結合其中若干種方法。基于詞典的方法進行提取的機制是匹配專業詞典中的詞條。基于統計的方法利用的是術語的統計屬性,以此進行術語識別,從而完成提取。基于語言規則的方法則結合外部信息(即術語上下文)和內部信息(即術語的內部組成成分)來識別術語,完成提取。基于機器學習的方法如利用統計模型(如隱馬爾科夫模型)進行識別中文術語。
相關工具:
此類工具包括計算機輔助翻譯工具中自帶的工具,如memoQ、Déjà Vu、Wordfast等,以及獨立型工具,如AntConc、SDL MultiTerm、SynchroTerm、TermoStat Web、Lexterm、VocabGrabber、TerMine、Fivefilters Term Extraction、語帆術語寶 (Termbox) 等。下圖展示的是語帆術語寶提取術語和自動翻譯的過程。此類工具可將相應格式的單語或雙語文件導入,工具自動提取詞組,根據詞頻高低排列。有些工具可以根據內置數據庫或第三方資源對術語進行自動翻譯,供譯員選擇和確認。
語帆術語寶提取術語和自動翻譯界面
(圖源:王華樹,王少爽,2019)
今天公眾號的副推文還介紹了Trados、memoQ和語帆術語寶的術語提取方法,感興趣可移步閱讀~
術語應用
肆
術語應用泛指在術語數據庫或術語系統中進行術語的搜索、識別和編輯等功能。在創建術語庫的時候,通常會明確術語庫的使用對象、使用范圍、語言對、術語結構、設計字段、定義層級結構以及項目其他屬性等信息。在翻譯的時候,系統可以自動識別譯文中的相應的術語,并根據設置的規則,相應地插入到譯文區。用戶也可以在單獨的一個或多個術語庫中進行串行或并行搜索,快速找到所需要的專業術語。用戶也可針對某個術語或批量的術語進行術語編輯操作,比如,修改術語狀態、標記術語級別、刪除術語信息等。
相關工具:
各大術語管理軟件均有較完備的術語應用功能,用戶可在使用時多加摸索。以SDL MultiTerm為例,該應用程序支持模糊搜索、通配符搜索、全文搜索、多術語庫搜索、同形異義詞搜索等多種檢索方式,最大程度地滿足用戶的需求;還支持術語的批量編輯,更簡便地確保術語一致性。
伍
術語質量保障
術語質量保障分為兩個方面。第一,術語入庫質量機制保障,根據專門的流程,確保術語各項屬性信息遵從項目的術語規范或術語風格指南。第二,對翻譯項目中術語質量的驗證,通過設置術語質量標準,加載核實的術語庫,對項目中的術語進行驗證。在 SDL Trados Studio 中,在翻譯項目完成之后,通過“術語驗證器”進行全局術語質量驗證。
小結
術語管理對語言服務企業管理的改進和個人翻譯質量和效率的提升都具有重大意義。隨著語言服務的集群化、規模化和信息化發展,社會化分工程度逐漸加深,語言服務人才趨向多元化,術語管理人才的社會需求也會越來越大。為此,譯者注重術語管理能力培養,對個人業務能力提升和職業發展都有積極意義。
參考文獻:
[1] 王華樹. 中國語言服務企業術語管理調研:問題與對策[J]. 中國翻譯, 2018, 39(4): 67-72.
[2] 王華樹,王少爽. 翻譯場景下的術語管理:流程、工具與趨勢[J]. 中國科技術語, 2019, 21(3): 9-14.
[3] 王華樹,張靜. 信息化時代口譯術語管理及其技術應用研究[J]. 外文研究, 2017, 5(4): 72-77, 105-106.
[4] SDLTrados.2021 開工必讀 | SDL MultiTerm 最全技術方案(更新版).Trados,2021,https://mp.weixin.qq.com/s/OcJSmH2pu8SMcyontBcTjA.
[5] 語帆術語寶.語帆術語寶,一站式術語管理!.語帆術語寶,2021,https://mp.weixin.qq.com/s/ksgXh9guh32-3UK3hZ8Nfw.
關注微信公眾號“語言服務行業”,“翻譯技術教育與研究”,了解更多語言服務行業與翻譯技術相關的資訊和洞察~
*請認真填寫需求信息,我們會在24小時內與您取得聯系。