近因為訂閱電子期刊產生偏差,我向位于美國的 SCRIBD 出版商申請了退回扣除的信用卡款項。整個過程雖然遇到一點點狀況,如多次登錄賬戶,基本上其 HELP CENTER 知識庫 的聊天機器人全權處理,最終完成了信用卡的退款。
因為2018年在浙江紹興為日本山形英技公司擔任 AI 聊天機器人研發,突然發現,今天的 AI 使用體驗突飛猛進且越發貼近生活。本文與您分享用 DITA 為 Google 聊天機器人提供知識的技巧。
聊天機器人是一種計算機程序,它通過語音命令或文本聊天或兩者兼而有之來模擬人類對話。Chatbot(chatterbot 的縮寫)是一種人工智能 (AI) 功能,可以通過任何主要的消息傳遞應用程序嵌入和使用。聊天機器人是自動化程序有助于為客戶增加便利。它們可以像人類一樣與客戶互動,而且互動成本幾乎可以忽略不計。
假設您有一個簡單的 DITA 主題內容,其中包含以形式放置在表中的成對問題和答案:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE topic PUBLIC "-//OASIS//DTD DITA Topic//EN" "topic.dtd">
<topic id = "frequently_asked_questions" >
<title>常見問題</title>
<body>
<p>
<table frame = "all" rowsep = "1" colsep = "1" id = "table_bkf_4dl_vsb" >
<tgroup cols = "2" >
<colspec colname = "c1" colnum = "1" colwidth = "1*" />
<colspec colname = "c2" colnum = "2" colwidth = "1*" />
<tbody>
<row>
<entry>
<p>什么是 Oxygen XML 編輯器?</p>
<p>什么是Oxygen XML?</p>
</entry>
<entry>
<p> Oxygen XML Editor 是一個很棒的工具。</p>
</entry>
</row>
<row>
<entry>如何學習 DITA?</entry>
<entry>您可以閱讀“Oxygen”用戶指南和 Oxygen XML 博客。<
</body>
</topic>
我們可以使用以下 XSLT 樣式表從 XML 內容中將訓練數據提取出來 CSV 文件:
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet xmlns:xsl = "http://www.w3.org/1999/XSL/Transform"
xmlns:xs = "http:// /www.w3.org/2001/XMLSchema" exclude-result-prefixes = "xs" version = "2.0" xmlns:oxy = "abc" >
<xsl:output method = "text" />
<xsl:template match = "/" >
<xsl:text>問題,答案
</xsl:text>
<xsl:for-each select = "//tbody/row" >
<xsl:for-each select ="entry[1]" >
<xsl:choose>
<xsl:when test = "p" >
<xsl:for-each select = "p" >
<xsl:value-of select = "oxy:escapeForCSV(normalize-space (.))" /> , <xsl:value-of
select = "oxy:escapeForCSV(normalize-space(string-join(../../entry[2]//text(), ''))) " /> <xsl:text>
</xsl:text>
</xsl:for-each>
</xsl:when>
<xsl:otherwise>
<xsl:value-of select = "oxy:escapeForCSV(normalize-space( .))”/> , <xsl:value-of
選擇= "oxy:escapeForCSV(normalize-space(string-join(../entry[2]//text(), '')))" /> <xsl:text>
</xsl:text>
</xsl:否則>
</xsl:choose>
</xsl:for-each>
</xsl:for-each>
</xsl:template>
<xsl:function name = "oxy:escapeForCSV" >
<xsl:param name = "value " />
<xsl:value-of select = "replace(replace($value, '"', '""'), ',', '","')" />
</xsl :function>
</xsl:stylesheet>
使用這兩個文件創建一個轉換場景。將輸出保存為 CSV 文件,如下圖所示:
應用轉換后,應出現以下情況 CSV 文件:
What is Oxygen XML Editor?,Oxygen XML Editor is a great tool.
What is Oxygen XML?,Oxygen XML Editor is a great tool.
How do I learn DITA?,You can read the ""Oxygen"" user's guide"," and the Oxygen XML Blog.
注意:
CSV 文件的結構包含一個包含 2 列的表,其中第一列代表問題,第二列代表答案,以逗號分隔。一般來說,一行的形式是:“問題,答案”。一個限制是每個問題只能有一個答案。為使同一個答案適合多個問題,您可以將其復制到問題對應的列表中。
接下來,按照以下步驟在Google Dialogflow 聊天機器人中使用 CSV 文件中的數據:
3. 在“設置”中,啟用BETA FEATURES。
4.轉到Knowledge > CREATE KNOWLEDGE BASE,輸入此知識庫的名稱,然后單擊 SAVE 按鈕。
5.使用 CSV 文檔進行培訓。為此:按照創建第一個并填寫字段。從您的計算機選項中選擇更新文件,然后選擇所需的文件。單擊 創建按鈕。
該文檔將在知識庫中注冊,如下圖所示:
6.將問題和答案轉換為意圖。
單擊上圖中的查看鏈接。檢查所有需要轉換意圖的問題。單擊轉換為意圖按鈕。
現在,當您單擊 Intents 時,應該會出現轉換后的問題:
7.做一個模擬。單擊集成> Web 演示,如果演示功能已經禁用,請啟用它。
8.將聊天機器人集成到您的身上 HTML 內容中。轉到 Dialogflow 集成頁面,單擊Web Demo集成,您將獲得一個 <iframe>HTML 元素,可以將其粘貼到您的身上 HTML 頁面中。使用WebHelp自定義,您還可以將 Chatbot 集成到每個生成的 HTML 頁面的頁腳中。
本文展示了如何通過使用 DITA 主題生成逗號分隔值文件 CSV 來訓練聊天機器人的意圖和答案的基本方式。百度 UNIT 同樣適用,我們后續分享。
著全球交流的加強,中文與印尼語之間的溝通需求越來越多。對于需要將中文PDF文件翻譯成印尼語PDF的用戶來說,這4款工具可以幫助您高效完成任務。無需擔心翻譯質量和準確性,這些工具都是非常優秀且易于使用的。
1、看往ai
看往ai是電商必備圖片工具,提供了視頻,圖片,文字一站式AI處理,可以幫我們翻譯任何文檔,比如doc,docx,,xls,xlsx,csv,txt,srt,pdf、html,htm,xml,xhtml,json,xliff,tmx,dita,md,markdown,idml10等多種格式的文檔,并不會破壞原有的文檔排版和元素,中文、英語語種類型的文檔都可以進行翻譯,一鍵翻譯成新的語言文檔,支持幾十種語言。
1、在百度中搜索“看往ai官網”,無需下載,即可使用(超級方便),并在頁面上方找到“文檔智能翻譯”選項。
2、進入:文檔智能翻譯功能頁面,先上傳我們需要翻譯的文檔。
3、再選擇我們的文檔的原語言和我們需要翻譯的語言,即可翻譯文檔
4、點擊生成,把翻譯后的文檔保存在本地即可。
看往ai還具備電商常用的多個功能:AI模擬模特,視頻一鍵翻譯,圖片一鍵翻譯語言,AI做主圖,AI做詳情圖,文檔翻譯,視頻/圖片換模特,賣點創作,標題創作,智能摳圖,智能摳服飾,圖片變清晰,智能圖片無損放大,獨立站文案創作等等,真的是電商人的必備工具了!搜索進入網站就可以使用了!!
2、有道翻譯
有道翻譯是許多用戶推薦的翻譯工具之一。它提供了準確的中文到印尼語的翻譯服務,并且可以直接將PDF文件轉換為目標語言的文件。您只需將待翻譯的中文PDF文件上傳至有道翻譯平臺,選擇源語言和目標語言,然后點擊翻譯按鈕即可。在幾分鐘內,您就能得到一個準確翻譯的印尼語PDF文件。
3、百度翻譯
百度翻譯是另一個非常受歡迎的翻譯工具。它不僅提供中文到印尼語的翻譯,還支持多種語言之間的翻譯服務。您可以使用百度翻譯的掃描功能,直接掃描中文PDF文件中的文本,然后選擇源語言和目標語言進行翻譯。百度翻譯還支持在線輸入和手寫輸入,方便用戶根據實際需求進行翻譯。
4、谷歌翻譯
谷歌翻譯是一款功能強大的在線翻譯工具,它可以將中文PDF文件快速準確地翻譯為印尼語PDF。您可以選擇將整個PDF文件上傳至谷歌翻譯平臺,或者將其中的文本復制粘貼到翻譯框中,再選擇源語言和目標語言進行翻譯。谷歌翻譯還具有自動檢測源語言功能,可以智能識別文本的語言,并將其翻譯為您所需的語言。
這4款工具不僅翻譯準確度高,而且操作簡便,即使對于新手用戶也能輕松上手。使用它們,您可以快速將中文PDF文件翻譯成印尼語PDF,滿足您的溝通和閱讀需求。
需要注意的是,使用翻譯工具時,我們應該理解它們可能會存在一定的局限性。盡管這些工具已經通過人工智能技術得到了極大的改進,但在特殊領域、行業術語或復雜句子的翻譯中,仍然可能出現一些錯誤或不準確的情況。
1 -
場景
在文檔中,我們有時候會在文字中使用顏色。
比如:
在文檔中,使用在文字上加顏色來代表一定意義。使用MS Word編寫文檔的時候,直接在文字上加顏色就可以了。轉換成DITA以后,大家會發現在XML編輯器的工具欄中并沒有加字體顏色的工具欄,怎樣在DITA文檔中給文字加顏色呢?
- 2 -
分析
DITA采用內容與樣式分離的思想。文字的顏色屬于樣式,放在樣式文件中,并不在DITA文件中。XML編輯器中編輯的是文檔的DITA Topic內容,不能直接編輯樣式。這就是在XML編輯器中的工具欄中沒有給文字加顏色的工具的原因 (菜單中也沒有)。
怎么解決這個問題呢?
上例中,如果按照DITA的設計思想,最好是給內容加語義標簽,然后使用樣式來將標簽渲染成不同的顏色。比如將內容設計成這樣:
注:是具體的禁止、指令、警告和提示的文字用這些標簽包裹
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE topic PUBLIC "-//OASIS//DTD DITA Topic//EN" "topic.dtd">
<topic id="doc123">
<title>國家規定的安全色中表示警告注意的顏色</title>
<body>
<p>法律分析:</p>
<p>國家規定的安全色有紅、藍、黃、綠四種顏色,其含義是:<stop>紅色</stop>表示禁止,停止 (也表示防火);<instruction>藍色</instruction>
表示指令或必須遵守的規定;<warning>黃色</warning>表示警告、注意;<tip>綠色</tip>表示提示、安全狀態、通行</p>
</body>
</topic>
這需要在DITA里通過專有化機制,即:Specialization,加入<stop>、<instruction>、<warning>和<tip>標簽來實現。這會導致一系列的改動,比如:所有輸出樣式、處理程序。同時,以后DITA升級了也要單獨升級這部分專有化處理。變動和維護成本比較高。
一種折中的方案是,通過DITA中已有的標簽和屬性來標識數據,然后在樣式中根據自定義屬性值來用顏色顯示內容。比如將內容設計成這樣:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE topic PUBLIC "-//OASIS//DTD DITA Topic//EN" "topic.dtd">
<topic id="doc123">
<title>國家規定的安全色中表示警告注意的顏色</title>
<body>
<p>法律分析:</p>
<p>國家規定的安全色有紅、藍、黃、綠四種顏色,其含義是:<ph outputclass="color_red">紅色</ph>表示禁止,停止 (也表示防火);<ph
outputclass="color_blue">藍色</ph>表示指令或必須遵守的規定;<ph outputclass="color_yellow"
>黃色</ph>表示警告、注意;<ph outputclass="color_green">綠色</ph>表示提示、安全狀態、通行</p>
</body>
</topic>
然后在樣式中根據outputclass來給文字加顏色。
這種方案的好處是使用DITA已有的標簽和屬性即可,不必使用專有化來創建新的標簽,只需要在樣式中加一些代碼就可以實現。 變動和以后維護的成本相對較低。
- 3 -
方案實現
上邊的分析部分已經描述了DITA內容可以做成的樣子。那樣式這部分怎么實現呢?這部分來說一說。
如果使用的是CSS來發布HTML和PDF,可以使用如下代碼:
*[outputclass~="color_red"]{
color: red;
}
*[outputclass~="color_blue"]{
color: blue;
}
*[outputclass~="color_yellow"]{
color: yellow;
}
*[outputclass~="color_green"]{
color: green;
}
將這些代碼放到一個文件中,比如叫style.css,然后在發布的時候引用這個樣式文件即可(使用DITA-OT是指定args.css屬性,將它的值設置成style.css文件的路徑)。
輸出效果如下:
如果使用XSLT/XSL-FO來發布PDF,要復雜一些,可以使用下邊的代碼實現:
<?xml version='1.0'?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
xmlns:fo="http://www.w3.org/1999/XSL/Format"
version="2.0">
<xsl:template match="*[contains(@outputclass, 'color_red')]">
<fo:inline color="red">
<xsl:apply-templates />
</fo:inline>
</xsl:template>
<xsl:template match="*[contains(@outputclass, 'color_blue')]">
<fo:inline color="blue">
<xsl:apply-templates />
</fo:inline>
</xsl:template>
<xsl:template match="*[contains(@outputclass, 'color_yellow')]">
<fo:inline color="yellow">
<xsl:apply-templates />
</fo:inline>
</xsl:template>
<xsl:template match="*[contains(@outputclass, 'color_green')]">
<fo:inline color="green">
<xsl:apply-templates />
</fo:inline>
</xsl:template>
</xsl:stylesheet>
需要根據DITA-OT定制XSLT/XSL-FO的方法進行配置。
輸出效果如下:
微信掃描下方卡片關注公眾號 ??
*請認真填寫需求信息,我們會在24小時內與您取得聯系。