整合營銷服務商

          電腦端+手機端+微信端=數據同步管理

          免費咨詢熱線:

          使用 DITA 內容為 Google Dialogflow 聊天機器人或百度UNIT 創建知識庫


          近因為訂閱電子期刊產生偏差,我向位于美國的 SCRIBD 出版商申請了退回扣除的信用卡款項。整個過程雖然遇到一點點狀況,如多次登錄賬戶,基本上其 HELP CENTER 知識庫 的聊天機器人全權處理,最終完成了信用卡的退款。

          因為2018年在浙江紹興為日本山形英技公司擔任 AI 聊天機器人研發,突然發現,今天的 AI 使用體驗突飛猛進且越發貼近生活。本文與您分享用 DITA 為 Google 聊天機器人提供知識的技巧。

          聊天機器人是一種計算機程序,它通過語音命令或文本聊天或兩者兼而有之來模擬人類對話。Chatbot(chatterbot 的縮寫)是一種人工智能 (AI) 功能,可以通過任何主要的消息傳遞應用程序嵌入和使用。聊天機器人是自動化程序有助于為客戶增加便利。它們可以像人類一樣與客戶互動,而且互動成本幾乎可以忽略不計。

          假設您有一個簡單的 DITA 主題內容,其中包含以形式放置在表中的成對問題和答案:

          <?xml version="1.0" encoding="UTF-8"?> 
          <!DOCTYPE topic PUBLIC "-//OASIS//DTD DITA Topic//EN" "topic.dtd"> 
          <topic  id = "frequently_asked_questions" > 
              <title>常見問題</title> 
              <body> 
                  <p> 
                      <table  frame = "all"  rowsep = "1"  colsep = "1"  id = "table_bkf_4dl_vsb" > 
                          <tgroup  cols = "2" > 
                              <colspec  colname = "c1"  colnum = "1"  colwidth = "1*" />
                              <colspec  colname = "c2"  colnum = "2"  colwidth = "1*" /> 
                              <tbody> 
                                  <row> 
                                      <entry> 
                                          <p>什么是 Oxygen XML 編輯器?</p> 
                                          <p>什么是Oxygen XML?</p> 
                                      </entry> 
                                      <entry> 
                                          <p> Oxygen XML Editor 是一個很棒的工具。</p> 
                                      </entry> 
                                  </row> 
                                  <row> 
                                      <entry>如何學習 DITA?</entry> 
                                      <entry>您可以閱讀“Oxygen”用戶指南和 Oxygen XML 博客。<
                                  
                              
                          
                      
                  
              </body> 
          </topic>
                      
                  

          我們可以使用以下 XSLT 樣式表從 XML 內容中將訓練數據提取出來 CSV 文件:

          <?xml version="1.0" encoding="UTF-8"?> 
          <xsl:stylesheet  xmlns:xsl = "http://www.w3.org/1999/XSL/Transform" 
              xmlns:xs = "http:// /www.w3.org/2001/XMLSchema"  exclude-result-prefixes = "xs"  version = "2.0"  xmlns:oxy = "abc" > 
              <xsl:output  method = "text" /> 
              <xsl:template  match = "/" > 
                  <xsl:text>問題,答案
          </xsl:text> 
                  <xsl:for-each  select = "//tbody/row" > 
                      <xsl:for-each  select ="entry[1]" > 
                          <xsl:choose> 
                              <xsl:when  test = "p" > 
                                  <xsl:for-each  select = "p" > 
                                      <xsl:value-of  select = "oxy:escapeForCSV(normalize-space (.))" /> , <xsl:value-of 
                                          select = "oxy:escapeForCSV(normalize-space(string-join(../../entry[2]//text(), ''))) " /> <xsl:text> 
          </xsl:text> 
                                  </xsl:for-each> 
                              </xsl:when> 
                              <xsl:otherwise> 
                                  <xsl:value-of  select = "oxy:escapeForCSV(normalize-space( .))”/> , <xsl:value-of
                                      選擇= "oxy:escapeForCSV(normalize-space(string-join(../entry[2]//text(), '')))" /> <xsl:text> 
          </xsl:text> 
                              </xsl:否則> 
                          </xsl:choose> 
                      </xsl:for-each> 
                  </xsl:for-each> 
              </xsl:template>     
              <xsl:function  name = "oxy:escapeForCSV" > 
                  <xsl:param  name = "value " /> 
                  <xsl:value-of  select = "replace(replace($value, '"', '""'), ',', '","')" /> 
              </xsl :function> 
          </xsl:stylesheet>

          使用這兩個文件創建一個轉換場景。將輸出保存為 CSV 文件,如下圖所示:

          應用轉換后,應出現以下情況 CSV 文件:

          What is Oxygen XML Editor?,Oxygen XML Editor is a great tool.
          What is Oxygen XML?,Oxygen XML Editor is a great tool.
          How do I learn DITA?,You can read the ""Oxygen"" user's guide"," and the Oxygen XML Blog.

          注意:

          CSV 文件的結構包含一個包含 2 列的表,其中第一列代表問題,第二列代表答案,以逗號分隔。一般來說,一行的形式是:“問題,答案”。一個限制是每個問題只能有一個答案。為使同一個答案適合多個問題,您可以將其復制到問題對應的列表中。

          接下來,按照以下步驟在Google Dialogflow 聊天機器人中使用 CSV 文件中的數據:

          1. 在https://dialogflow.cloud.google.com/上創建一個帳戶。
          2. 創建一個新代理并填寫必填字段:

          3. 在“設置”中,啟用BETA FEATURES


          4.轉到Knowledge > CREATE KNOWLEDGE BASE,輸入此知識庫的名稱,然后單擊 SAVE 按鈕。

          5.使用 CSV 文檔進行培訓。為此:按照創建第一個并填寫字段。從您的計算機選項中選擇更新文件,然后選擇所需的文件。單擊 創建按鈕。

          該文檔將在知識庫中注冊,如下圖所示:

          6.將問題和答案轉換為意圖。

          單擊上圖中的查看鏈接。檢查所有需要轉換意圖的問題。單擊轉換為意圖按鈕。

          現在,當您單擊 Intents 時,應該會出現轉換后的問題:

          7.做一個模擬。單擊集成> Web 演示,如果演示功能已經禁用,請啟用它。


          8.將聊天機器人集成到您的身上 HTML 內容中。轉到 Dialogflow 集成頁面,單擊Web Demo集成,您將獲得一個 <iframe>HTML 元素,可以將其粘貼到您的身上 HTML 頁面中。使用WebHelp自定義,您還可以將 Chatbot 集成到每個生成的 HTML 頁面的頁腳中。

          本文展示了如何通過使用 DITA 主題生成逗號分隔值文件 CSV 來訓練聊天機器人的意圖和答案的基本方式。百度 UNIT 同樣適用,我們后續分享。

          著全球交流的加強,中文與印尼語之間的溝通需求越來越多。對于需要將中文PDF文件翻譯成印尼語PDF的用戶來說,這4款工具可以幫助您高效完成任務。無需擔心翻譯質量和準確性,這些工具都是非常優秀且易于使用的。

          1、看往ai

          看往ai是電商必備圖片工具,提供了視頻,圖片,文字一站式AI處理,可以幫我們翻譯任何文檔,比如doc,docx,,xls,xlsx,csv,txt,srt,pdf、html,htm,xml,xhtml,json,xliff,tmx,dita,md,markdown,idml10等多種格式的文檔,并不會破壞原有的文檔排版和元素,中文、英語語種類型的文檔都可以進行翻譯,一鍵翻譯成新的語言文檔,支持幾十種語言。

          1、在百度中搜索“看往ai官網”,無需下載,即可使用(超級方便),并在頁面上方找到“文檔智能翻譯”選項。

          2、進入:文檔智能翻譯功能頁面,先上傳我們需要翻譯的文檔。

          3、再選擇我們的文檔的原語言和我們需要翻譯的語言,即可翻譯文檔

          4、點擊生成,把翻譯后的文檔保存在本地即可。

          看往ai還具備電商常用的多個功能:AI模擬模特,視頻一鍵翻譯,圖片一鍵翻譯語言,AI做主圖,AI做詳情圖,文檔翻譯,視頻/圖片換模特,賣點創作,標題創作,智能摳圖,智能摳服飾,圖片變清晰,智能圖片無損放大,獨立站文案創作等等,真的是電商人的必備工具了!搜索進入網站就可以使用了!!

          2、有道翻譯

          有道翻譯是許多用戶推薦的翻譯工具之一。它提供了準確的中文到印尼語的翻譯服務,并且可以直接將PDF文件轉換為目標語言的文件。您只需將待翻譯的中文PDF文件上傳至有道翻譯平臺,選擇源語言和目標語言,然后點擊翻譯按鈕即可。在幾分鐘內,您就能得到一個準確翻譯的印尼語PDF文件。

          3、百度翻譯

          百度翻譯是另一個非常受歡迎的翻譯工具。它不僅提供中文到印尼語的翻譯,還支持多種語言之間的翻譯服務。您可以使用百度翻譯的掃描功能,直接掃描中文PDF文件中的文本,然后選擇源語言和目標語言進行翻譯。百度翻譯還支持在線輸入和手寫輸入,方便用戶根據實際需求進行翻譯。

          4、谷歌翻譯

          谷歌翻譯是一款功能強大的在線翻譯工具,它可以將中文PDF文件快速準確地翻譯為印尼語PDF。您可以選擇將整個PDF文件上傳至谷歌翻譯平臺,或者將其中的文本復制粘貼到翻譯框中,再選擇源語言和目標語言進行翻譯。谷歌翻譯還具有自動檢測源語言功能,可以智能識別文本的語言,并將其翻譯為您所需的語言。

          這4款工具不僅翻譯準確度高,而且操作簡便,即使對于新手用戶也能輕松上手。使用它們,您可以快速將中文PDF文件翻譯成印尼語PDF,滿足您的溝通和閱讀需求。

          需要注意的是,使用翻譯工具時,我們應該理解它們可能會存在一定的局限性。盡管這些工具已經通過人工智能技術得到了極大的改進,但在特殊領域、行業術語或復雜句子的翻譯中,仍然可能出現一些錯誤或不準確的情況。

          1 -

          場景

          在文檔中,我們有時候會在文字中使用顏色。

          比如:

          在文檔中,使用在文字上加顏色來代表一定意義。使用MS Word編寫文檔的時候,直接在文字上加顏色就可以了。轉換成DITA以后,大家會發現在XML編輯器的工具欄中并沒有加字體顏色的工具欄,怎樣在DITA文檔中給文字加顏色呢?

          - 2 -

          分析

          DITA采用內容與樣式分離的思想。文字的顏色屬于樣式,放在樣式文件中,并不在DITA文件中。XML編輯器中編輯的是文檔的DITA Topic內容,不能直接編輯樣式。這就是在XML編輯器中的工具欄中沒有給文字加顏色的工具的原因 (菜單中也沒有)。

          怎么解決這個問題呢?

          上例中,如果按照DITA的設計思想,最好是給內容加語義標簽,然后使用樣式來將標簽渲染成不同的顏色。比如將內容設計成這樣:

          注:是具體的禁止、指令、警告和提示的文字用這些標簽包裹

          <?xml version="1.0" encoding="UTF-8"?>
          <!DOCTYPE topic PUBLIC "-//OASIS//DTD DITA Topic//EN" "topic.dtd">
          <topic id="doc123">
              <title>國家規定的安全色中表示警告注意的顏色</title>
              <body>
                  <p>法律分析:</p>
                  <p>國家規定的安全色有紅、藍、黃、綠四種顏色,其含義是:<stop>紅色</stop>表示禁止,停止 (也表示防火);<instruction>藍色</instruction>
                      表示指令或必須遵守的規定;<warning>黃色</warning>表示警告、注意;<tip>綠色</tip>表示提示、安全狀態、通行</p>
              </body>
          </topic>

          這需要在DITA里通過專有化機制,即:Specialization,加入<stop>、<instruction>、<warning>和<tip>標簽來實現。這會導致一系列的改動,比如:所有輸出樣式、處理程序。同時,以后DITA升級了也要單獨升級這部分專有化處理。變動和維護成本比較高。

          一種折中的方案是,通過DITA中已有的標簽和屬性來標識數據,然后在樣式中根據自定義屬性值來用顏色顯示內容。比如將內容設計成這樣:

          <?xml version="1.0" encoding="UTF-8"?>
          <!DOCTYPE topic PUBLIC "-//OASIS//DTD DITA Topic//EN" "topic.dtd">
          <topic id="doc123">
              <title>國家規定的安全色中表示警告注意的顏色</title>
              <body>
                  <p>法律分析:</p>
                  <p>國家規定的安全色有紅、藍、黃、綠四種顏色,其含義是:<ph outputclass="color_red">紅色</ph>表示禁止,停止 (也表示防火);<ph
                          outputclass="color_blue">藍色</ph>表示指令或必須遵守的規定;<ph outputclass="color_yellow"
                          >黃色</ph>表示警告、注意;<ph outputclass="color_green">綠色</ph>表示提示、安全狀態、通行</p>
              </body>
          </topic>

          然后在樣式中根據outputclass來給文字加顏色。

          這種方案的好處是使用DITA已有的標簽和屬性即可,不必使用專有化來創建新的標簽,只需要在樣式中加一些代碼就可以實現。 變動和以后維護的成本相對較低。

          - 3 -

          方案實現

          上邊的分析部分已經描述了DITA內容可以做成的樣子。那樣式這部分怎么實現呢?這部分來說一說。

          如果使用的是CSS來發布HTML和PDF,可以使用如下代碼:

          *[outputclass~="color_red"]{
              color: red;
          }
          
          
          *[outputclass~="color_blue"]{
              color: blue;
          }
          
          
          *[outputclass~="color_yellow"]{
              color: yellow;
          }
          
          
          *[outputclass~="color_green"]{
              color: green;
          }

          將這些代碼放到一個文件中,比如叫style.css,然后在發布的時候引用這個樣式文件即可(使用DITA-OT是指定args.css屬性,將它的值設置成style.css文件的路徑)。

          輸出效果如下:

          如果使用XSLT/XSL-FO來發布PDF,要復雜一些,可以使用下邊的代碼實現:

          <?xml version='1.0'?>
          <xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
              xmlns:fo="http://www.w3.org/1999/XSL/Format"
              version="2.0">
          
          
              <xsl:template match="*[contains(@outputclass, 'color_red')]">
                  <fo:inline color="red">
                      <xsl:apply-templates />
                  </fo:inline>
              </xsl:template>
          
          
              <xsl:template match="*[contains(@outputclass, 'color_blue')]">
                  <fo:inline color="blue">
                      <xsl:apply-templates />
                  </fo:inline>
              </xsl:template>
          
          
              <xsl:template match="*[contains(@outputclass, 'color_yellow')]">
                  <fo:inline color="yellow">
                      <xsl:apply-templates />
                  </fo:inline>
              </xsl:template>
          
          
              <xsl:template match="*[contains(@outputclass, 'color_green')]">
                  <fo:inline color="green">
                      <xsl:apply-templates />
                  </fo:inline>
              </xsl:template>
          
          
          </xsl:stylesheet>

          需要根據DITA-OT定制XSLT/XSL-FO的方法進行配置。

          輸出效果如下:



          微信掃描下方卡片關注公眾號 ??


          主站蜘蛛池模板: 中文字幕一区二区三区久久网站| 亚洲一区二区三区高清视频| 亚洲国产一区在线| 人妻精品无码一区二区三区| 国产精品 一区 在线| 亚洲午夜一区二区三区| 久久国产高清一区二区三区| 国产乱人伦精品一区二区在线观看 | 极品人妻少妇一区二区三区| 无码人妻精品一区二| 中文字幕无线码一区2020青青| 国产亚洲一区二区在线观看| 一区二区三区在线观看免费| 精品国产免费一区二区| 99久久无码一区人妻a黑 | 精品国产亚洲一区二区三区在线观看| 日韩精品成人一区二区三区| 亚洲成av人片一区二区三区| 国产成人久久一区二区不卡三区| 亚洲国产一区二区三区青草影视| 国偷自产Av一区二区三区吞精| 波多野结衣精品一区二区三区| 亚洲国产一区二区三区在线观看| 少妇激情av一区二区| 久久精品亚洲一区二区| 国模大尺度视频一区二区| 国产高清在线精品一区小说| 精品无码成人片一区二区| 天美传媒一区二区三区| 色欲AV蜜桃一区二区三| 日日摸夜夜添一区| 日韩精品一区二区三区中文精品 | 日韩av无码一区二区三区| 伊人色综合一区二区三区| 国偷自产Av一区二区三区吞精| 久久久久女教师免费一区| 三上悠亚精品一区二区久久| 在线精品国产一区二区三区| 久久精品无码一区二区app| 三上悠亚日韩精品一区在线| 东京热无码一区二区三区av|