Loading… 更深入透徹!清華髮表最新綜述,分析破解神經機器翻譯三大難題_TOM資訊_香港物流招聘
正文
Qzone
微博
微信

更深入透徹!清華髮表最新綜述,分析破解神經機器翻譯三大難題

2021-03-17 17:13 前瞻網   

機器翻譯(MT)是自然語言處理領域的一個重要分支,旨在利用計算機翻譯自然語言。近年來,端到端神經機器翻譯(NMT)取得了巨大的成功,已成為實際機器翻譯系統中新的主流方法。

在他們的最新綜述中,清華大學多位作者首先對深度學習的神經機器翻譯技術(neural machine translation,簡稱 NMT)的方法進行了廣泛的回顧,並重點介紹了與體系結構、解碼和數據增強相關的方法。然後總結了可供研究者參考的資源和工具。最後,對未來可能的研究方向進行了討論。

更深入透徹!清華髮表最新綜述,分析破解神經機器翻譯三大難題

論文資料顯示,清華大學計算機系教授、歐洲科學院外籍院士孫茂松與清華智能產業研究院副院長、國家傑青劉洋是該論文的兩位教師作者。

作為一種數據驅動的機器翻譯方法,NMT還包含了概率框架。從數學上講,NMT的目標是在給定數據集的情況下估計一個未知的條件分佈,其中和分別是表示源輸入和目標輸出的隨機變量。他們在論文中回答了NMT遇到的三個基本問題:

建模(modeling)。如何設計神經網絡來模擬條件分佈?

推理(inference)。給定一個源輸入,如何從NMT模型生成翻譯句子?

學習(learning)。如何有效地從數據中學習NMT所需的參數?

在這篇綜述中,他們首先描述了NMT解決上述三個問題的基本方法。然後,深入討論NMT架構的細節。他們引入了非自迴歸NMTs和雙向推斷,並討論了替代訓練目標和使用單語數據。

譯/前瞻經濟學人APP資訊組

本文來源前瞻網,轉載請註明來源。本文內容僅代表作者個人觀點,本站只提供參考並不構成任何投資及應用建議。(若存在內容、版權或其它問題,請聯繫:service@qianzhan.com)

 

責任編輯: 4114RWL

責任編輯: 4114RWL
廣告