用以資訊為本的方法解決中英翻譯系統中的選字問題

標題:	用以資訊為本的方法解決中英翻譯系統中的選字問題 An information-based approach for word selection in a Chinese-to-English machine translation system
作者:	吳仕棋 WU, SHI-QI 李錫堅 LI, XI-JIAN 資訊科學與工程研究所
關鍵字:	資訊為本;解決中英翻譯統統;選字問題
公開日期:	1991
摘要:	在這篇論文中，我們提出一個方法來解決中英翻譯系統中的選字(word selection) 問題，一個中文字可能有各種不同的英文翻譯。所以當我們要把中文翻成英文的時候，必須選擇最適當的一種翻法。本篇論文將探討這個問題。有時候我們會把整個中文詞組(phrase)翻成一個英文字或英文詞組。除了這種情況外，我們還將從被選的字與其判斷條件之間的關係來探討各種選字的問題。在論文中，我們列了五種情況，包括：根據必要論元(complement)選擇中心成分(head)、根據主詞(subject) 選擇中心成分、根據中心成分選擇選用論元(adjunct) 、根據中心成分的英文翻譯選擇選用論元、以及根據選用論元選擇中心成分。我們把每一個中文字（詞組）所有可能的翻譯情況都以特徵結構(feature structure) 的方式存在轉換字典(tran- sfer dictionary)的項目(entry) 中。給定一個剖析(parsing) 後的結構當做輸入以及轉換字典當做資料庫，我們的核心程式(kernel program)利用聯併(unificat- ion)的技巧找出輸入句中所有字相對應的翻譯。它由上而下 (top-down) 地橫貫 ( traverse) 所輸入的樹結構。每到達一個新的節點時，我們都查閱轉換字典。如果能在其中找出為這個節點所建的項目，核心程式把這項目中的條件部份取出和輸入結構作聯併以找出適當的翻譯。否則我們把相同的步驟一一施於這節點的子節點上。我們可以在橫貫輸入樹一次後找出所有字的翻譯。此外，在整個過程中，並不需要任何回溯(back-tracking) 的步驟。藉著增加字典所含的資訊，這個模組可以輕易地擴充。目前，它可以用來解決上述六種選字的問題。
URI:	http://140.113.39.130/cdrfb3/record/nctu/#NT802393040 http://hdl.handle.net/11536/55874
Appears in Collections:	Thesis