標題: | 用以資訊為本的方法解決中英翻譯系統中的選字問題 An information-based approach for word selection in a Chinese-to-English machine translation system |
作者: | 吳仕棋 WU, SHI-QI 李錫堅 LI, XI-JIAN 資訊科學與工程研究所 |
關鍵字: | 資訊為本;解決中英翻譯統統;選字問題 |
公開日期: | 1991 |
摘要: | 在這篇論文中,我們提出一個方法來解決中英翻譯系統中的選字(word selection) 問題,一個中文字可能有各種不同的英文翻譯。所以當我們要把中文翻成英文的時 候,必須選擇最適當的一種翻法。本篇論文將探討這個問題。有時候我們會把整個 中文詞組(phrase)翻成一個英文字或英文詞組。除了這種情況外,我們還將從被選 的字與其判斷條件之間的關係來探討各種選字的問題。在論文中,我們列了五種情 況,包括:根據必要論元(complement)選擇中心成分(head)、根據主詞(subject) 選擇中心成分、根據中心成分選擇選用論元(adjunct) 、根據中心成分的英文翻譯 選擇選用論元、以及根據選用論元選擇中心成分。我們把每一個中文字(詞組)所 有可能的翻譯情況都以特徵結構(feature structure) 的方式存在轉換字典(tran- sfer dictionary)的項目(entry) 中。給定一個剖析(parsing) 後的結構當做輸入 以及轉換字典當做資料庫,我們的核心程式(kernel program)利用聯併(unificat- ion)的技巧找出輸入句中所有字相對應的翻譯。它由上而下 (top-down) 地橫貫 ( traverse) 所輸入的樹結構。每到達一個新的節點時,我們都查閱轉換字典。如果 能在其中找出為這個節點所建的項目,核心程式把這項目中的條件部份取出和輸入 結構作聯併以找出適當的翻譯。否則我們把相同的步驟一一施於這節點的子節點上 。我們可以在橫貫輸入樹一次後找出所有字的翻譯。此外,在整個過程中,並不需 要任何回溯(back-tracking) 的步驟。藉著增加字典所含的資訊,這個模組可以輕 易地擴充。目前,它可以用來解決上述六種選字的問題。 |
URI: | http://140.113.39.130/cdrfb3/record/nctu/#NT802393040 http://hdl.handle.net/11536/55874 |
顯示於類別: | 畢業論文 |