Title: 基於語料庫的中英機器翻譯時貌機率分析
A Corpus-Based Probability Analysis of Tense and Aspect for Chinese-to-English Machine Translation
Authors: 黃堂晃
Tarng-Hoang Hwang
李錫堅
Hsi-Jian Lee
資訊科學與工程研究所
Keywords: 模式,時間成分,對應,語料庫,特徵;model, temporal constituent, mapping, corpus, feature
Issue Date: 1992
Abstract: 在這一篇論文中,我們提出一套能夠處理中英機器翻譯時貌問題的模式( model).時貌和時間成分(temporal constituent)是息息相關的.根據輸入 中文句子的時間成分來決定英文句子所應該採用的時貌.我們的方法是基 於中英時間成分和英文時貌對應(mapping)的概念.由於這是一 種一對多 的對應,我們必須決定這些比對的機率值.在這一篇論文中,我們採用一個 統計方法 ,從訓練語料庫中取得這些機率值.句子中包含的時間資訊被視 為是一組特徵(feature).在我們的模式中,我們使用七個特徵值:Verb Type, ASP, Frequency, Event Occurrence Time, Event Duration, CRS 及 Temporal-related.我們也定義三個objective function.當我們 由輸入的句子抽出一組特徵時,根據objective function,我們就可以取得 相對應的時貌.實驗結果顯示我們時貌模式的正確率在close set約94%,在 open set88%.利用延伸的模式,我們也可以處理較複雜句子中的時貌問題.
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT810392077
http://hdl.handle.net/11536/56812
Appears in Collections:Thesis