標題: 以詞典為基礎的命名輔助系統
A Lexical-based Naming Support System
作者: 曹祥雲
Shang-Yung Tsao
尤克強
Keh-Chiang Yu
資訊管理研究所
關鍵字: 詞典,中文斷詞,資料再工程,資料字典;Lexicon,Chinese word segmentation, Data re-engineering,Data dictionary
公開日期: 1992
摘要: 在資訊管理的領域中,對資料定名極為重要。為了要使資料一致化,一般 均採訂定命名規則方式作為團體內共同遵守的標準。但是傳統命名規則一 般採用結構化規則,同時以英語為命名語言。因此對非英語系國家的我國 不但難以辨識,而且難以使用與導出名稱,同時會產生嚴重的同義異名的 問題。因此本論文提出了適合中國人使用的〞中文命名規則〞,並以此為 基礎建立具有下列功能的一個〞以詞典為基礎的命名輔助系統〞: 1.提供 新名稱建立、詞典維護、名稱查詢等功能,配合資料字典系統,架構一個 使〞中文命名規則〞能被強制遵守與使用的環境。 2.提供新建詞典功能 ,幫助使用者由現有名稱擷取未建詞彙納入典。 3.提供新舊名稱轉換功 能,幫助使用者將現有名稱轉換為符合" 中文命名規則 "的新名稱。 4.提供同義名稱清理功能,協助使用者清理同義名稱。此外,本論文並以 財稅資料中心營業稅稅目下的資料進行實例驗證,分別對詞典建立、同義 名稱清理與斷詞正確性進行檢測,獲得大致令人滿意的結果。 Effective data naming is very important for successful data administration. For the purpose of data consistency, nameing convention is often used. But English naming convention is not ideal for Chinese name. It often causes synonym problems after translation. This thesis proposes a chinese naming convention and builds a lexicon-based naming support system. It has the following functions: 1. generate new names. 2. maintain lexicons. 3. query abbrreviated names. 4. generate new lexicons. 5. transform old names to new names. 6. query synonyms. With these functions, this research builds a naming support system which forces the user to follow the naming convention. The system is applied to tax data of Ministry of Finance Data Processing Center, and its result is discussed.
URI: http://140.113.39.130/cdrfb3/record/nctu/#NT810396008
http://hdl.handle.net/11536/56823
顯示於類別:畢業論文