標題: 科技期刊論文語料庫之建立與分析應用
Scientific Journal Articles: Corpus Development and Text Analysis
作者: 郭志華
KUO CHIH - HUA
國立交通大學共同學科
關鍵字: 語料庫;一般語料庫;特殊目的語料庫;掃瞄器;報導動詞;非有限式動詞;共現詞彙;Corpus;Language in use;Special-purpose corpus;Scanner;Reporting verbs;Non-finite verbs;Collocations
公開日期: 1995
摘要: 不管在科技研究或人文社會科學的研究中, 使用電腦來儲存並分析大量資料,以獲得實證 結果之研究方法已在各研究領域中開啟了前所 未有的新天地.在語言的分析研究及教學上,語 言資料之選取、分析及應用,常流於直覺之觀 察及看法或僅使用少量之樣本.為了更確切瞭 解真實世界的語言使用情形,利用電腦建立一 均衡的語料庫(Corpus)並分析所儲存的語言資料, 可提供我們以前未曾發現的語言特色及語言變遷或語言分析之例證資料或語言教學之教材. 電腦語料庫之建立在美、英等國早從1960年代 陸續發展(如The Brown Corpus, TheLondon-Lund Corpus). 國內則有中央研究院目前進行之中文語料庫之 設立.上述語料庫均為一般性語料庫(General corpus),收集各類書寫文字及口語語料.本計畫則 擬進行特殊目的語料庫(Special-purpose corpus)之建 立,其語料為科技期刊論文,並利用此語料庫從 事科技英文之相關分析研究與應用.本計畫擬 分兩階段進行:第一階段為科技期刊論文語料 庫之建立,包括語料庫之設計、語料之選擇、 語料之輸入及語料之辨識等步驟.由於語料庫 之語料量龐大,因此將使用掃描器(Scanner)把期 刊論文讀入電腦,並利用電腦辨識軟體將掃描 輸入之語料加以辨識,確定語料成為可分析使 用之純文字檔(Plain text file)計畫第二階段為語 料庫之分析應用.由於科技研究之最新發現及 結果絕大多數均以英語發表於期刊中,因此科 技期刊之論文可以說代表並顯現了科技語言- 特別是學術性科技語言-之特色.本計畫建立科 技期刊論文之語料庫後,將使用電腦軟體進行 一系列科技論文之分析研究,如各種字彙之出 現率及分布情形(Frequency and distribution)、報導 動詞(Reporting verbs)及非有限式動詞(Non-finite verbs)之使用情形、IT句型及被動句型之出現率 或分布情形、科技論文中可能的共現詞彙( Collocation)等問題,並進而探討分析結果在科技 英文之研究與教學上所顯示的意義.
官方說明文件#: NSC84-2411-H009-003
URI: http://hdl.handle.net/11536/96873
https://www.grb.gov.tw/search/planDetail?id=189913&docId=32943
顯示於類別:研究計畫