標題: 資訊萃取技術在生物醫學文獻上的應用與探討(I)
Information Extraction in Biomedical Domain(I)
作者: 梁婷
TYNELIANG
國立交通大學資訊科學學系
關鍵字: 自然語言處理;資訊萃取;文件探勘;實體名稱;指代處理;關係辨識;問答系統
公開日期: 2004
摘要: 作將分兩年來進行。在第一年我們將開發有效實用的自然語言處理技術 和文件探勘技術, 進而建製一個可應用在生物文獻的自動資訊萃取系統。 主要的工作將包括生物實體名稱辨識、名稱指代處理、關係的辨識與萃取。 我們將結合法則式和統計式的方法來強化實體名稱辨識的效能。此外我們 將利用文件探勘技術來解決語句中指式型指代間題。同時我們也將探討生 物訊息和非生物訊息在實體關係的辨識和強度計算上的影響力, 並利用探 勘技術建立關聯法則以處理存在於語句中的實體關係的語言問題。 在笫二年我們將利用所開發的萃取技術進行以生物資訊為內容的知識 問答糸統的製作, 主要的工作將包括生物資料庫的內容探勘分類、查詢問 題的分類、答案的選取和整合。 我們希望藉由此計劃的執行,一方面能開發出有效可行的資訊萃取方法 將大量的生物文獻資料轉換成加值型的知識庫; 另一方面亦提供使用者一 個有效的知識萃取與處理系統,以促進生物資訊的探勘。
官方說明文件#: NSC93-2213-E009-074
URI: http://hdl.handle.net/11536/91468
https://www.grb.gov.tw/search/planDetail?id=1006992&docId=189775
顯示於類別:研究計畫


文件中的檔案:

  1. 932213E009074.pdf

若為 zip 檔案,請下載檔案解壓縮後,用瀏覽器開啟資料夾中的 index.html 瀏覽全文。