Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | 林蘭綺 | en_US |
| dc.contributor.author | 梁婷 | en_US |
| dc.date.accessioned | 2014-12-12T02:45:59Z | - |
| dc.date.available | 2014-12-12T02:45:59Z | - |
| dc.date.issued | 2005 | en_US |
| dc.identifier.uri | http://140.113.39.130/cdrfb3/record/nctu/#GT009223561 | en_US |
| dc.identifier.uri | http://hdl.handle.net/11536/76611 | - |
| dc.description.abstract | 專利文件分類是專利文件分析一項重要的工作。目前在重新調整分類結構和文件分類都需要以人工的方式進行,因此提高自動化分類的正確性,將有效地幫助專利研究人員快速地完成工作。在分類階段,以往利用tf-idf計算詞彙的權重,進行向量空間模型分類法。在本論文中,我們加入Entropy的概念提出新的修正詞彙權重計算方法,以降低因過少的詞彙群組數對文件分類造成的負面影響。我們分別取以主類別(語料1)和子類別(語料2)分類的美國專利文件進行分類研究,經過權重修正之後,在語料1中,當減少至200個詞群數時,調和平均值可由0.387提升至0.735;而語料2在8836至2000之間的詞群數,調和平均值從0.35可提升至0.42。 | zh_TW |
| dc.language.iso | zh_TW | en_US |
| dc.subject | 專利 | zh_TW |
| dc.subject | 分類 | zh_TW |
| dc.subject | 熵 | zh_TW |
| dc.subject | patent | en_US |
| dc.subject | classification | en_US |
| dc.subject | entropy | en_US |
| dc.title | 專利文件之自動分類研究 | zh_TW |
| dc.title | Automatic Classification of Patent Documents | en_US |
| dc.type | Thesis | en_US |
| dc.contributor.department | 資訊科學與工程研究所 | zh_TW |
| Appears in Collections: | Thesis | |
Files in This Item:
If it is a zip file, please download the file and unzip it, then open index.html in a browser to view the full text content.

