標題: | 複合影像之分離與高倍率壓縮技術 High quality image compression in compound text and image documents |
作者: | 林家鋒 Chia-Feng Lin 吳炳飛 Dr. Bing-Fei Wu 電控工程研究所 |
關鍵字: | 影像分離;影像壓縮;以小波為基礎的壓縮法;Image segmentation;Image compression;wavelet-based coding |
公開日期: | 1999 |
摘要: | 本論文提出一個新的影像壓縮技術,稱為”HQDC”(High Quality Document Compression),目的是針對複合彩色影像進行高倍率的壓縮,透過HQDC,採用圖文分離的方法,從一張彩色複合影像,計算影像中的特徵分佈狀況,對影像中的每個點做分類,分成兩類,不是屬於文字平面(包含有文字、線條等等)就是歸類在圖形平面(包含圖畫、照片等等),針對文字平面以及圖形平面,利用壓縮平面的規劃,對不同的平面採取不同的壓縮方法;在文字的平面採用pattern matching的壓縮技術,完整的保存文字與線條等高頻成分;而在圖形的平面,搭配小波轉換和零樹編碼的壓縮演算法,對圖形部份做高倍率的壓縮,透過平面適當的檔案大小安排,來達到高倍率壓縮的高品質彩色複合影像。
對複合彩色影像做壓縮,當採用高壓縮倍率,我們與三種不同的壓縮法來做比較,首先與JPEG比較,HQDC比JPEG的影像品質傑出許多;接著與AT&T所提出的DjVu壓縮法做比較,在相同的壓縮倍數下,HQDC在文字的保留程度上優於DjVu;最後對JPEG2000壓縮的影像做比較,不論在文字的保留上以及高頻成分的視覺效果上,JPEG2000均比HQDC影像略為模糊,HQDC的壓縮效能較佳。 We present a new image compression technique called “HQDC”(high quality document compression), whose purpose is toward the high compression of compound documents in color. With HQDC, the method of separating texts and pictures is applied to compound documents in color. We count the features of documents, and classify each pixel in the documents as either the plane of texts (text, lines) or the plane of pictures (pictures, photos). For the planes of texts and pictures, HQDC use the layout of compression planes taking different compression methods for different planes. The literal pixel category is compressed using a pattern matching technique that takes advantage of saving the texts and lines. Wavelet transform and Zerotree Coding are then used to compress the plane of pictures. Assign proper bits for different planes, we can get the high compression with high quality of compound documents in color. When compound documents in color is at high compression, we compare three different methods with HQDC. First, comparing with JPEG, the subjective quality obtain from HQDC is pretty better than JPEG. Next, comparing with the proposal “DjVu” of AT&T and JPEG2000, HQDC is better than DjVu for texts and JPEG2000 for the quality of texts and pictures. 英文摘要 ii 誌謝 iii 目錄 iv 表列 vii 圖列 viii 第一章 簡介 1 1.1 研究動機 1 1.2 研究目的 2 1.3 論文整體章節安排 3 第二章 影像壓縮的原理分析 5 2.1 數位影像壓縮技術 5 2.1.1 色彩模式轉換 7 2.1.2 轉換方法DCT 8 2.1.3 Zig-zag & Quantization 11 2.1.4 Huffman Coding 12 2.2 壓縮方法改良 13 第三章 圖文分離技術 14 3.1 傳統影像文件分析 14 3.1.1 流向偵測 14 3.1.2 文字分析 17 3.2 採用聚類的分類方法 18 3.2.1 K mean clustering 18 3.2.2 Block K-mean clustering 19 3.3 採用MDL的分類方法 20 3.3.1 MDL based Clustering Principle 21 3.3.2 MDL 影像分離演算法 21 3.4 採用新圖文分類方法 23 3.4.1 聚類分析 23 3.4.2 適應性二值化 25 3.4.3 水平塗抹作用 25 3.4.4 胚胎成長 26 3.4.5 圖文區塊分離 27 第四章 小波轉換與零樹編碼 28 4.1 小波轉換 28 4.1.1 小波轉換發展背景 28 4.1.2 連續小波轉換 31 4.1.3 離散小波轉換 33 4.1.4 快速離散小波轉換 35 4.1.4.1 快速Forward小波轉換設計方法 38 4.1.4.2 快速Backward小波轉換設計方法 43 4.1.4.3 複雜度分析 45 4.2 零樹編碼 46 4.2.1 SPIHT編碼 47 4.2.1.1 SPIHT壓縮原理 47 4.2.1.2 SPIHT演算法 48 4.2.2 低記憶體零樹編碼 52 4.2.2.1 低記憶體零樹編碼緣由 52 4.2.2.2 LMZC 53 第五章 二值化影像壓縮 57 5.1 傳統二值影像壓縮法 57 5.2 JBIG2的壓縮方法 58 5.2.1 Pattern matching and substitution 59 5.2.2 Soft pattern matching 60 5.3 JBIG與JBIG2壓縮效能比較 65 第六章 高品質影像壓縮之架構 66 6.1 影像壓縮規格 66 6.2 切割平面介紹 66 6.3 平面壓縮方法 70 6.4 DATA FORMAT檔案格式 71 第七章 實驗結果 73 7.1 實驗數據 73 7.1.1 與JPEG相比較 73 7.1.2 與AT&T技術DjVu相比較 80 7.2 軟體設計架構 86 第八章 結論與未來展望 93 8.1 實驗數據 93 8.2 未來展望 94 參考文獻 95 |
URI: | http://140.113.39.130/cdrfb3/record/nctu/#NT880591015 http://hdl.handle.net/11536/66245 |
Appears in Collections: | Thesis |