圖像信息是人類獲得外界信息的主要來源,據(jù)統(tǒng)計(jì),大約有70%的信息是通過人眼獲得的,而人眼獲得的信息大部分是圖像信息。在近代科學(xué)研究、軍事技術(shù)、工業(yè)生產(chǎn)、醫(yī)學(xué)、生物、天文、地理、氣象等領(lǐng)域,人們越來越多地利用圖像信息來認(rèn)識和判斷事物,解決問題。人們的目的不僅僅是獲得圖像信息,更重要的是對信息進(jìn)行處理,在大量復(fù)雜的圖像信息中提取人們所需要的信息。因此,從這個意義上講,圖像信息的處理往往比圖像信息的獲取更為重要。隨著計(jì)算機(jī)技術(shù)的發(fā)展,數(shù)字圖像處理正成為新興的學(xué)科蓬勃發(fā)展。
2003年哈爾濱工業(yè)大學(xué)畢業(yè)后,一直從事教學(xué)及科研工作。黑龍江省自然科學(xué)基金協(xié)會。哈爾濱市青年科技創(chuàng)新人員專項(xiàng)資金項(xiàng)目,“基于二維視頻序列特征分析及融合的深度信息獲取策略研究”, 課題負(fù)責(zé)人。黑龍江省自然科學(xué)基金項(xiàng)目,“提高多視角視頻編碼效率關(guān)鍵技術(shù)研究”,主要參與者(第二名)。
目 錄
第1章 數(shù)字圖像處理概述 1
1.1 數(shù)字圖像處理的主要研究內(nèi)容 1
1.2 圖像的數(shù)字化和數(shù)字圖像的實(shí)質(zhì) 3
1.2.1 圖像的數(shù)字化 3
1.2.2 數(shù)字圖像的實(shí)質(zhì) 4
1.3 數(shù)字圖像的類型 4
1.4 數(shù)字圖像的顯示 6
1.4.1 數(shù)字圖像的顯示特性 6
1.4.2 數(shù)字圖像的打印 7
1.5 彩色模型 8
1.5.1 RGB彩色模型 9
1.5.2 CMY和CMYK彩色模型 10
1.5.3 HSI彩色模型 10
1.6 圖像的統(tǒng)計(jì)特征 12
1.6.1 灰度圖像的統(tǒng)計(jì)特征 12
1.6.2 灰度圖像的直方圖 12
1.6.3 多波段圖像的統(tǒng)計(jì)特征 13
1.7 Matlab圖像處理基礎(chǔ) 13
1.7.1 圖像文件的讀/寫與顯示 14
1.7.2 圖像類型的轉(zhuǎn)換 18
1.7.3 圖像統(tǒng)計(jì)特征的計(jì)算 24
1.8 本章小結(jié) 27
第2章 數(shù)字圖像處理基本運(yùn)算 28
2.1 點(diǎn)運(yùn)算 28
2.1.1 線性點(diǎn)運(yùn)算 28
2.1.2 非線性點(diǎn)運(yùn)算 30
2.2 代數(shù)運(yùn)算與邏輯運(yùn)算 31
2.2.1 加運(yùn)算 32
2.2.2 減運(yùn)算 33
2.2.3 乘運(yùn)算 34
2.2.4 除運(yùn)算 35
2.2.5 圖像邏輯運(yùn)算 35
2.3 圖像幾何運(yùn)算 36
2.3.1 齊次坐標(biāo) 36
2.3.2 圖像平移 37
2.3.3 圖像縮放 37
2.3.4 圖像鏡像 38
2.3.5 圖像旋轉(zhuǎn) 39
2.3.6 圖像復(fù)合變換 40
2.3.7 控制點(diǎn)法 40
2.4 圖像插值運(yùn)算 41
2.4.1 最近鄰插值法 42
2.4.2 雙線性插值法 42
2.4.3 雙三次插值法 43
2.5 圖像運(yùn)算的Matlab實(shí)現(xiàn) 43
2.5.1 代數(shù)運(yùn)算的Matlab實(shí)現(xiàn) 44
2.5.2 幾何運(yùn)算的Matlab實(shí)現(xiàn) 48
2.6 本章小結(jié) 50
第3章 圖像變換 51
3.1 傅里葉變換 51
3.1.1 一維傅里葉變換 51
3.1.2 二維傅里葉變換 53
3.1.3 離散傅里葉變換的快速算法 58
3.2 離散余弦變換 59
3.2.1 一維離散余弦變換 59
3.2.2 二維離散余弦變換 60
3.2.3 離散余弦變換的快速算法 60
3.3 離散沃爾什-哈達(dá)瑪變換 61
3.3.1 離散沃爾什變換 62
3.3.2 離散哈達(dá)瑪變換 63
3.3.3 快速沃爾什-哈達(dá)瑪變換 64
3.4 離散K-L變換 66
3.5 小波變換 68
3.5.1 連續(xù)小波變換 68
3.5.2 離散小波變換 70
3.5.3 小波基函數(shù) 71
3.5.4 圖像的小波分解與重構(gòu) 72
3.6 小波閾值去噪分析 74
3.6.1 基本思路 74
3.6.2 小波閾值去噪 74
3.6.3 閾值設(shè)置 75
3.6.4 閾值函數(shù) 76
3.7 圖像變換的Matlab實(shí)現(xiàn) 76
3.7.1 傅里葉變換的Matlab實(shí)現(xiàn) 77
3.7.2 離散余弦變換的Matlab實(shí)現(xiàn) 79
3.7.3 哈達(dá)瑪變換的Matlab實(shí)現(xiàn) 82
3.7.4 小波變換的Matlab實(shí)現(xiàn) 84
3.8 本章小結(jié) 87
第4章 圖像空間域增強(qiáng) 88
4.1 直接灰度變換 88
4.1.1 線性變換 89
4.1.2 分段線性變換 89
4.1.3 非線性變換 89
4.2 直方圖修正法 90
4.2.1 直方圖均衡化 90
4.2.2 直方圖規(guī)定化 93
4.3 平滑濾波 95
4.3.1 鄰域平均濾波 96
4.3.2 中值濾波 97
4.4 銳化濾波 100
4.4.1 一階差分算子 100
4.4.2 拉普拉斯算子 102
4.4.3 Canny算子 103
4.5 偽彩色增強(qiáng) 104
4.5.1 密度分割法 104
4.5.2 灰度級彩色變換 105
4.6 圖像空間域增強(qiáng)的Matlab實(shí)現(xiàn) 105
4.6.1 直方圖修正法的Matlab實(shí)現(xiàn) 105
4.6.2 平滑濾波的Matlab實(shí)現(xiàn) 109
4.6.3 銳化濾波的Matlab實(shí)現(xiàn) 112
4.6.4 偽彩色增強(qiáng)的Matlab實(shí)現(xiàn) 114
4.7 本章小結(jié) 116
第5章 圖像頻域增強(qiáng) 118
5.1 頻域?yàn)V波基礎(chǔ) 118
5.2 低通濾波器 119
5.2.1 理想低通濾波器 119
5.2.2 巴特沃斯低通濾波器 119
5.2.3 指數(shù)低通濾波器 120
5.2.4 梯形低通濾波器 120
5.3 高通濾波器 121
5.3.1 理想高通濾波器 121
5.3.2 巴特沃斯高通濾波器 122
5.3.3 指數(shù)高通濾波器 122
5.3.4 梯形高通濾波器 122
5.4 帶通或帶阻濾波器 123
5.4.1 帶通濾波器 123
5.4.2 帶阻濾波器 123
5.5 其他頻域的增強(qiáng)方式 124
5.5.1 同態(tài)濾波 124
5.5.2 頻域偽彩色增強(qiáng) 125
5.6 圖像頻域增強(qiáng)的Matlab實(shí)現(xiàn) 126
5.6.1 低通濾波處理的Matlab實(shí)現(xiàn) 126
5.6.2 高通濾波處理的Matlab實(shí)現(xiàn) 133
5.6.3 帶通或帶阻濾波處理的Matlab實(shí)現(xiàn) 138
5.6.4 同態(tài)濾波處理和頻域偽彩色增強(qiáng)的Matlab實(shí)現(xiàn) 140
5.7 本章小結(jié) 142
第6章 圖像編碼 144
6.1 圖像冗余信息及圖像質(zhì)量評價 144
6.1.1 圖像冗余信息 144
6.1.2 圖像編碼效率的定義 144
6.1.3 圖像質(zhì)量評價 145
6.2 統(tǒng)計(jì)編碼 146
6.2.1 霍夫曼編碼 147
6.2.2 算術(shù)編碼 148
6.2.3 行程長度編碼 149
6.3 預(yù)測編碼 150
6.3.1 線性預(yù)測編碼 151
6.3.2 非線性預(yù)測編碼 152
6.4 變換編碼 152
6.5 圖像編碼的主要國際標(biāo)準(zhǔn) 154
6.5.1 靜止圖像編碼國際標(biāo)準(zhǔn)(JPEG) 154
6.5.2 運(yùn)動圖像編碼國際標(biāo)準(zhǔn)(MPEG) 156
6.6 圖像編碼的Matlab實(shí)現(xiàn) 157
6.6.1 霍夫曼編碼的Matlab實(shí)現(xiàn) 157
6.6.2 算術(shù)編碼的Matlab實(shí)現(xiàn) 159
6.6.3 行程長度編碼的Matlab實(shí)現(xiàn) 160
6.7 本章小結(jié) 162
第7章 圖像恢復(fù) 163
7.1 退化模型 164
7.1.1 連續(xù)退化模型 164
7.1.2 離散退化模型 165
7.2 代數(shù)恢復(fù)方法 167
7.2.1 非約束方法 167
7.2.2 約束方法 168
7.3 逆濾波恢復(fù)法 169
7.4 維納濾波恢復(fù)法 170
7.5 圖像恢復(fù)的Matlab實(shí)現(xiàn) 171
7.6 本章小結(jié) 176
第8章 數(shù)學(xué)形態(tài)學(xué)運(yùn)算 177
8.1 預(yù)備知識 177
8.2 形態(tài)學(xué)基本運(yùn)算 179
8.2.1 膨脹與腐蝕 179
8.2.2 開運(yùn)算和閉運(yùn)算 182
8.3 形態(tài)學(xué)其他處理 184
8.3.1 擊中或擊不中變換 184
8.3.2 邊界提取 185
8.3.3 區(qū)域填充 186
8.3.4 連通分量的提取 187
8.3.5 細(xì)化 188
8.3.6 粗化 189
8.4 灰度圖像中的形態(tài)學(xué)運(yùn)算 190
8.4.1 膨脹 190
8.4.2 腐蝕 192
8.4.3 開運(yùn)算和閉運(yùn)算 193
8.4.4 Top-hat變換和Bottom-hat變換 194
8.5 數(shù)學(xué)形態(tài)學(xué)的Matlab實(shí)現(xiàn) 195
8.5.1 膨脹與腐蝕的Matlab實(shí)現(xiàn) 195
8.5.2 開運(yùn)算與閉運(yùn)算的Matlab實(shí)現(xiàn) 198
8.5.3 形態(tài)學(xué)其他處理的部分Matlab實(shí)現(xiàn) 201
8.6 本章小結(jié) 205
第9章 基于深度學(xué)習(xí)的圖像處理 206
9.1 機(jī)器學(xué)習(xí)基礎(chǔ) 206
9.1.1 BP神經(jīng)網(wǎng)絡(luò) 206
9.1.2 支持向量機(jī)SVM 209
9.2 卷積神經(jīng)網(wǎng)絡(luò)原理 211
9.2.1 卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展歷史 211
9.2.2 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu) 212
9.2.3 卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練 221
9.3 圖像處理中常用的卷積神經(jīng)網(wǎng)絡(luò) 222
9.3.1 AlexNet 222
9.3.2 GoogleNet 223
9.3.3 ResNet 224
9.4 卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí) 224
9.5 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類示例 226
9.5.1 創(chuàng)建用于圖像分類的簡單卷積神經(jīng)網(wǎng)絡(luò) 227
9.5.2 基于遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練與圖像分類結(jié)果展示 232
9.6 本章小結(jié) 241
參考文獻(xiàn) 243