本書是一本從機器學習視角講解計算機視覺的非常好的教材。全書圖文并茂、語言淺顯易懂,算法描述由淺入深,即使是數學背景不強的學生也能輕松理解和掌握。作者展示了如何使用訓練數據來學習觀察到的圖像數據和我們希望預測的現實世界現象之間的聯(lián)系,以及如何如何研究這些聯(lián)系來從新的圖像數據中作出新的推理。本書要求少的前導知識,從介紹概率和模型的基礎知識開始,接著給出讓學生能夠實現和修改來構建有用的視覺系統(tǒng)的實際示例。適合作為計算機視覺和機器學習的高年級本科生或研究生的教材,書中詳細的方法演示和示例對于計算機視覺領域的專業(yè)人員也非常有用。
目錄
Computer Vision:Models,Learning,and Inference
譯者序
譯者簡介
序
前言
第1章緒論1
11本書結構2
12其他書籍4
第一部分概率
第2章概率概述6
21隨機變量6
22聯(lián)合概率7
23邊緣化7
24條件概率8
25貝葉斯公式9
26獨立性9
27期望10
討論10
備注11
習題11
第3章常用概率分布12
31伯努利分布13
32貝塔分布13
33分類分布14
34狄利克雷分布14
35一元正態(tài)分布15
36正態(tài)逆伽馬分布15
37多元正態(tài)分布16
38正態(tài)逆維希特分布16
39共軛性17
總結18
備注18
習題18
第4章擬合概率模型21
41最大似然法21
42最大后驗法21
43貝葉斯方法22
44算例1:一元正態(tài)分布22
441最大似然估計22
442最大后驗估計24
443貝葉斯方法26
45算例2:分類分布28
451最大似然法28
452最大后驗法29
453貝葉斯方法30
總結31
備注31
習題32
第5章正態(tài)分布34
51協(xié)方差矩陣的形式34
52協(xié)方差分解35
53變量的線性變換36
54邊緣分布36
55條件分布37
56正態(tài)分布的乘積38
57變量改變38
總結38
備注39
習題39
第二部分機器視覺的機器學習
第6章視覺學習和推理42
61計算機視覺問題42
62模型的種類42
621判別模型43
622生成模型43
63示例1:回歸43
631判別模型44
632生成模型44
64示例2:二值分類46
641判別模型46
642生成模型46
65應該用哪種模型48
66應用49
661皮膚檢測49
662背景差分50
總結51
備注51
習題52
第7章復雜數據密度建模54
71正態(tài)分類模型54
72隱變量56
73期望最大化57
74混合高斯模型58
741混合高斯邊緣化59
742基于期望最大化的混合模型擬合59
75t分布63
751學生t分布邊緣化64
752擬合t分布的期望最大化65
76因子分析67
761因子分析的邊緣分布68
762因子分析學習的期望最大化68
77組合模型71
78期望最大化算法的細節(jié)71
781期望最大化算法的下界73
782E步74
783M步74
79應用75
791人臉檢測75
792目標識別76
793分割77
794正臉識別78
795改變人臉姿態(tài)(回歸)78
796作為隱變量的變換79
總結80
備注80
習題81
第8章回歸模型82
81線性回歸82
811學習83
812線性回歸模型的問題83
82貝葉斯線性回歸84
821實際考慮85
822擬合方差86
83非線性回歸87
831最大似然法87
832貝葉斯非線性回歸89
84核與核技巧89
85高斯過程回歸90
86稀疏線性回歸91
87二元線性回歸93
88相關向量回歸95
89多變量數據回歸96
810應用96
8101人體姿勢估計96
8102位移專家97
討論98
備注98
習題98
第9章分類模型100
91邏輯回歸100
911學習:最大似然估計102
912邏輯回歸模型的問題103
92貝葉斯邏輯回歸104
921學習104
922推理106
93非線性邏輯回歸107
94對偶邏輯回歸模型108
95核邏輯回歸110
96相關向量分類111
97增量擬合和boosting113
98分類樹116
99多分類邏輯回歸117
910隨機樹、隨機森林和隨機蕨分類器118
911與非概率模型的聯(lián)系119
912應用120
9121性別分類120
9122臉部和行人檢測121
9123語義分割122
9124恢復表面布局123
9125人體部位識別124
討論125
備注125
習題127
第三部分連接局部模型
第10章圖模型130
101條件獨立性130
102有向圖模型131
1021示例1132
1022示例2132
1023示例3133
1024總結134
103無向圖模型134
1031示例1135
1032示例2136
104有向圖模型與無向圖模型的對比136
105計算機視覺中的圖模型137
106含有多個未知量的模型推理139
1061求最大后驗概率的解139
1062求后驗概率分布的邊緣分布139
1063最大化邊緣140
1064后驗分布的采樣140
107樣本采樣140
1071有向圖模型的采樣141
1072無向圖模型的采樣141
108學習142
1081有向圖模型的學習142
1082無向圖模型的學習143
討論145
備注145
習題145
第11章鏈式模型和樹模型147
111鏈式模型148
1111有向鏈式模型148
1112無向鏈式模型148
1113模型的等價性148
1114隱馬爾可夫模型在手語中的應用149
112鏈式MAP推理149
113樹的MAP推理152
114鏈式邊緣后驗推理155
1141求解邊緣分布155
1142前向后向算法156
1143置信傳播157
1144鏈式模型的和積算法158
115樹的邊緣后驗推理160
116鏈式模型和樹模型的學習161
117鏈式模型和樹模型之外的東西161
118應用163
1181手勢跟蹤163
1182立體視覺164
1183形象化結構166
1184分割167
討論167
備注168
習題169
第12章網格模型172
121馬爾可夫隨機場172
1211網格示例173
1212離散成對MRF圖像去噪174
122二值成對馬爾可夫隨機場的MAP推理175
1221最大流/最小割176
1222MAP推理:二值變量177
123多標簽成對MRF的MAP推理182
124非凸勢的多標簽MRF186
125條件隨機場189
126高階模型190
127網格有向模型190
128應用191
1281背景差分191
1282交互式分割192
1283立體視覺193
1284圖像重排193
1285超分辨率195
1286紋理合成196
1287合成新面孔197
討論198
備注198
習題200
第四部分預處理
第13章圖像預處理與特征提取204
131逐像素變換204
1311白化204
1312直方圖均衡化205
1313線性濾波206
1314局部二值模式210
1315紋理基元映射211
132邊緣、角點和興趣點212
1321Canny邊緣檢測器212
1322Harris角點檢測器214
1323SIFT檢測器215
133描述子216
1331直方圖216
1332SIFT描述子216
1333方向梯度直方圖217
1334詞袋描述子218
1335形狀內容描述子218
134降維219
1341單數值近似220
1342主成分分析221
1343二元主成分分析221
1344K均值算法222
結論223
備注223
習題224
第五部分幾何模型
第14章針孔攝像機228
141針孔攝像機簡介228
1411歸一化攝像機229
1412焦距參數230
1413偏移量和偏移參數230
1414攝像機的位置與方向231
1415全針孔攝像機模型232
1416徑向畸變232
142三個幾何問題233
1421問題1:學習外在參數233
1422問題2:學習內在參數234
1423問題3:推理3D世界點235
1424解決問題235
143齊次坐標236
144學習外在參數237
145學習內在參數239
146推理3D世界點240
147應用241
1471結構光的深度241
1472剪影重構243
討論245
備注245
習題246
第15章變換模型249
151二維變換模型249
1511歐氏變換模型249
1512相似變換模型251
1513仿射變換模型252
1514投影變換模型252
1515增加不確定性254
152變換模型中的學習255
1521學習歐氏參數255
1522學習相似參數256
1523學習仿射參數256
1524學習投影參數257
153變換模型中的推理258
154平面的三個幾何問題258
1541問題1:學習外在參數258
1542問題2:學習內在參數260
1543問題3:與攝像機相關的3D位置推理261
155圖像間的變換261
1551單應性的幾何特征262
1552計算圖像間的變換263
156變換的魯棒學習264
1561RANSAC264
1562連續(xù)RANSAC265
1563PEaRL266
157應用268
1571增強現實追蹤268
1572視覺全景269
討論270
備注270
習題271
第16章多攝像機系統(tǒng)273
161雙視圖幾何學理論273
1611極線約束274
1612極點274
162實矩陣275
1621實矩陣的屬性276
1622實矩陣的分解277
163基礎矩陣279
1631基礎矩陣的估計279
16328點算法280
164雙視圖重構的流程281
165校正284
1651平面校正284
1652極面校正286
1653校正后處理287
166多視圖重構287
167應用290
1671三維重構290
1672圖片瀏覽291
1673立體圖割292
討論293
備注293
習題294
第六部分視覺模型
第17章形狀模型298
171形狀及其表示298
172snake模型299
1721推理301
1722snake模型中存在的問題301
173形狀模板302
1731推理303
1732用迭代最近點算法進行推理304
174統(tǒng)計形狀模型304
1741學習305
1742推理306
175子空間形狀模型306
1751概率主成分分析307
1752學習308
1753推理309
176三維形狀模型311
177形狀和外觀的統(tǒng)計模型311
1771學習313
1772推理314
178非高斯統(tǒng)計形狀模型315
1781回歸PPCA315
1782高斯過程隱變量模型316
179鉸接式模型317
1710應用319
17101三維形變模型319
17102三維人體模型321
討論322
備注322
習題324
第18章身份與方式模型326
181子空間身份模型328
1811學習329
1812推理331
1813在其他識別任務中的推理332
1814身份子空間模型的局限性333
182概率線性判別分析334
1821學習335
1822推理335
183非線性身份模型336
184非對稱雙線性模型337
1841學習339
1842推理339
185對稱雙線性和多線性模型341
1851學習342
1852推理343
1853多線性模型344
186應用344
1861人臉識別344
1862紋理建模345
1863動畫合成346
討論346
備注346
習題348
第19章時序模型349
191時序估計框架349
1911推理350
1912學習350
192卡爾曼濾波器351
1921推理351
1922改寫測量合并階段352
1923推理總結353
1924示例1353
1925示例2354
1926濾波355
1927時序和測量模型356
1928卡爾曼濾波器的問題358
193擴展卡爾曼濾波器358
194無損卡爾曼濾波器360
1941狀態(tài)演化361
1942測量合并過程362
195粒