本書從深度學習的發(fā)展歷程開始,系統(tǒng)介紹了基于深度學習的目標檢測的基本問題及其相關處理方法與技術,主要內容涉及兩階段和單階段目標檢測的理論、算法和研究成果。本書共6章,包括深度學習神經網(wǎng)絡類型、目標檢測技術、基于Faster R-CNN的目標檢測改進算法、領域自適應及其在目標檢測技術上的典型應用、圖像識別模型改進及面部表情識別、結論與展望等內容。
本書主要面向人工智能、自動化、電子信息、計算機等專業(yè)高年級本科生以及控制科學與工程、信息與通信工程、計算機科學與技術等學科研究生,幫助讀者了解目標檢測技術的發(fā)展過程、基本知識與原理,同時也可供高校相關專業(yè)教師、科研人員和工程技術人員閱讀參考。
第1章深度學習神經網(wǎng)絡類型/001
1.1深度學習簡介001
1.2主要深度學習網(wǎng)絡原理004
1.2.1堆疊自編碼器005
1.2.2卷積神經網(wǎng)絡006
1.2.3深度信念網(wǎng)絡008
1.2.4遞歸神經網(wǎng)絡009
1.2.5生成對抗網(wǎng)絡011
1.3深度學習實際應用014
1.3.1目標檢測與識別014
1.3.2語音識別016
1.3.3文本識別017
1.4深度學習面臨挑戰(zhàn)018
1.4.1理論挑戰(zhàn)018
1.4.2工程挑戰(zhàn)020
參考文獻021
第2章基于深度學習的目標檢測技術/025
2.1目標檢測技術025
2.1.1目標檢測概念025
2.1.2目標檢測評價指標027
2.1.3目標檢測數(shù)據(jù)集029
2.2目標檢測方法030
2.2.1傳統(tǒng)目標檢測方法031
2.2.2深度學習目標檢測方法033
2.3基于區(qū)域的兩階段檢測器035
2.3.1R-CNN035
2.3.2SPPNet037
2.3.3Fast R-CNN038
2.3.4Faster R-CNN039
2.3.5FPN042
2.4基于區(qū)域的單階段檢測器042
2.4.1YOLO檢測器042
2.4.2其他檢測器048
2.5深度學習目標檢測開源框架050
2.5.1TensorFlow框架050
2.5.2PyTorch框架051
2.5.3PaddlePaddle框架052
參考文獻053
第3章基于Faster R-CNN的目標檢測技術/055
3.1Faster R-CNN算法056
3.2基于Faster R-CNN的目標檢測改進算法060
3.2.1特征提取層優(yōu)化060
3.2.2候選區(qū)域生成改進063
3.2.3雙線性插值的ROI歸一化064
3.2.4確定超參數(shù)065
3.2.5優(yōu)化算法參數(shù)選擇067
3.2.6網(wǎng)絡參數(shù)調整策略069
3.3實驗結果及分析078
參考文獻078
第4章基于領域自適應的目標檢測技術/079
4.1領域自適應概述079
4.1.1領域自適應與領域泛化080
4.1.2相關概念數(shù)學描述083
4.1.3深度領域自適應方法分類085
4.1.4領域自適應的不同形式087
4.2領域自適應技術089
4.2.1無監(jiān)督單源域單目標域自適應技術089
4.2.2無監(jiān)督多目標域自適應技術091
4.3領域自適應的目標檢測技術094
4.3.1基于領域漸進策略的目標檢測技術095
4.3.2基于Faster R-CNN的領域自適應目標檢測技術099
參考文獻104
第5章基于深度學習的圖像識別技術/106
5.1圖像識別模型介紹106
5.2圖像識別模型改進算法109
5.2.1最小加權隨機搜索算法109
5.2.2E-S判斷方法112
5.2.3構建小型卷積神經網(wǎng)絡113
5.2.4改進算法的執(zhí)行過程114
5.3基于改進算法的三種改進模型117
5.4實驗結果及分析121
5.5融入注意力機制的殘差網(wǎng)絡面部表情識別方法129
5.5.1注意力機制130
5.5.2殘差網(wǎng)絡134
5.5.3面部表情識別136
5.5.4融入注意力的殘差網(wǎng)絡人臉表情識別方法138
5.5.5實現(xiàn)過程145
5.5.6結論146
參考文獻149
第6章結論與展望/152
6.1結論152
6.2發(fā)展趨勢153
6.3目標檢測應用面臨的挑戰(zhàn)155
參考文獻158