深度學(xué)習(xí)——智能機(jī)器人應(yīng)用的理論與實(shí)踐
智能機(jī)器人發(fā)展日新月異,相關(guān)的機(jī)器學(xué)習(xí)技術(shù)受到廣泛關(guān)注。本書(shū)以其中關(guān)鍵的深度學(xué)習(xí)理論與實(shí)踐為主線,系統(tǒng)介紹了機(jī)器智能、機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的概念與算法;機(jī)器學(xué)習(xí)的參數(shù)及其擬合和欠擬合的問(wèn)題;神經(jīng)網(wǎng)絡(luò)等數(shù)學(xué)模型;卷積神經(jīng)網(wǎng)絡(luò)模型;循環(huán)神經(jīng)網(wǎng)絡(luò);注意力機(jī)制以及深度學(xué)習(xí)的算法;基于深度學(xué)習(xí)的人機(jī)協(xié)作識(shí)別、動(dòng)作抓取、平面檢測(cè)等應(yīng)用知識(shí)。
本書(shū)適宜從事機(jī)械、自動(dòng)控制等智能機(jī)器人相關(guān)專業(yè)的技術(shù)人員參考,也可作為相關(guān)專業(yè)的本科教材。
前建峰,江南大學(xué)機(jī)械工程學(xué)院教授,博士生導(dǎo)師。2004年7月畢業(yè)于上海交通大學(xué)機(jī)械與動(dòng)力工程學(xué)院,獲機(jī)械電子工程專業(yè)工學(xué)博士學(xué)位。中國(guó)機(jī)械工業(yè)教育協(xié)會(huì)機(jī)器人工程專業(yè)委員、中國(guó)電機(jī)工程學(xué)會(huì)會(huì)員、中國(guó)化工學(xué)會(huì)過(guò)濾與分離專業(yè)委員會(huì)委員、中國(guó)食品加工機(jī)械標(biāo)準(zhǔn)化技術(shù)委員。曾獲2023年中國(guó)輕工業(yè)聯(lián)合會(huì)科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)(排名第一)江蘇省科技進(jìn)步三等獎(jiǎng)2項(xiàng)(排第三)、2020年江蘇省普通高等學(xué)校本科優(yōu)秀畢業(yè)設(shè)計(jì)(論文)指導(dǎo)教師、2019年度江南大學(xué)榮智權(quán)獎(jiǎng)教金。講授《嵌入式系統(tǒng)與人工智能》《過(guò)程設(shè)備設(shè)計(jì)》《機(jī)械有限元設(shè)計(jì)》等課程。主要研究領(lǐng)域?yàn)闄C(jī)器人運(yùn)動(dòng)控制、嵌入式傳感系統(tǒng)高壓脈沖電源、工業(yè)互聯(lián)與控制。主持或參加各類科研課題30余項(xiàng),授權(quán)國(guó)家發(fā)明專利43項(xiàng),出版著作6部。
第一章緒論1
1.1自然智能與機(jī)器智能1
1.1.1自然智能1
1.1.2機(jī)器智能3
1.2機(jī)器獲取知識(shí)的途徑:機(jī)器學(xué)習(xí)5
1.2.1機(jī)器學(xué)習(xí)的概念5
1.2.2基本機(jī)器學(xué)習(xí)模型6
1.3機(jī)器認(rèn)知智能的實(shí)現(xiàn)途徑:神經(jīng)網(wǎng)絡(luò)10
1.3.1生物神經(jīng)網(wǎng)絡(luò)10
1.3.2人工神經(jīng)網(wǎng)絡(luò)與神經(jīng)元模型12
1.4深度學(xué)習(xí)的前沿發(fā)展及其應(yīng)用15
1.4.1深度學(xué)習(xí)15
1.4.2大語(yǔ)言模型16
1.4.3ChatGPT:智能對(duì)話機(jī)器人18
1.4.4OpenAI Codex:代碼生成與輔助編程19
1.5深度學(xué)習(xí)與智能機(jī)器人21
1.5.1智能機(jī)器人的定義與目標(biāo)21
1.5.2智能機(jī)器人與工業(yè)機(jī)器人的區(qū)別22
1.5.3智能機(jī)器人的環(huán)境多模態(tài)感知23
1.6本章小結(jié)27
第二章機(jī)器學(xué)習(xí)的數(shù)學(xué)基礎(chǔ)28
2.1標(biāo)量、向量、矩陣和張量28
2.2矩陣和向量相乘32
2.2.1矩陣和向量相乘的規(guī)則32
2.2.2矩陣和向量相乘的性質(zhì)32
2.2.3矩陣乘法的計(jì)算方法33
2.2.4矩陣乘法在神經(jīng)網(wǎng)絡(luò)中的應(yīng)用33
2.3導(dǎo)數(shù)34
2.3.1一般運(yùn)算法則35
2.3.2鏈?zhǔn)角髮?dǎo)法則36
2.4度量標(biāo)準(zhǔn)39
2.4.1誤差39
2.4.2距離39
2.4.3相似度40
2.5概率分布43
2.5.1二項(xiàng)分布44
2.5.2正態(tài)分布45
2.6本章小結(jié)46
第三章機(jī)器學(xué)習(xí)的構(gòu)成及理論基礎(chǔ)48
3.1機(jī)器學(xué)習(xí)基礎(chǔ)概念48
3.1.1人類學(xué)習(xí)與機(jī)器學(xué)習(xí)48
3.1.2機(jī)器學(xué)習(xí)的研究?jī)?nèi)容49
3.1.3機(jī)器學(xué)習(xí)系統(tǒng)的基本構(gòu)成50
3.2機(jī)器學(xué)習(xí)的分類52
3.2.1監(jiān)督學(xué)習(xí)53
3.2.2半監(jiān)督學(xué)習(xí)54
3.2.3無(wú)監(jiān)督學(xué)習(xí)54
3.2.4強(qiáng)化學(xué)習(xí)56
3.3機(jī)器學(xué)習(xí)的重要參數(shù)56
3.3.1學(xué)習(xí)率56
3.3.2動(dòng)量系數(shù)57
3.3.3偏置項(xiàng)58
3.4擬合問(wèn)題59
3.4.1過(guò)擬合問(wèn)題59
3.4.2欠擬合問(wèn)題60
3.5交叉驗(yàn)證60
3.5.1數(shù)據(jù)類型與選擇方法61
3.5.2留一交叉驗(yàn)證62
3.5.3K折交叉驗(yàn)證62
3.6回歸分析63
3.6.1線性回歸63
3.6.2邏輯回歸66
3.7評(píng)價(jià)指標(biāo)69
3.8本章小結(jié)71
第四章神經(jīng)網(wǎng)絡(luò)構(gòu)成及理論基礎(chǔ)72
4.1神經(jīng)網(wǎng)絡(luò)概述72
4.1.1深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)間的關(guān)系74
4.1.2神經(jīng)網(wǎng)絡(luò)的深度和寬度74
4.2常見(jiàn)的神經(jīng)網(wǎng)絡(luò)類型75
4.2.1全連接神經(jīng)網(wǎng)絡(luò)75
4.2.2卷積神經(jīng)網(wǎng)絡(luò)76
4.2.3循環(huán)神經(jīng)網(wǎng)絡(luò)77
4.3神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的核心問(wèn)題78
4.3.1定義神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)79
4.3.2選擇損失函數(shù)79
4.3.3選擇激活函數(shù)79
4.4神經(jīng)網(wǎng)絡(luò)最優(yōu)化過(guò)程82
4.4.1梯度下降算法82
4.4.2正向傳播算法86
4.4.3反向傳播算法87
4.4.4BP神經(jīng)網(wǎng)絡(luò)88
4.5其他神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)91
4.5.1生成對(duì)抗網(wǎng)絡(luò)91
4.5.2深度信念網(wǎng)絡(luò)93
4.5.3遷移學(xué)習(xí)95
4.6PyTorch和PaddlePaddle簡(jiǎn)介97
4.6.1PyTorch98
4.6.2PaddlePaddle103
4.7本章小結(jié)105
第五章卷積神經(jīng)網(wǎng)絡(luò)107
5.1卷積神經(jīng)網(wǎng)絡(luò)概述107
5.1.1發(fā)展歷程和實(shí)際應(yīng)用107
5.1.2基本組成111
5.2卷積神經(jīng)網(wǎng)絡(luò)的特征116
5.2.1連接稀疏性116
5.2.2參數(shù)共享機(jī)制117
5.3卷積神經(jīng)網(wǎng)絡(luò)中的反向傳播算法118
5.4其他卷積方式119
5.4.1轉(zhuǎn)置卷積119
5.4.2空洞卷積122
5.4.3分組卷積和深度分離卷積122
5.5卷積神經(jīng)網(wǎng)絡(luò)的典型模型125
5.5.1LeNet-5125
5.5.2AlexNet126
5.5.3VGGNet127
5.5.4GoogLeNet137
5.5.5ResNet148
5.5.6MobileNet和ShuffleNet161
5.5.7MMDetection框架搭建并實(shí)現(xiàn)訓(xùn)練與測(cè)試169
5.6本章小結(jié)179
第六章循環(huán)神經(jīng)網(wǎng)絡(luò)181
6.1循環(huán)神經(jīng)網(wǎng)絡(luò)概述181
6.1.1背景181
6.1.2概念182
6.1.3基本結(jié)構(gòu)182
6.2循環(huán)神經(jīng)網(wǎng)絡(luò)分類184
6.2.1單向循環(huán)神經(jīng)網(wǎng)絡(luò)184
6.2.2雙向循環(huán)神經(jīng)網(wǎng)絡(luò)185
6.2.3深度循環(huán)神經(jīng)網(wǎng)絡(luò)186
6.3模型訓(xùn)練與優(yōu)化187
6.3.1隨時(shí)間反向傳播算法188
6.3.2實(shí)時(shí)循環(huán)學(xué)習(xí)算法188
6.4長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)190
6.4.1原理講解190
6.4.2代碼講解191
6.5遞歸神經(jīng)網(wǎng)絡(luò)200
6.5.1原理講解200
6.5.2代碼講解202
6.6門(mén)控循環(huán)單元網(wǎng)絡(luò)207
6.6.1原理講解207
6.6.2代碼208
6.7本章小結(jié)208
第七章注意力機(jī)制與外部記憶210
7.1認(rèn)知神經(jīng)學(xué)中的注意力210
7.2注意力機(jī)制211
7.2.1注意力機(jī)制原理211
7.2.2注意力機(jī)制的變體212
7.3自注意力機(jī)制215
7.3.1自注意力機(jī)制原理215
7.3.2Transformer217
7.4人腦中的記憶219
7.5記憶增強(qiáng)神經(jīng)網(wǎng)絡(luò)221
7.5.1外部記憶221
7.5.2端到端記憶網(wǎng)絡(luò)222
7.5.3神經(jīng)圖靈機(jī)223
7.6計(jì)算機(jī)視覺(jué)中的注意力機(jī)制225
7.6.1計(jì)算機(jī)視覺(jué)中的注意力機(jī)制發(fā)展歷程225
7.6.2通道注意力機(jī)制227
7.6.3空間注意力機(jī)制229
7.6.4時(shí)間注意力機(jī)制232
7.6.5分支注意力機(jī)制234
7.6.6通道和空間注意力機(jī)制236
7.6.7時(shí)空注意力機(jī)制239
7.6.8注意力模塊添加的案例介紹242
7.7本章小結(jié)256
第八章深度學(xué)習(xí)調(diào)優(yōu)方法258
8.1數(shù)據(jù)方面258
8.1.1數(shù)據(jù)清洗258
8.1.2數(shù)據(jù)增強(qiáng)263
8.1.3數(shù)據(jù)降噪266
8.1.4數(shù)據(jù)歸一化269
8.2模型結(jié)構(gòu)方面271
8.2.1注意力機(jī)制271
8.2.2特征金字塔271
8.2.3殘差結(jié)構(gòu)272
8.2.4確定網(wǎng)絡(luò)層數(shù)273
8.3模型參數(shù)方面275
8.3.1學(xué)習(xí)率調(diào)整275
8.3.2參數(shù)初始化277
8.3.3網(wǎng)絡(luò)正則化278
8.3.4預(yù)訓(xùn)練模型的遷移學(xué)習(xí)282
8.4本章小結(jié)283
第九章智能機(jī)器人的視覺(jué)感知方法與視覺(jué)處理技術(shù)285
9.1經(jīng)典的視覺(jué)感知方案285
9.1.1視覺(jué)信息獲取285
9.1.2視覺(jué)顯著性檢測(cè)286
9.1.3光學(xué)系統(tǒng)的設(shè)計(jì)287
9.2視覺(jué)感知的傳統(tǒng)處理方法292
9.2.1圖像處理基礎(chǔ)292
9.2.2傳統(tǒng)的圖像特征提取293
9.2.3傳統(tǒng)的目標(biāo)檢測(cè)和識(shí)別295
9.3基于機(jī)器學(xué)習(xí)的視覺(jué)感知方法296
9.3.1集成學(xué)習(xí)296
9.3.2局部二值模式299
9.3.3特征點(diǎn)匹配方法301
9.3.4方向梯度直方圖303
9.3.5支持向量機(jī)305
9.4基于深度學(xué)習(xí)的視覺(jué)感知方法307
9.4.1經(jīng)典的視覺(jué)感知網(wǎng)絡(luò)結(jié)構(gòu)307
9.4.2基于深度學(xué)習(xí)的目標(biāo)感知307
9.5面向少量樣本學(xué)習(xí)的視覺(jué)感知方法309
9.5.1孿生神經(jīng)網(wǎng)絡(luò)309
9.5.2零樣本學(xué)習(xí)309
9.6本章小結(jié)311
第十章智能機(jī)器人的定位與導(dǎo)航規(guī)劃技術(shù)313
10.1地圖表示與構(gòu)建313
10.1.1地圖表示313
10.1.2地圖構(gòu)建317
10.2移動(dòng)機(jī)器人定位319
10.2.1傳感器技術(shù)319
10.2.2定位方法320
10.3導(dǎo)航規(guī)劃321
10.3.1導(dǎo)航技術(shù)322
10.3.2規(guī)劃技術(shù)324
10.4機(jī)器人運(yùn)動(dòng)控制327
10.4.1PID控制327
10.4.2模型預(yù)測(cè)控制328
10.4.3軌跡追蹤329
10.5多AGV任務(wù)調(diào)度及路徑規(guī)劃技術(shù)329
10.5.1AGV調(diào)度系統(tǒng)任務(wù)描述330
10.5.2AGV任務(wù)調(diào)度功能331
10.5.3AGV的路徑規(guī)劃算法332
10.5.4多AGV的沖突和避障算法335
10.6本章小結(jié)336
第十一章基于深度學(xué)習(xí)的表面缺陷檢測(cè)技術(shù)337
11.1表面缺陷檢測(cè)技術(shù)研究337
11.1.1研究背景與意義337
11.1.2國(guó)內(nèi)外研究現(xiàn)狀338
11.2基于機(jī)器視覺(jué)的表面缺陷檢測(cè)技術(shù)342
11.2.1機(jī)器視覺(jué)中的圖像處理技術(shù)342
11.2.2基于機(jī)器視覺(jué)的表面缺陷檢測(cè)過(guò)程345
11.2.3基于深度學(xué)習(xí)的表面缺陷檢測(cè)技術(shù)348
11.3具體案例:液晶面板電極缺陷檢測(cè)技術(shù)352
11.3.1液晶面板電極缺陷353
11.3.2基于深度學(xué)習(xí)的液晶面板電極缺陷檢測(cè)方法356
11.3.3實(shí)驗(yàn)結(jié)果和性能評(píng)估366
11.4本章小結(jié)372
第十二章基于深度學(xué)習(xí)的人機(jī)協(xié)作動(dòng)作識(shí)別373
12.1人機(jī)協(xié)作動(dòng)作識(shí)別技術(shù)研究373
12.1.1研究背景與意義373
12.1.2國(guó)內(nèi)外研究現(xiàn)狀374
12.1.3動(dòng)作識(shí)別模型375
12.2人機(jī)協(xié)作應(yīng)用376
12.2.1動(dòng)作識(shí)別技術(shù)在人機(jī)協(xié)作中的應(yīng)用376
12.2.2動(dòng)作識(shí)別技術(shù)在虛擬現(xiàn)實(shí)領(lǐng)域中的應(yīng)用377
12.3人機(jī)協(xié)作中的動(dòng)作識(shí)別問(wèn)題378
12.3.1動(dòng)作識(shí)別問(wèn)題定義378
12.3.2動(dòng)作特征的提取379
12.3.3動(dòng)作識(shí)別模型的構(gòu)建381
12.3.4人機(jī)協(xié)作場(chǎng)景中的動(dòng)作識(shí)別383
12.4具體案例:基于深度學(xué)習(xí)的動(dòng)作識(shí)別384
12.4.1動(dòng)作視頻采集設(shè)備的選擇384
12.4.2環(huán)境設(shè)置和數(shù)據(jù)采集384
12.4.3數(shù)據(jù)處理386
12.4.4模型訓(xùn)練386
12.4.5動(dòng)作識(shí)別模型的性能評(píng)估389
12.5前沿拓展:基于肌電信號(hào)及腦機(jī)設(shè)備的動(dòng)作識(shí)別390
12.6本章小結(jié)391
第十三章基于深度學(xué)習(xí)的機(jī)器人視覺(jué)抓取392
13.1研究背景及意義392
13.1.1機(jī)器人視覺(jué)抓取技術(shù)應(yīng)用392
13.1.2機(jī)器人視覺(jué)抓取技術(shù)發(fā)展393
13.2深度學(xué)習(xí)在機(jī)器人視覺(jué)抓取中的應(yīng)用及研究現(xiàn)狀395
13.2.1目標(biāo)檢測(cè)定位396
13.2.2位姿估計(jì)397
13.2.3抓取點(diǎn)檢測(cè)397
13.3基于深度學(xué)習(xí)的機(jī)器人視覺(jué)抓取問(wèn)題描述398
13.3.1機(jī)器人抓取任務(wù)分類398
13.3.2機(jī)器人抓取位姿表示399
13.3.3抓取檢測(cè)數(shù)據(jù)集400
13.4機(jī)器人視覺(jué)系統(tǒng)標(biāo)定與坐標(biāo)轉(zhuǎn)換403
13.4.1相機(jī)成像原理403
13.4.2相機(jī)標(biāo)定406
13.4.3手眼標(biāo)定406
13.5具體實(shí)例:抓取位姿檢測(cè)408
13.5.1判別式抓取檢測(cè)408
13.5.2生成式抓取檢測(cè)410
13.5.3從零開(kāi)始訓(xùn)練抓取檢測(cè)模型:GGCNN415
13.6基于深度學(xué)習(xí)的機(jī)器人視覺(jué)抓取技術(shù)挑戰(zhàn)和未來(lái)發(fā)展方向422
13.7本章小結(jié)423
參考文獻(xiàn)424