智能無線機(jī)器人:人工智能算法與應(yīng)用
定 價(jià):99 元
叢書名:機(jī)器人學(xué)譯叢
- 作者:[美]陳光禎(Kwang-Cheng Chen) 著
- 出版時(shí)間:2022/7/1
- ISBN:9787111707882
- 出 版 社:機(jī)械工業(yè)出版社
- 中圖法分類:TP18
- 頁碼:271
- 紙張:
- 版次:
- 開本:16
機(jī)器人、無人駕駛汽車、無人機(jī)和智慧工廠將顯著改變數(shù)字社會(huì)中人類的生活方式。無線機(jī)器人中的人工智能介紹了無線通信和網(wǎng)絡(luò)技術(shù)如何促進(jìn)機(jī)器人中的人工智能,它在機(jī)器人中的人工智能、無線通信、計(jì)算和控制之間架起了基礎(chǔ)的多學(xué)科知識的橋梁。本書的一個(gè)獨(dú)特性是提出應(yīng)用通信和信號處理技術(shù)來增強(qiáng)機(jī)器人和多智能體系統(tǒng)中的傳統(tǒng)人工智能。
本書的技術(shù)內(nèi)容包括機(jī)器人基礎(chǔ)知識、信息物理系統(tǒng)、人工智能,統(tǒng)計(jì)決策和馬爾可夫決策過程,強(qiáng)化學(xué)習(xí),狀態(tài)估計(jì),定位,計(jì)算機(jī)視覺和多模態(tài)數(shù)據(jù)融合,機(jī)器人規(guī)劃,多智能體系統(tǒng),網(wǎng)絡(luò)化多智能體系統(tǒng),網(wǎng)絡(luò)化機(jī)器人的安全性和魯棒性,以及超可靠和低延遲的機(jī)器對機(jī)器的網(wǎng)絡(luò)。提供的例題和練習(xí)有助于簡單和有效的理解本書的內(nèi)容。
希望拓展在機(jī)器人、人工智能和無線通信等方面的知識的工程師將從這本書中受益。同時(shí),本書也適用于電氣工程、計(jì)算機(jī)工程、計(jì)算機(jī)科學(xué)和一般工程專業(yè)的高年級本科生或一年級研究生的教材。讀者需要具備本科概率論和線性代數(shù)的基礎(chǔ)知識,以及基本的編程能力,來享受深入閱讀的樂趣。
譯者序
前言
作譯者簡介
第1章 人工智能和機(jī)器人概述1
1.1 人工智能、控制論和機(jī)器人學(xué)的基礎(chǔ)知識1
1.2 智能體4
1.2.1 合理性的概念5
1.2.2 系統(tǒng)動(dòng)力學(xué)6
1.2.3 任務(wù)環(huán)境8
1.2.4 機(jī)器人和多智能體系統(tǒng)9
1.3 推理11
1.3.1 約束滿足問題13
1.3.2 通過搜索來求解CSP15
參考文獻(xiàn)20
第2章 基本搜索算法21
2.1 問題求解智能體21
2.2 搜索求解24
2.3 統(tǒng)一搜索28
2.3.1 廣度優(yōu)先搜索28
2.3.2 動(dòng)態(tài)規(guī)劃30
2.3.3 深度優(yōu)先搜索35
2.4 有信息搜索37
2.5 優(yōu)化41
2.5.1 線性規(guī)劃41
2.5.2 非線性規(guī)劃42
2.5.3 凸優(yōu)化42
參考文獻(xiàn)44
第3章 機(jī)器學(xué)習(xí)基礎(chǔ)45
3.1 監(jiān)督學(xué)習(xí)46
3.1.1 回歸46
3.1.2 貝葉斯分類53
3.1.3 KNN54
3.1.4 支持向量機(jī)55
3.2 無監(jiān)督學(xué)習(xí)57
3.2.1 K均值聚類57
3.2.2 EM算法58
3.2.3 主成分分析58
3.3 深度神經(jīng)網(wǎng)絡(luò)61
3.4 數(shù)據(jù)預(yù)處理64
參考文獻(xiàn)68
第4章 馬爾可夫決策過程69
4.1 統(tǒng)計(jì)決策69
4.1.1 數(shù)學(xué)基礎(chǔ)72
4.1.2 貝葉斯決策73
4.1.3 雷達(dá)信號探測78
4.1.4 貝葉斯序貫決策80
4.2 馬爾可夫決策過程81
4.2.1 馬爾可夫決策過程的數(shù)學(xué)基礎(chǔ)82
4.2.2 最優(yōu)策略84
4.2.3 開發(fā)貝爾曼方程的解85
4.3 決策及規(guī)劃:動(dòng)態(tài)規(guī)劃87
4.4 MDP的應(yīng)用:搜索移動(dòng)目標(biāo)92
4.5 多臂賭博機(jī)問題95
4.5.1 ε-貪婪算法97
4.5.2 上置信界98
4.5.3 湯普森采樣99
參考文獻(xiàn)106
第5章 強(qiáng)化學(xué)習(xí)107
5.1 強(qiáng)化學(xué)習(xí)基礎(chǔ)107
5.1.1 重訪多臂賭博機(jī)問題108
5.1.2 強(qiáng)化學(xué)習(xí)基礎(chǔ)111
5.1.3 基于馬爾可夫過程的強(qiáng)化學(xué)習(xí)112
5.1.4 貝爾曼最優(yōu)性原理115
5.2 Q學(xué)習(xí)116
5.2.1 部分可觀測狀態(tài)116
5.2.2 Q學(xué)習(xí)算法117
5.2.3 Q學(xué)習(xí)示例119
5.3 無模型的學(xué)習(xí)125
5.3.1 蒙特卡羅方法126
5.3.2 時(shí)序差分學(xué)習(xí)129
5.3.3 SARSA132
5.3.4 Q學(xué)習(xí)與TD學(xué)習(xí)的關(guān)系133
參考文獻(xiàn)135
第6章狀態(tài)估計(jì)136
6.1 估計(jì)基礎(chǔ)136
6.1.1 基于觀測的線性估計(jì)量137
6.1.2 線性預(yù)測139
6.1.3 貝葉斯估計(jì)140
6.1.4 極大似然估計(jì)142
6.2 遞歸狀態(tài)估計(jì)144
6.3 貝葉斯濾波146
6.4 高斯濾波149
6.4.1 卡爾曼濾波149
6.4.2 標(biāo)量卡爾曼濾波150
6.4.3 擴(kuò)展卡爾曼濾波154
參考文獻(xiàn)156
第7章 定位157
7.1 傳感器網(wǎng)絡(luò)定位158
7.1.1 到達(dá)時(shí)間技術(shù)158
7.1.2 到達(dá)角技術(shù)160
7.1.3 到達(dá)時(shí)間差技術(shù)162
7.2 移動(dòng)機(jī)器人定位164
7.3 同時(shí)定位與建圖165
7.3.1 概率SLAM166
7.3.2 擴(kuò)展卡爾曼濾波SLAM168
7.3.3 立體攝像機(jī)輔助的SLAM169
7.4 網(wǎng)絡(luò)定位和導(dǎo)航172
參考文獻(xiàn)175
第8章 機(jī)器人規(guī)劃176
8.1 知識表示和分類邏輯176
8.1.1 貝葉斯網(wǎng)絡(luò)178
8.1.2 語義表示184
8.2 離散規(guī)劃184
8.3 自主移動(dòng)機(jī)器人的規(guī)劃和導(dǎo)航187
8.3.1 規(guī)劃和導(dǎo)航示例188
8.3.2 強(qiáng)化學(xué)習(xí)的系統(tǒng)闡述189
8.3.3 定長規(guī)劃191
8.3.4 條件窮舉規(guī)劃191
參考文獻(xiàn)196
第9章多模態(tài)數(shù)據(jù)融合197
9.1 計(jì)算機(jī)視覺197
9.1.1 計(jì)算機(jī)視覺基礎(chǔ)198
9.1.2 邊緣檢測199
9.1.3 圖像特征和目標(biāo)識別201
9.2 基于視覺功能的多模態(tài)信息融合203
9.3 決策樹206
9.3.1 決策示例207
9.3.2 正式處理209
9.3.3 分類樹210
9.3.4 回歸樹211
9.3.5 規(guī)則和樹212
9.3.6 定位機(jī)器人213
9.3.7 帶決策樹的強(qiáng)化學(xué)習(xí)214
9.4 聯(lián)邦學(xué)習(xí)219
9.4.1 聯(lián)邦學(xué)習(xí)基礎(chǔ)220
9.4.2 通過無線通信進(jìn)行聯(lián)邦學(xué)習(xí)221
9.4.3 無線網(wǎng)絡(luò)上的聯(lián)邦學(xué)習(xí)222
9.4.4 多接入通信上的聯(lián)邦學(xué)習(xí)224
參考文獻(xiàn)225
第10章多機(jī)器人系統(tǒng)227
10.1 多機(jī)器人任務(wù)分配227
10.1.1 最優(yōu)分配228
10.1.2 多旅行商問題230
10.1.3 工廠自動(dòng)化231
10.2 無線通信和網(wǎng)絡(luò)236
10.2.1 數(shù)字通信系統(tǒng)236
10.2.2 計(jì)算機(jī)網(wǎng)絡(luò)239
10.2.3 多址通信241
10.3 網(wǎng)絡(luò)多機(jī)器人系統(tǒng)243
10.3.1 曼哈頓街道上的聯(lián)網(wǎng)自動(dòng)駕駛汽車243
10.3.2 網(wǎng)絡(luò)協(xié)同多機(jī)器人系統(tǒng)251
參考文獻(xiàn)257
技術(shù)縮略語258
索引263