讀者對象:本書的主要讀者是控制科學與工程及無人作戰(zhàn)相關(guān)專業(yè)的本科生、研究生,以及智能博弈對抗AI開發(fā)設(shè)計人員參考,也可供人工智能相關(guān)領(lǐng)域的科研人員閱讀和參考.
本書以智能博弈對抗為主線,聚焦技術(shù)進展、緊盯研究前沿,分為理論方法、應(yīng)用實踐、前沿展望三大部分。理論方法著重介紹智能博弈對抗的理論、相關(guān)基礎(chǔ)方法;應(yīng)用實踐針對當前三類典型智能博弈對抗系統(tǒng)平臺,提出人工智能程序設(shè)計思路并進行設(shè)計實現(xiàn);前沿展望分析當前智能博弈對抗領(lǐng)域的前沿元理論,探討智能博弈對抗的典型應(yīng)用場景。
更多科學出版社服務(wù),請掃碼獲取。
目錄
“智能科學技術(shù)著作叢書”序
前言
第1章 緒論 1
1.1 引言.1
1.2 智能博弈對抗內(nèi)涵與意義 2
1.2.1 智能博弈對抗 2
1.2.2 相關(guān)概念 2
1.2.3 研究的意義 6
1.3 智能博弈對抗相關(guān)研究應(yīng)用 7
1.3.1 即時策略類對抗 7
1.3.2 序貫策略類對抗 10
1.3.3 軍事仿真類對抗 15
1.4 主要內(nèi)容及章 節(jié)安排 19
參考文獻 21
第2章 博弈論視角下的多智能體學習 23
2.1 引言 23
2.2 博弈論基礎(chǔ) 23
2.2.1 博弈五要素 24
2.2.2 博弈論分類 25
2.2.3 博弈論相關(guān)概念 26
2.3 多智能體學習簡介 27
2.3.1 多智能體學習系統(tǒng)組成 28
2.3.2 多智能體學習概述 29
2.3.3 多智能體學習研究方法分類 30
2.4 多智能體博弈學習框架 31
2.4.1 多智能體博弈基礎(chǔ)模型及元博弈 31
2.4.2 均衡解概念與博弈動力學 34
2.4.3 多智能體博弈學習的挑戰(zhàn) 36
2.5 多智能體博弈策略學習方法.39
2.5.1 離線博弈策略學習方法 40
2.5.2 在線博弈策略學習方法 49
2.6 前沿研究重點及方向 50
2.6.1 前沿研究重點 50
2.6.2 前沿研究方向 51
參考文獻 52
第3章 智能博弈對抗策略學習方法基礎(chǔ) 65
3.1 引言 65
3.2 馬爾可夫決策過程 65
3.2.1 馬爾可夫決策模型 65
3.2.2 馬爾可夫決策過程求解方法 67
3.2.3 半馬爾可夫決策過程 70
3.3 強化學習 75
3.3.1 強化學習簡介 76
3.3.2 基于值函數(shù)的方法 78
3.3.3 基于策略梯度的方法 80
3.4 深度強化學習 81
3.4.1 無模型強化學習 81
3.4.2 基于模型的強化學習 84
3.5 分層強化學習 86
3.6 分布式強化學習 88
參考文獻 91
第4章 智能博弈對抗對手建模方法 95
4.1 引言 95
4.2 對手建;A(chǔ) 95
4.2.1 對手建模簡介 95
4.2.2 顯式對手建模方法 98
4.2.3 隱式對手建模方法 99
4.3 面向即時策略類對抗的對抗規(guī)劃 100
4.3.1 戰(zhàn)術(shù)對抗規(guī)劃 100
4.3.2 策略對抗規(guī)劃 103
4.3.3 混合對抗規(guī)劃 106
4.3.4 未來研究重點 109
4.4 面向序貫策略類對抗的對手剝削 110
4.4.1 對手建模式適變 111
4.4.2 對手感知式學習 113
4.4.3 對手生成式搜索 114
4.4.4 未來研究重點 115
參考文獻 116
第5章 協(xié)作式即時策略博弈對抗決策智能體設(shè)計 123
5.1 引言 123
5.2 面向《星際爭霸》的即時策略博弈對抗決策 123
5.2.1 《星際爭霸》游戲基礎(chǔ) 123
5.2.2 問題復雜度分析 125
5.2.3 研究挑戰(zhàn) 125
5.2.4 關(guān)鍵技術(shù)分析 126
5.3 《星際爭霸》智能博弈AI構(gòu)建 135
5.3.1 《星際爭霸》AI研究歷程 135
5.3.2 《星際爭霸》AI環(huán)境 138
5.3.3 《星際爭霸》AI實現(xiàn) 139
參考文獻 142
第6章 競爭式序貫博弈對抗決策智能體設(shè)計 144
6.1 引言 144
6.2 面向德州撲克的序貫博弈對抗決策 144
6.2.1 無限注德州撲克規(guī)則 144
6.2.2 問題復雜度分析 147
6.2.3 關(guān)鍵技術(shù)分析 148
6.3 德州撲克智能博弈AI構(gòu)建 155
6.3.1 德州撲克AI研究歷程 155
6.3.2 德州撲克智能博弈系統(tǒng) 160
6.3.3 兩人無限注德州撲克AI實現(xiàn) 162
6.3.4 多人無限注德州撲克AI實現(xiàn) 165
參考文獻 166
第7章 混合式序貫博弈對抗決策智能體設(shè)計 169
7.1 引言 169
7.2 面向斗地主的序貫博弈對抗決策 169
7.2.1 斗地主規(guī)則 169
7.2.2 問題復雜度分析 170
7.2.3 關(guān)鍵技術(shù)分析 171
7.3 斗地主智能博弈AI構(gòu)建 177
7.3.1 斗地主AI研究歷程 177
7.3.2 斗地主AI實現(xiàn) 178
7.4 面向橋牌的序貫博弈對抗決策 180
7.4.1 橋牌規(guī)則 180
7.4.2 問題復雜度分析 181
7.4.3 關(guān)鍵技術(shù)分析 182
7.5 橋牌叫牌AI構(gòu)建 187
7.5.1 橋牌AI研究歷程 187
7.5.2 叫牌AI實現(xiàn) 188
參考文獻 190
第8章 兵棋智能博弈對抗決策智能體設(shè)計192
8.1 引言 192
8.2 面向智能兵棋的多智能體對抗決策方法 192
8.2.1 兵棋推演基礎(chǔ) 192
8.2.2 問題復雜度分析 194
8.2.3 關(guān)鍵技術(shù)分析 196
8.3 墨子兵棋AI構(gòu)建 206
8.3.1 兵棋AI研究歷程206
8.3.2 兵棋智能博弈系統(tǒng) 207
8.3.3 兵棋AI實現(xiàn) 208
參考文獻 212
第9章 智能博弈對抗元理論 214
9.1 引言 214
9.2 元宇宙:開放式學習環(huán)境 214
9.3 元博弈:博弈的博弈理論 217
9.3.1 元博弈理論 217
9.3.2 開放式學習框架 218
9.4 元認知:認知行為框架 218
9.4.1 快與慢 218
9.4.2 元認知 219
9.4.3 認知行為建模 220
9.5 元學習:雙層優(yōu)化方法 222
9.5.1 度量學習方法 222
9.5.2 分層優(yōu)化方法 223
9.5.3 貝葉斯方法 224
參考文獻.224
第10章 智能博弈對抗前沿應(yīng)用227
10.1 引言.227
10.2 微分博弈與視覺欺騙227
10.2.1 微分博弈 227
10.2.2 視覺欺騙 228
10.3 攻防博弈與復雜網(wǎng)絡(luò)攻防 232
10.3.1 攻防博弈 232
10.3.2 復雜網(wǎng)絡(luò)攻防 233
10.4 平均場博弈與無人機集群對抗 234
10.4.1 平均場博弈 234
10.4.2 無人機集群對抗 235
參考文獻 238