本書是一本全面介紹人工智能領(lǐng)域的專業(yè)教材。分為八章,人工智能概述、人工智能數(shù)學(xué)基礎(chǔ)、人工智能基礎(chǔ)模型、人工智能編程框架、視覺智能處理技術(shù)、語言智能處理技術(shù)、語音智能處理技術(shù)和人工智能的未來發(fā)展趨勢。首先介紹人工智能的相關(guān)基礎(chǔ)知識,包括人工智能相關(guān)概念、人工智能的數(shù)學(xué)基礎(chǔ)、人工智能的模型基礎(chǔ)以及相關(guān)編程基礎(chǔ),然后分別介紹視覺、語音、語言三個領(lǐng)域中的人工智能原理、方法以及技術(shù)應(yīng)用,最后對人工智能的發(fā)展趨勢做出了總結(jié)、思考和前瞻。本書除了提供全面的人工智能基礎(chǔ)知識外,還通過豐富的實踐案例和具體的應(yīng)用介紹,幫助讀者更深刻地理解和應(yīng)用所學(xué)知識。
更多科學(xué)出版社服務(wù),請掃碼獲取。
目錄
第1章 人工智能概述 1
1.1 人工智能的概念 1
1.2 人工智能的意義和目標(biāo) 2
1.2.1 人工智能的意義 2
1.2.2 人工智能的目標(biāo) 2
1.3 人工智能的起源和發(fā)展 2
1.4 人工智能的方向和內(nèi)容 6
1.4.1 機(jī)器學(xué)習(xí) 6
1.4.2 視覺信息處理 7
1.4.3 自然語言處理 8
1.4.4 語音信號處理 9
1.4.5 多模態(tài)信息處理 9
1.4.6 人工智能自動生成內(nèi)容 10
習(xí)題 10
第2章 人工智能數(shù)學(xué)基礎(chǔ) 11
2.1 線性代數(shù) 11
2.1.1 基本數(shù)學(xué)對象 11
2.1.2 向量運(yùn)算 13
2.1.3 矩陣乘法 13
2.1.4 矩陣運(yùn)算 14
2.1.5 向量組與向量空間 15
2.1.6 特征分解 17
2.1.7 奇異值分解 18
2.1.8 特殊的矩陣 19
2.1.9 范數(shù) 20
2.2 微積分 20
2.2.1 導(dǎo)數(shù)與微分 21
2.2.2 鏈?zhǔn)椒▌t 22
2.2.3 函數(shù)極值 23
2.2.4 積分 23
2.2.5 矩陣微積分 24
2.2.6 泰勒公式 26
2.2.7 常用函數(shù)及其導(dǎo)數(shù) 26
2.3 概率與信息論 28
2.3.1 隨機(jī)變量 28
2.3.2 概率分布 28
2.3.3 期望和方差 30
2.3.4 條件概率 32
2.3.5 貝葉斯定理 33
2.3.6 信息論與熵 33
2.3.7 交叉熵與散度 34
2.4 數(shù)值計算 35
2.4.1 最優(yōu)化問題的基礎(chǔ)模型 35
2.4.2 最優(yōu)化問題分類 36
2.4.3 最小二乘法 37
2.4.4 梯度下降法 38
2.4.5 共軛梯度法 40
2.4.6 深度學(xué)習(xí)中常用的優(yōu)化方法 42
習(xí)題 47
第3章 人工智能基礎(chǔ)模型 48
3.1 卷積神經(jīng)網(wǎng)絡(luò) 48
3.1.1 卷積神經(jīng)網(wǎng)絡(luò)的背景介紹 49
3.1.2 卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu) 49
3.1.3 卷積神經(jīng)網(wǎng)絡(luò)的計算 51
3.1.4 典型卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用 56
3.2 循環(huán)神經(jīng)網(wǎng)絡(luò) 58
3.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)的背景介紹 58
3.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu) 58
3.2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)的計算 61
3.2.4 典型循環(huán)神經(jīng)網(wǎng)絡(luò)的應(yīng)用 64
3.3 生成對抗網(wǎng)絡(luò) 64
3.3.1 生成對抗網(wǎng)絡(luò)的背景介紹 65
3.3.2 生成對抗網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu) 65
3.3.3 生成對抗網(wǎng)絡(luò)的計算 68
3.3.4 典型生成對抗網(wǎng)絡(luò)的應(yīng)用 69
3.4 擴(kuò)散模型 71
3.4.1 擴(kuò)散模型的背景介紹 71
3.4.2 擴(kuò)散模型的基礎(chǔ)結(jié)構(gòu) 72
3.4.3 擴(kuò)散模型的計算 73
3.4.4 典型擴(kuò)散模型的應(yīng)用 81
3.5 圖神經(jīng)網(wǎng)絡(luò) 83
3.5.1 圖神經(jīng)網(wǎng)絡(luò)的背景介紹 84
3.5.2 圖神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)結(jié)構(gòu) 86
3.5.3 圖神經(jīng)網(wǎng)絡(luò)的計算 88
3.5.4 典型圖神經(jīng)網(wǎng)絡(luò)的應(yīng)用 91
3.6 Transformer 92
3.6.1 Transformer的背景介紹 92
3.6.2 Transformer的基礎(chǔ)結(jié)構(gòu) 94
3.6.3 Transformer的計算 98
3.6.4 典型Transformer的應(yīng)用 99
習(xí)題 101
第4章 人工智能編程框架 102
4.1 Python基礎(chǔ) 102
4.1.1 Python簡介 102
4.1.2 Python基本語法 107
4.1.3 Python數(shù)據(jù)類型 108
4.1.4 Python程序結(jié)構(gòu) 119
4.1.5 Python函數(shù) 123
4.1.6 Python類 124
4.1.7 Python庫 125
4.2 PyTorch框架 130
4.2.1 環(huán)境配置 131
4.2.2 模型實現(xiàn)示例 135
4.3 其他人工智能框架 140
習(xí)題 141
第5章 視覺智能處理技術(shù) 142
5.1 視覺智能處理基礎(chǔ)知識 142
5.1.1 圖像表示與處理 142
5.1.2 特征提取與描述 146
5.1.3 視覺智能處理基本任務(wù) 149
5.2 目標(biāo)檢測與圖像分割技術(shù) 151
5.2.1 目標(biāo)檢測與圖像分割中的基礎(chǔ)知識 152
5.2.2 基于CNN的目標(biāo)檢測與圖像分割 157
5.2.3 結(jié)合Transformer的目標(biāo)檢測與圖像分割 161
5.3 三維視覺技術(shù) 166
5.3.1 點云數(shù)據(jù)的表示 166
5.3.2 點云物體分類與分割 167
5.3.3 基于點云的生成技術(shù) 174
5.4 視頻理解和處理技術(shù) 180
5.4.1 基本概念 180
5.4.2 視頻對象分割 186
5.4.3 視頻增強(qiáng) 193
習(xí)題 201
第6章 語言智能處理技術(shù) 202
6.1 語言智能處理基礎(chǔ)知識 202
6.1.1 文本表示與嵌入 202
6.1.2 句法分析 207
6.1.3 關(guān)鍵詞提取 210
6.2 神經(jīng)機(jī)器翻譯 212
6.2.1 神經(jīng)機(jī)器翻譯介紹 213
6.2.2 基于深度神經(jīng)網(wǎng)絡(luò)的神經(jīng)機(jī)器翻譯模型 216
6.2.3 BERT-fused模型 220
6.2.4 mRASP模型 224
6.3 共指解析技術(shù) 226
6.3.1 共指解析的基本概念 228
6.3.2 共指解析的評估標(biāo)準(zhǔn) 229
6.3.3 端到端的共指解析模型 232
6.4 智能問答技術(shù) 237
6.4.1 智能問答系統(tǒng)發(fā)展歷程 238
6.4.2 智能問答系統(tǒng)架構(gòu) 238
6.4.3 智能問答基礎(chǔ) 239
6.4.4 大語言模型 244
6.4.5 智能問答系統(tǒng) 247
習(xí)題 248
第7章 語音智能處理技術(shù) 249
7.1 語音信號處理技術(shù) 249
7.1.1 語音信號的特性與數(shù)字化表示 249
7.1.2 語音信號的預(yù)處理 251
7.1.3 語音信號的特征提取 254
7.2 語音識別技術(shù) 257
7.2.1 傳統(tǒng)的語音識別技術(shù) 258
7.2.2 端到端的語音識別技術(shù) 258
7.3 語音合成及轉(zhuǎn)換技術(shù) 265
7.3.1 語音合成技術(shù) 265
7.3.2 語音轉(zhuǎn)換技術(shù) 273
7.4 語音增強(qiáng)技術(shù) 276
7.4.1 語音增強(qiáng)介紹 276
7.4.2 冗余卷積編碼器-解碼器 279
7.4.3 語音增強(qiáng)生成對抗網(wǎng)絡(luò) 281
7.4.4 用于語音增強(qiáng)的條件擴(kuò)散模型 283
習(xí)題 286
第8章 人工智能的未來發(fā)展趨勢 287
8.1 生成式人工智能技術(shù) 287
8.1.1 小波擴(kuò)散模型 288
8.1.2 偏移擴(kuò)散模型 290
8.1.3 對未來技術(shù)的思考和展望 294
8.2 可解釋人工智能技術(shù) 294
8.2.1 PIP-Net模型 295
8.2.2 LaBo模型 298
8.2.3 對未來技術(shù)的思考和展望 301
8.3 多模態(tài)人工智能技術(shù) 302
8.3.1 Lynx模型 302
8.3.2 BLIP-2模型 304
8.3.3 對未來技術(shù)的思考和展望 307
8.4 具身智能技術(shù) 307
8.4.1 PaLM-E模型 308
8.4.2 EmbodiedGPT模型 311
8.4.3 對未來技術(shù)的思考和展望 314
習(xí)題 315
參考文獻(xiàn) 316