近年來(lái),隨著人工智能技術(shù)的不斷發(fā)展,智能對(duì)話系統(tǒng)開始在私人助理、智能客服、現(xiàn)代搜索引擎等領(lǐng)域逐漸應(yīng)用,為大眾提供不同程度的智能高效服務(wù)。本書旨在指導(dǎo)初學(xué)者輕松進(jìn)入智能對(duì)話領(lǐng)域,并逐步深入實(shí)戰(zhàn)中,同時(shí)通過(guò)項(xiàng)目案例將理論與實(shí)戰(zhàn)相結(jié)合,使讀者不僅能系統(tǒng)地學(xué)習(xí)智能對(duì)話的基本理論,還能快速地將其應(yīng)用于實(shí)踐。
本書共分為12章,分為三部分。第一部分是理論基礎(chǔ)篇,主要介紹了概率統(tǒng)計(jì)、統(tǒng)計(jì)學(xué)習(xí)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等方面的基本理論。第二部分是技術(shù)篇,著重講解了智能對(duì)話系統(tǒng)中常見的功能系統(tǒng)及幾個(gè)著名企業(yè)的智能問答架構(gòu)實(shí)現(xiàn),幫助讀者理解智能對(duì)話的工程架構(gòu)和實(shí)踐理論。這里的常見功能系統(tǒng)包括FAQ問答、知識(shí)圖譜問答、任務(wù)型問答和表格問答等內(nèi)容。第三部分是實(shí)踐篇,涵蓋了智能對(duì)話開源框架和問答系統(tǒng)實(shí)例介紹,從多個(gè)角度讓讀者完整地了解對(duì)話系統(tǒng)的架構(gòu)實(shí)現(xiàn),并具備自己搭建智能對(duì)話系統(tǒng)的能力。
本書內(nèi)容通俗易懂,案例豐富,實(shí)用性強(qiáng),特別適合對(duì)智能對(duì)話系統(tǒng)感興趣的入門讀者和進(jìn)階讀者閱讀,也適合初中級(jí)自然語(yǔ)言處理(NLP)工程師或人工智能(AI)算法工程師等其他編程愛好者閱讀。此外,本書也適合作為大專院校及相關(guān)培訓(xùn)機(jī)構(gòu)的教材使用。
吳科
----------------------------
吳科,博士,八維教育集團(tuán)人工智能學(xué)院院長(zhǎng)。曾任阿里巴巴搜索研發(fā)專家,智齒科技首席科學(xué)家和AI研究院負(fù)責(zé)人,天壤智能高級(jí)研究員,上海交通大學(xué)教師。THU-EE第9屆清華大學(xué)自然語(yǔ)言處理研討會(huì)和2021企業(yè)數(shù)據(jù)智能峰會(huì)演講嘉賓。曾獲微軟亞洲研究院明日之星稱號(hào),擁有多項(xiàng)中美專利、深度學(xué)習(xí)譯著一部。
目錄
第1章 概率統(tǒng)計(jì)基礎(chǔ) 5
1.1 概率基礎(chǔ) 6
1.1.1 從概率到條件概率 6
1.1.2 隨機(jī)事件的關(guān)系 7
1.1.3 貝葉斯定理 9
1.2 隨機(jī)變量 11
1.2.1 隨機(jī)變量的引入 11
1.2.2 常見概率分布 13
1.2.3 多元隨機(jī)變量(聯(lián)合、邊緣與條件 | 獨(dú)立與相關(guān)) 17
1.2.3 多元正態(tài)分布 23
1.3 統(tǒng)計(jì)推斷 24
1.3.1 最大似然 25
1.3.2 最大后驗(yàn) 26
1.4 隨機(jī)過(guò)程 27
1.4.1 馬爾可夫鏈 27
1.4.2 馬爾可夫鏈的極限與穩(wěn)態(tài) 29
1.4.3 馬爾可夫鏈蒙特卡洛方法 30
1.5 本章小結(jié) 32
第2章 統(tǒng)計(jì)學(xué)習(xí) 33
2.1 樸素貝葉斯 33
2.2 支持向量機(jī) 36
2.2.1 支持向量機(jī)的理論基礎(chǔ) 36
2.2.2 SMO算法原理 37
2.3 最大熵 39
2.3.1 信息熵 40
2.3.2 最大熵推導(dǎo) 41
2.3.3 最大熵模型 41
2.4 條件隨機(jī)場(chǎng) 43
2.4.1 馬爾可夫隨機(jī)場(chǎng) 43
2.4.2 條件隨機(jī)場(chǎng)原理 45
2.4.3 推斷算法 46
2.5 本章小結(jié) 48
第3章 深度學(xué)習(xí) 48
3.1 神經(jīng)網(wǎng)絡(luò) 48
3.1.1 神經(jīng)元 48
3.1.2 網(wǎng)絡(luò)結(jié)構(gòu) 53
3.1.3 反向傳播算法 55
3.2 卷積神經(jīng)網(wǎng)絡(luò) 57
3.2.1 卷積層 57
3.2.2 匯聚層 58
3.2.3 CNN句子建模 59
3.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 62
3.3.1 簡(jiǎn)單循環(huán)網(wǎng)絡(luò) 63
3.3.2 長(zhǎng)短期記憶網(wǎng)絡(luò) 64
3.3.3 LSTM句子建模 66
3.4 Attention機(jī)制 68
3.4.1 什么是注意力機(jī)制 69
3.4.2 Encoder-Decoder框架 70
3.4.3 Attention模型 71
3.4.4 Attention機(jī)制的原理 73
3.5 預(yù)訓(xùn)練模型 74
3.5.1 非上下文感知模型 75
3.5.2 上下文感知模型 79
3.6 本章小結(jié) 88
第4章 強(qiáng)化學(xué)習(xí) 89
4.1 什么是強(qiáng)化學(xué)習(xí) 89
4.1.1 強(qiáng)化學(xué)習(xí)的組成要素 90
4.1.2 馬爾可夫決策過(guò)程 92
4.1.3 最優(yōu)價(jià)值函數(shù)和最優(yōu)策略 97
4.1.4 價(jià)值迭代和策略迭代 98
4.2 深度強(qiáng)化學(xué)習(xí): 從Q-Learning到DQN 101
4.2.1 Q-Learning 101
4.2.2 價(jià)值函數(shù)近似 102
4.2.3 DQN 104
4.3 策略梯度 107
4.3.1 基本原理 107
4.3.2 策略參數(shù)化 111
4.3.3 Actor-Critic方法 113
4.4 探索策略 116
4.4.1 ??貪心策略 116
4.4.2 置信區(qū)間上界策略 117
4.4 本章小結(jié) 118
第5章 FAQ問答 118
5.1 基本概念 119
5.1.1 知識(shí)庫(kù)相關(guān)概念 119
5.1.2 FAQ問答系統(tǒng)的業(yè)務(wù)架構(gòu) 121
5.1.3 FAQ問答引擎 122
5.2 文本匹配模型 123
5.2.1 規(guī)則匹配 124
5.2.2 字面特征的匹配 125
5.2.3 深度學(xué)習(xí)語(yǔ)義匹配 130
5.3 本章小結(jié) 149
第6章 知識(shí)圖譜問答 150
6.1 什么是知識(shí)圖譜 150
6.1.1 知識(shí)圖譜定義 150
6.1.2 知識(shí)圖譜的數(shù)據(jù)模型 152
6.1.3 知識(shí)圖譜的存儲(chǔ)方式 156
6.2 基于模板的方法 164
6.3 基于語(yǔ)義分析的方法 167
6.3.1 語(yǔ)義表示 167
6.3.2 邏輯表達(dá)式生成 168
6.3.3 語(yǔ)義分析實(shí)例 172
6.4 基于答案排序的方法 176
6.4.1 基于特征的答案排序 177
6.4.2 基于子圖匹配的答案排序 179
6.5 本章小結(jié) 181
第7章 任務(wù)型問答 181
7.1 管道方法 182
7.1.1 自然語(yǔ)言理解 182
7.1.2 對(duì)話狀態(tài)跟蹤 186
7.1.3 對(duì)話策略學(xué)習(xí) 190
7.1.4 自然語(yǔ)言生成 201
7.2 端到端方法 203
7.2.1 復(fù)制機(jī)制 203
7.2.2 記憶網(wǎng)絡(luò) 204
7.2.3 GLMP模型 205
7.3 本章小結(jié) 209
第8章 表格問答 210
8.1 什么是表格問答 210
8.2 表格檢索 211
8.3 語(yǔ)義解析 212
8.3.1 規(guī)則模板 212
8.3.2 端到端模型 214
8.3.3 文法模型 218
8.4 本章小結(jié) 223
第9章 企業(yè)級(jí)智能問答的架構(gòu)實(shí)現(xiàn) 224
9.1 阿里小蜜 224
9.2 微軟小冰 226
9.3 美團(tuán)智能客服 231
9.4 本章小結(jié) 236
第10章 人工智能標(biāo)記語(yǔ)言(AIML) 236
10.1 AIML基礎(chǔ) 237
10.1.1 基本標(biāo)簽 237
10.1.2 上下文能力 239
10.1.3 同義能力 242
10.1.4 標(biāo)準(zhǔn)啟動(dòng)文件 244
10.2 源碼框架剖析 245
10.2.1 核心代碼組成 245
10.2.2 語(yǔ)法解析 246
10.2.3 核心問答代碼 248
10.3 設(shè)計(jì)與實(shí)現(xiàn) 253
10.3.1 中文適配處理 253
10.3.2 知識(shí)庫(kù)設(shè)計(jì) 256
10.3.3 運(yùn)行展示 261
10.4 本章小結(jié) 261
第11章 Rasa多輪對(duì)話開源框架 261
11.1 Rasa基礎(chǔ)概要 262
11.1.1 Rasa系統(tǒng)結(jié)構(gòu) 262
11.1.2 Rasa環(huán)境部署 263
11.2 Rasa NLU 265
11.2.1 NLU管道 265
11.2.2 NLU訓(xùn)練數(shù)據(jù) 270
11.3 Rasa Core 276
11.3.1 故事 277
11.3.2 規(guī)則 281
11.3.3 動(dòng)作 283
11.3.4 表單 289
11.3.5 策略 292
11.4 多輪對(duì)話設(shè)計(jì)實(shí)現(xiàn) 295
11.4.1 基于對(duì)話驅(qū)動(dòng)的開發(fā) 295
11.4.2 對(duì)話設(shè)計(jì) 297
11.4.3 簡(jiǎn)單的訂餐示例 304
11.5 本章小結(jié) 307
第12章 問答系統(tǒng)幾個(gè)實(shí)例 308
12.1 FAQ問答實(shí)例講解 308
12.1.1 問題分析 309
12.1.2 檢索 311
12.1.3 匹配 312
12.1.4 重排 314
12.1.5 索引模塊 314
12.1.6 SimNet模塊 316
12.2 圖譜問答實(shí)例講解 318
12.2.1 圖譜介紹 318
12.2.2 主代碼介紹 320
12.3 基于RL的問答系統(tǒng)實(shí)例講解 323
12.3.1 訓(xùn)練架構(gòu)介紹 324
12.3.2 DQN智能體 330
12.3.3 對(duì)話狀態(tài)跟蹤器 334
12.3.4 用戶模擬 341
12.3.5 錯(cuò)誤模型控制器 350
12.3.6 智能體運(yùn)行 352
12.4 本章小結(jié) 354