第1章走近知識圖譜1
1.1基本概念1
1.1.1源自搜索引擎1
1.1.2知識圖譜的定義2
1.1.3知識表示3
1.1.4操作和存儲5
1.2構(gòu)建流程7
1.2.1數(shù)據(jù)獲取8
1.2.2信息抽取9
1.2.3知識融合11
1.2.4知識加工13
1.3知識圖譜應(yīng)用15
1.3.1知識圖譜分類15
1.3.2通用知識圖譜應(yīng)用16
1.3.3領(lǐng)域知識圖譜應(yīng)用18
1.3.4面臨的技術(shù)挑戰(zhàn)22
1.4本書實(shí)戰(zhàn)知識點(diǎn)23
第2章企業(yè)信息知識圖譜25
2.1項(xiàng)目設(shè)計(jì)25
2.1.1需求分析25
2.1.2工作流程25
2.1.3技術(shù)選型26
2.1.4開發(fā)準(zhǔn)備27
2.2數(shù)據(jù)準(zhǔn)備和預(yù)處理28
2.2.1數(shù)據(jù)獲取28
2.2.2數(shù)據(jù)的預(yù)處理30
2.3知識建模和存儲31
2.3.1企業(yè)主要屬性31
2.3.2企業(yè)數(shù)據(jù)源形成31
2.3.3知識圖譜主體構(gòu)建35
2.3.4企業(yè)信息三元組形成36
2.3.5數(shù)據(jù)存儲 37
2.4圖譜可視化和知識應(yīng)用38
2.4.1查詢企業(yè)全貌39
2.4.2企業(yè)關(guān)系維度分析41
2.4.3司法維度分析41
2.5小結(jié)和擴(kuò)展42
〖1〗〖2〗實(shí)戰(zhàn)知識圖譜〖1〗目錄第3章醫(yī)藥疾病知識圖譜44
3.1項(xiàng)目設(shè)計(jì)44
3.1.1需求分析44
3.1.2工作流程44
3.1.3技術(shù)選型45
3.1.4開發(fā)準(zhǔn)備47
3.2數(shù)據(jù)準(zhǔn)備和預(yù)處理47
3.2.1數(shù)據(jù)描述47
3.2.2數(shù)據(jù)獲取48
3.2.3數(shù)據(jù)預(yù)處理50
3.3知識建模和存儲51
3.3.1實(shí)體抽取51
3.3.2三元組的抽取53
3.3.3數(shù)據(jù)存儲55
3.4圖譜可視化和知識應(yīng)用56
3.4.1數(shù)據(jù)查詢57
3.4.2膳食維度分析58
3.4.3用藥維度分析60
3.5小結(jié)和擴(kuò)展60
第4章銀行審計(jì)知識圖譜61
4.1項(xiàng)目設(shè)計(jì)61
4.1.1需求分析61
4.1.2工作流程61
4.1.3技術(shù)選型62
4.1.4開發(fā)準(zhǔn)備62
4.2數(shù)據(jù)準(zhǔn)備和預(yù)處理63
4.2.1數(shù)據(jù)獲取63
4.2.2數(shù)據(jù)預(yù)處理66
4.3知識建模和存儲67
4.3.1構(gòu)建賬戶數(shù)據(jù)模型 67
4.3.2抽取三元組并存儲68
4.4圖譜可視化和知識應(yīng)用70
4.4.1客戶的所有賬戶70
4.4.2賬戶的全部交易記錄71
4.4.3某時(shí)間段內(nèi)賬戶的交易記錄71
4.4.4賬戶相關(guān)的全部對方賬戶73
4.4.5客戶的異常交易行為73
4.4.6下一步改進(jìn)工作74
4.5小結(jié)和擴(kuò)展77
第5章人物關(guān)系智能問答78
5.1項(xiàng)目設(shè)計(jì)78
5.1.1需求分析78
5.1.2工作流程79
5.1.3技術(shù)選型79
5.1.4開發(fā)準(zhǔn)備81
5.2數(shù)據(jù)準(zhǔn)備和預(yù)處理82
5.2.1數(shù)據(jù)準(zhǔn)備82
5.2.2數(shù)據(jù)預(yù)處理82
5.3知識建模和存儲83
5.3.1知識建模及描述83
5.3.2數(shù)據(jù)存儲84
5.4圖譜可視化和知識應(yīng)用88
5.4.1問題模板定義89
5.4.2樸素貝葉斯問題分類90
5.4.3意圖識別與槽位填充91
5.4.4問答展示93
5.5小結(jié)和擴(kuò)展96
第6章基于知識庫的實(shí)體鏈接系統(tǒng)98
6.1項(xiàng)目設(shè)計(jì)98
6.1.1需求分析98
6.1.2工作流程98
6.1.3技術(shù)選型99
6.1.4開發(fā)準(zhǔn)備100
6.2數(shù)據(jù)準(zhǔn)備和預(yù)處理101
6.2.1數(shù)據(jù)獲取101
6.2.2數(shù)據(jù)預(yù)處理101
6.2.3自定義詞典104
6.3知識建模和存儲104
6.3.1候選實(shí)體生成104
6.3.2候選實(shí)體消歧108
6.4知識應(yīng)用111
6.4.1功能實(shí)現(xiàn)111
6.4.2應(yīng)用場景112
6.5小結(jié)和擴(kuò)展113
第7章交通出行科研文獻(xiàn)研究114
7.1項(xiàng)目設(shè)計(jì)114
7.1.1需求分析114
7.1.2工作流程114
7.1.3技術(shù)選型115
7.1.4開發(fā)準(zhǔn)備116
7.2數(shù)據(jù)準(zhǔn)備和預(yù)處理117
7.2.1文獻(xiàn)數(shù)據(jù)下載117
7.2.2文獻(xiàn)數(shù)據(jù)導(dǎo)入117
7.2.3數(shù)據(jù)轉(zhuǎn)換處理118
7.2.4CNKI引文數(shù)據(jù)獲取119
7.3圖譜可視化和知識應(yīng)用121
7.3.1共現(xiàn)和聚類分析122
7.3.2突現(xiàn)分析126
7.3.3共被引分析127
7.3.4合作網(wǎng)絡(luò)分析128
7.4小結(jié)和擴(kuò)展129
第8章微博輿情知識圖譜130
8.1項(xiàng)目設(shè)計(jì)130
8.1.1需求分析130
8.1.2工作流程130
8.1.3技術(shù)選型132
8.1.4開發(fā)準(zhǔn)備133
8.2數(shù)據(jù)準(zhǔn)備和預(yù)處理133
8.2.1采集話題帖子133
8.2.2解析關(guān)鍵數(shù)據(jù)134
8.2.3情感傾向分析142
8.3知識建模和存儲143
8.4圖譜可視化和知識應(yīng)用146
8.4.1圖譜可視化146
8.4.2展示性分析147
8.5小結(jié)和擴(kuò)展149
第9章基于法規(guī)知識圖譜的搜索系統(tǒng)150
9.1項(xiàng)目設(shè)計(jì)150
9.1.1需求分析150
9.1.2工作流程151
9.1.3技術(shù)選型152
9.1.4開發(fā)準(zhǔn)備154
9.2數(shù)據(jù)準(zhǔn)備和預(yù)處理155
9.2.1獲取法規(guī)列表155
9.2.2獲得法律內(nèi)容詳情156
9.2.3法規(guī)實(shí)體抽取158
9.3知識建模和存儲160
9.3.1法規(guī)采集記錄160
9.3.2法規(guī)詳情信息161
9.3.3法規(guī)關(guān)系數(shù)據(jù)163
9.4圖譜可視化和知識應(yīng)用165
9.4.1可視化實(shí)現(xiàn)過程165
9.4.2法規(guī)數(shù)據(jù)圖譜展示170
9.4.3法律法規(guī)Web搜索171
9.5小結(jié)和擴(kuò)展173
第10章基于裁判文書的司法知識圖譜174
10.1項(xiàng)目設(shè)計(jì)174
10.1.1需求分析174
10.1.2工作流程175
10.1.3技術(shù)選型175
10.1.4開發(fā)準(zhǔn)備177
10.2數(shù)據(jù)準(zhǔn)備和預(yù)處理177
10.2.1數(shù)據(jù)獲取177
10.2.2獲取裁判文書數(shù)據(jù)178
10.2.3獲取關(guān)鍵字典數(shù)據(jù)179
10.2.4序列標(biāo)注180
10.2.5特征提取182
10.3知識建模和存儲183
10.3.1基于BiLSTM CRF模型的命名實(shí)體識別183
10.3.2實(shí)體關(guān)系抽取186
10.4圖譜可視化和知識應(yīng)用187
10.4.1繪制知識圖譜187
10.4.2知識圖譜展示188
10.4.3知識圖譜應(yīng)用188
10.5小結(jié)和擴(kuò)展189
第11章政府信箱知識服務(wù)190
11.1項(xiàng)目設(shè)計(jì)190
11.1.1需求分析190
11.1.2工作流程191
11.1.3技術(shù)選型192
11.1.4開發(fā)準(zhǔn)備193
11.2數(shù)據(jù)準(zhǔn)備和預(yù)處理194
11.2.1源網(wǎng)站分析195
11.2.2URL信息獲取195
11.2.3信息預(yù)處理196
11.2.4關(guān)系數(shù)據(jù)庫表存儲197
11.3知識建模和存儲198
11.3.1知識表示和建模198
11.3.2知識抽取199
11.3.3圖數(shù)據(jù)庫存儲203
11.4圖譜可視化和知識應(yīng)用204
11.4.1民生關(guān)注點(diǎn)詞云204
11.4.2政府信箱智能問答206
11.5小結(jié)和擴(kuò)展210
第12章新聞推薦系統(tǒng)211
12.1項(xiàng)目設(shè)計(jì)211
12.1.1需求分析211
12.1.2工作流程211
12.1.3技術(shù)選型212
12.1.4開發(fā)準(zhǔn)備212
12.2知識圖譜構(gòu)建213
12.2.1數(shù)據(jù)準(zhǔn)備213
12.2.2數(shù)據(jù)處理213
12.2.3知識圖譜構(gòu)建214
12.3推薦模型構(gòu)建216
12.3.1數(shù)據(jù)集生成216
12.3.2模型訓(xùn)練217
12.3.3模型訓(xùn)練總結(jié)220
12.4可視化應(yīng)用220
12.4.1框架搭建220
12.4.2用戶行為收集221
12.4.3實(shí)時(shí)新聞數(shù)據(jù)更新222
12.4.4個(gè)性化推薦224
12.5小結(jié)和擴(kuò)展227