內(nèi)容簡介
本書基于Python講解了信用風險管理和評分卡建模,用漫畫的風格,從風險業(yè)務(wù)、統(tǒng)計分析方法、機器學習模型3個維度展開,詳細講解了信用風險量化相關(guān)的數(shù)據(jù)分析與建模手段,并提供大量的應(yīng)用實例。作者在多加知名金融公司從事算法研究多年,經(jīng)驗豐富,本書得到了學術(shù)界和企業(yè)界多位金融風險管理專家的高度評價。
全書一共9章,首先介紹了信用風險量化的基礎(chǔ),然后依次講解了信用評分模型開發(fā)過程中的數(shù)據(jù)處理、用戶分群、變量處理、變量衍生、變量篩選、模型訓練、拒絕推斷、模型校準、決策應(yīng)用、模型監(jiān)控、模型重構(gòu)與迭代、模型報告撰寫等內(nèi)容。
所有章節(jié)都由問題、算法、案例三部分組成,針對性和實戰(zhàn)性都非常強。
推薦序
前言
第1章 信用管理基礎(chǔ) /1
1.1 信用與管理 /2
1.2 風控術(shù)語解讀 /3
1.2.1 信貸基礎(chǔ)指標 /4
1.2.2 信貸風險指標 /5
1.3 企業(yè)信貸風控架構(gòu) /7
1.4 本章小結(jié) /10
第2章 評分卡 /11
2.1 評分卡概念 /12
2.1.1 適用客群 /13
2.1.2 用途 /14
2.2 建模流程 /15
2.3 模型設(shè)計 /16
2.3.1 業(yè)務(wù)問題轉(zhuǎn)化 /17
2.3.2 賬齡分析與時間窗口設(shè)計 /17
2.3.3 數(shù)據(jù)集切分 /19
2.3.4 樣本選擇 /20
2.3.5 采樣與加權(quán) /21
2.4 數(shù)據(jù)與變量解讀 /25
2.5 本章小結(jié) /26
第3章 機器學習 /27
3.1 基本概念 /28
3.1.1 空間表征 /29
3.1.2 模型學習 /31
3.1.3 模型評價 /32
3.2 廣義線性模型 /33
3.2.1 多元線性回歸模型 /34
3.2.2 經(jīng)驗風險與結(jié)構(gòu)風險 /35
3.2.3 極大似然估計 /38
3.3 邏輯回歸 /39
3.3.1 sigmoid函數(shù) /40
3.3.2 最大似然估計 /41
3.3.3 多項邏輯回歸學習 /41
3.3.4 標準化 /42
3.4 性能度量 /44
3.4.1 誤差 /45
3.4.2 混淆矩陣與衍生指標 /45
3.4.3 不均衡模型評價 /48
3.4.4 業(yè)務(wù)評價 /52
3.5 上線部署與監(jiān)控 /55
3.5.1 上線部署 /55
3.5.2 前端監(jiān)控 /57
3.5.3 后端監(jiān)控 /59
3.6 迭代與重構(gòu) /61
3.6.1 模型迭代 /61
3.6.2 模型重構(gòu) /62
3.7 輔助模型 /62
3.7.1 XGBoost /63
3.7.2 模型解釋性 /74
3.7.3 因子分解機 /81
3.8 模型合并 /82
3.9 本章小結(jié) /86
第4章 用戶分群 /87
4.1 辛普森悖論 /88
4.2 監(jiān)督分群 /90
4.2.1 決策樹原理 /90
4.2.2 決策樹分群 /92
4.2.3 生成拒絕規(guī)則 /95
4.3 無監(jiān)督分群 /105
4.3.1 GMM原理 /106
4.3.2 GMM分群 /107
4.4 用戶畫像與聚類分析 /108
4.4.1 數(shù)據(jù)分布可視化 /109
4.4.2 K均值聚類 /110
4.4.3 均值漂移聚類 /111
4.4.4 層次聚類 /113
4.4.5 tSNE聚類 /114
4.4.6 DBSCAN聚類 /115
4.4.7 方差分析 /117
4.5 本章小結(jié) /119
第5章 數(shù)據(jù)探索與特征工程 /120
5.1 探索性數(shù)據(jù)分析 /121
5.1.1 連續(xù)型變量 /122
5.1.2 離散型變量 /123
5.1.3 代碼實現(xiàn) /123
5.2 特征生成 /126
5.2.1 特征聚合 /127
5.2.2 特征組合 /145
5.3 特征變換 /147
5.3.1 卡方分箱 /148
5.3.2 聚類分箱 /150
5.3.3 分箱對比 /151
5.3.4 箱的調(diào)整 /154
5.3.5 兩種特殊的調(diào)整方法 /156
5.3.6 WOE映射 /158
5.4 本章小結(jié) /158
第6章 特征篩選與建!/159
6.1 初步篩選 /160
6.1.1 缺失率 /160
6.1.2 信息量 /161
6.1.3 相關(guān)性 /162
6.1.4 代碼實現(xiàn) /163
6.2 逐步回歸 /164
6.2.1 F檢驗 /165
6.2.2 常見逐步回歸策略 /165
6.2.3 檢驗標準 /166
6.2.4 代碼實現(xiàn) /167
6.3 穩(wěn)定性 /167
6.4 負樣本分布圖 /169
6.5 評分卡案例 /171
6.6 本章小結(jié) /189
第7章 拒絕推斷 /190
7.1 偏差產(chǎn)生的原因 /191
7.2 數(shù)據(jù)驗證 /193
7.3 標簽分裂 /193
7.4 數(shù)據(jù)推斷 /195
7.4.1 硬截斷法 /195
7.4.2 模糊展開法 /198
7.4.3 重新加權(quán)法 /199
7.4.4 外推法 /200
7.4.5 迭代再分類法 /202
7.5 本章小結(jié) /204
第8章 模型校準與決策 /205
8.1 模型校準的意義 /206
8.2 校準方法 /207
8.2.1 通用校準 /208
8.2.2 多模型校準 /210
8.2.3 錯誤分配 /214
8.2.4 權(quán)重還原 /215
8.3 決策與應(yīng)用 /215
8.3.1 最優(yōu)評分切分 /216
8.3.2 交換集分析 /216
8.3.3 人工干預(yù) /218
8.4 本章小結(jié) /219
第9章 模型文檔 /220
9.1 模型背景 /221
9.2 模型設(shè)計 /222
9.2.1 模型樣本 /222
9.2.2 壞客戶定義 /222
9.3 數(shù)據(jù)準備 /223
9.3.1 數(shù)據(jù)提取 /223
9.3.2 歷史趨勢聚合 /224
9.3.3 缺失值與極值處理 /224
9.3.4 WOE處理 /225
9.4 變量篩選 /225
9.4.1 根據(jù)IV值進行初篩 /226
9.4.2 逐步回歸分析 /226
9.4.3 模型調(diào)優(yōu) /226
9.5 最終模型 /227
9.5.1 模型變量 /227
9.5.2 模型表現(xiàn) /228
9.5.3 模型分制轉(zhuǎn)換 /228
9.6 表現(xiàn)追蹤 /228
9.7 附件 /229
9.8 本章小結(jié) /231