本書分為8 章,內容包括時間序列分析的基礎知識、時間序列預測的常用方法,以及神經網絡在時間序列預測中的應用;時間序列異常檢測算法的技術與框架,如何識別異常的時間點及多種異常檢測方法;時間序列的相似性度量方法、聚類算法;多維時間序列在廣告分析和業(yè)務運維領域的應用,利用OLAP 技術對多維時間序列進行有效處理,通過根因分析技術獲得導致故障的維度和元素;智能運維領域(AIOps)和金融領域的兩個應用場景。
張戎,新加坡國立大學數學博士,深圳孔雀計劃高層次人才,數學和機器學習領域科普作家,數學、科研和深度學習等話題的優(yōu)秀自媒體工作者, 曾多次擔任行業(yè)技術大會講師。博士期間從事動力系統(tǒng)的研究工作,博士論文中解決了非正則吸引子的存在性問題。畢業(yè)之后在工業(yè)界從事人工智能的研發(fā)工作,涉及業(yè)務包括推薦系統(tǒng)、安全大數據和智能運維等內容。羅齊,碩士畢業(yè)于香港中文大學(深圳),現(xiàn)就職于某互聯(lián)網公司,從事算法應用研究工作,研究方向為游戲數據挖掘和智能運維,曾參與多款熱門游戲的數據挖掘和智能運維工作。
第1 章時間序列概述 1
1.1 發(fā)展歷程 1
1.2 應用現(xiàn)狀 3
1.3 時間序列分類4
1.3.1 單維時間序列4
1.3.2 多維時間序列6
1.4 小結 8
第2 章時間序列的信息提取 9
2.1 特征工程的入門知識9
2.1.1 特征工程簡介9
2.1.2 數值型特征 12
2.1.3 類別型特征 17
2.1.4 交叉特征 17
2.2 時間序列的預處理 18
2.2.1 時間序列的缺失值 18
2.2.2 時間序列的縮放 20
2.3 時間序列的特征工程24
2.4 時間序列的統(tǒng)計特征28
2.5 時間序列的熵特征 32
2.6 時間序列的降維特征38
2.6.1 分段聚合逼近38
2.6.2 分段線性逼近39
2.6.3 分段常數逼近41
2.6.4 符號逼近 42
2.6.5 最大三角形三桶算法43
2.6.6 用神經網絡自動生成特征的算法 44
2.7 時間序列的單調性 53
2.7.1 線性擬合方法54
2.7.2 控制圖方法 55
2.7.3 均線方法 60
2.8 小結 63
第3 章時間序列預測 64
3.1 時間序列預測的統(tǒng)計方法 65
3.1.1 自回歸差分移動平均模型 65
3.1.2 指數平滑方法72
3.1.3 Prophet 75
3.2 時間序列預測的深度學習方法 83
3.2.1 循環(huán)神經網絡83
3.2.2 長短期記憶網絡 85
3.2.3 Transformer 90
3.2.4 Informer96
3.3 小結·100
第4 章時間序列異常檢測 101
4.1 異常類型及檢測方法分類 101
4.2 基于概率密度的方法 104
4.2.1 核密度估計原理 104
4.2.2 核密度估計方法 106
4.3 基于重構的方法 111
4.3.1 變分自編碼器 111
4.3.2 Donut 115
4.4 基于距離的方法 117
4.4.1 孤立森林 118
4.4.2 RRCF 121
4.5 基于有監(jiān)督的方法 125
4.6 基于弱監(jiān)督的方法 127
4.7 小結 129
第5 章時間序列的相似度與聚類 130
5.1 相似度函數 130
5.1.1 經典的相似度函數 131
5.1.2 基于分段聚合逼近的相似度函數 134
5.1.3 基于時間序列平滑的相似度函數 135
5.1.4 基于神經網絡的相似度算法 136
5.2 距離函數 137
5.2.1 歐氏距離 138
5.2.2 DTW 算法139
5.2.3 基于相似性的距離 140
5.2.4 基于符號特征的距離 141
5.2.5 基于自相關性的距離 142
5.2.6 基于周期性的距離 143
5.2.7 基于模型的距離 144
5.3 基于特征工程的聚類算法 145
5.4 基于距離和相似度的聚類算法 149
5.5 流式聚類算法 151
5.6 小結 154
第6 章多維時間序列 155
6.1 多維時間序列簡介155
6.2 單維時間序列與多維時間序列 156
6.2.1 廣告分析領域 156
6.2.2 業(yè)務運維領域 157
6.3 單維時間序列監(jiān)控系統(tǒng)和多維時間序列監(jiān)控系統(tǒng)的對比 159
6.4 根因分析 160
6.4.1 根因分析的基礎概念 160
6.4.2 人工執(zhí)行根因分析的難度 163
6.4.3 OLAP 技術和方法 164
6.5 基于時間序列異常檢測算法的根因分析 165
6.5.1 時間序列異常檢測 165
6.5.2 根因分析的列表結構 170
6.5.3 根因分析的樹狀結構 172
6.6 基于熵的根因分析 173
6.6.1 熵的概念和性質 173
6.6.2 概率之間的距離 174
6.6.3 基于熵的根因分析方法 177
6.7 基于樹模型的根因分析 187
6.7.1 特征工程和樣本 187
6.7.2 決策樹算法 187
6.8 規(guī)則學習 188
6.8.1 根因分析的列表結構 188
6.8.2 根因分析的樹狀結構 189
6.8.3 列表結構與樹狀結構的對比 191
6.8.4 規(guī)則的排序 192
6.9 小結 193
第7 章智能運維的應用場景 194
7.1 智能運維 194
7.1.1 智能運維的主要方向 195
7.1.2 智能運維的實施路徑 196
7.2 指標監(jiān)控 197
7.2.1 硬件監(jiān)控與軟件監(jiān)控 198
7.2.2 業(yè)務監(jiān)控 198
7.2.3 節(jié)假日效應 201
7.2.4 持續(xù)異常的情況 205
7.2.5 存在基線的情況 205
7.2.6 尋找基線的方法 206
7.3 容量預估和彈性伸縮 208
7.3.1 容量預估 208
7.3.2 彈性伸縮 209
7.4 告警系統(tǒng) 210
7.4.1 告警系統(tǒng)的定義與評估指標 210
7.4.2 告警關聯(lián)與收斂 212
7.4.3 基于相似性或聚類算法的告警關聯(lián)與收斂 214
7.4.4 基于告警屬性泛化層次的告警關聯(lián)與收斂 219
7.4.5 基于根因分析的告警關聯(lián)與收斂 224
7.5 小結 226
第8 章金融領域的應用場景 228
8.1 量化交易概述 229
8.1.1 數據230
8.1.2 因子 230
8.1.3 回測 231
8.2 因子特征工程 231
8.3 資產定價 234
8.4 資產配置 241
8.5 波動率預測 243
8.6 小結 245
參考文獻 246
Ren (2024/7/28 23:57:00):想要一份電子版pdf以用于學習