SQL Server 2017 數(shù)據庫分析處理技術
定 價:69 元
叢書名:數(shù)據科學與大數(shù)據技術系列
- 作者:張延松
- 出版時間:2019/8/1
- ISBN:9787121372780
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP311.138
- 頁碼:376
- 紙張:
- 版次:01
- 開本:16開
本書內容主要分為三部分:第1部分導論,介紹SQL Server 2017的安裝及配置方法、數(shù)據導入方法和工具,并且通過數(shù)據可視化技術介紹數(shù)據分析處理技術的基本需求、數(shù)據模型及實現(xiàn)方法;第2部分數(shù)據庫基礎知識與SQL實踐,介紹關系數(shù)據庫基礎理論、數(shù)據庫基礎實現(xiàn)技術、SQL命令及查詢實現(xiàn)技術、數(shù)據庫實現(xiàn)新技術等相關知識;第3部分數(shù)據倉庫和OLAP基礎,介紹數(shù)據倉庫的基本概念及相關理論、OLAP的基本概念及相關操作、基于企業(yè)Benchmark的OLAP實踐案例。 本書采用面向數(shù)據完整生命周期的貫穿式案例教學方法,以數(shù)據的采集、加載、管理、處理、分析、優(yōu)化、數(shù)據可視化、多維展示、數(shù)據挖掘等從起點到終點的案例式處理過程,介紹數(shù)據分析處理全生命周期中相關的技術,使讀者掌握全面的數(shù)據庫分析處理技術,增強讀者獨立解決實際問題的能力。
張延松,男,博士,副教授,2010年在中國人民大學獲得計算機應用工學博士學位,2010年進入中國人民大學應用經濟學博士后流動站從事博士后研究工作。2012年進入中國人民大學信息學院任教,并在中國人民大學中國調查與數(shù)據中心任職,主要研究方向為大數(shù)據分析技術,內存數(shù)據庫,數(shù)據倉庫等,在相關研究領域的國內、國外學術會議及期刊已發(fā)表論文20余篇,申請多項國內、國外發(fā)明專利,在內存數(shù)據庫和新硬件數(shù)據庫方向已獲得12項國內發(fā)明專利、4項美國PCT發(fā)明專利授權。2016年獲得教育部科技進步一等獎(4/7),2015年獲得中國計算機學會科技進步獎一等獎(7/10),2017年獲得北京市第十四屆哲學社會科學優(yōu)秀成果獎二等獎。
第1部分 導 論
第1章 初識SQL Server 2017 2
1.1 SQL Server 2017在Windows平臺的安裝與配置 2
1.2 SQL Server 2017在Linux平臺的安裝與配置 7
1.3 SQL Server數(shù)據庫數(shù)據導入和導出 14
1.3.1 從Access文件向SQL Server導入數(shù)據 15
1.3.2 通過BULK INSERT命令導入平面數(shù)據文件 17
1.3.3 通過數(shù)據導入和導出向導導入平面數(shù)據文件 22
1.4 使用Integration Services導入數(shù)據 29
小結 39
第2章 數(shù)據分析與數(shù)據庫的初步認識 40
2.1 Excel數(shù)據分析工具 40
2.1.1 Excel表單數(shù)據操作 40
2.1.2 Power Pivot for Excel 41
2.1.3 Power Map 45
2.2 Power BI Desktop數(shù)據分析工具 46
2.2.1 數(shù)據管理 46
2.2.2 數(shù)據分析與可視化報表 50
2.2.3 數(shù)據發(fā)布與訪問 53
2.3 Tableau數(shù)據可視化分析工具 54
2.3.1 數(shù)據連接與管理 55
2.3.2 可視化分析 57
2.3.3 創(chuàng)建儀表板和故事 62
小結 64
第2部分 數(shù)據庫基礎知識與SQL實踐
第3章 數(shù)據庫基礎知識 66
3.1 數(shù)據庫的基本概念 66
3.1.1 數(shù)據、數(shù)據庫、數(shù)據庫管理系統(tǒng)、數(shù)據庫系統(tǒng) 66
3.1.2 數(shù)據庫系統(tǒng)的特點 69
3.2 關系數(shù)據模型 71
3.2.1 實體?聯(lián)系模型 72
3.2.2 關系 72
3.2.3 關系模式 75
3.2.4 碼 77
3.2.5 規(guī)范化 79
3.2.6 完整性約束 88
3.3 關系操作與關系代數(shù) 95
3.3.1 關系操作 95
3.3.2 關系代數(shù)與關系運算 96
3.4 數(shù)據庫系統(tǒng)結構 105
3.4.1 內模式(Internal Schema) 105
3.4.2 模式(Schema) 108
3.4.3 外模式(External Schema) 109
3.4.4 數(shù)據庫的二級映像與數(shù)據獨立性 109
3.5 數(shù)據庫系統(tǒng)的組成 110
3.5.1 數(shù)據庫硬件平臺 110
3.5.2 數(shù)據庫軟件 112
3.5.3 數(shù)據庫人員 113
小結 114
第4章 關系數(shù)據庫結構化查詢語言SQL 115
4.1 SQL概述 115
4.2 數(shù)據定義SQL 119
4.2.1 模式的定義與刪除 119
4.2.2 表的定義、刪除與修改 121
4.2.3 代表性的索引技術 127
4.2.4 索引的創(chuàng)建與刪除 134
4.3 數(shù)據查詢SQL 136
4.3.1 單表查詢 137
4.3.2 連接查詢 147
4.3.3 嵌套查詢 152
4.3.4 集合查詢 158
4.3.5 基于派生表查詢 161
4.4 數(shù)據更新SQL 162
4.4.1 插入數(shù)據 162
4.4.2 修改數(shù)據 164
4.4.3 刪除數(shù)據 165
4.4.4 事務 165
4.5 視圖的定義和使用 166
4.5.1 定義視圖 166
4.5.2 查詢視圖 168
4.5.3 更新視圖 169
4.6 面向大數(shù)據管理的SQL擴展語法 172
4.6.1 HiveQL 172
4.6.2 JSON數(shù)據管理 175
4.6.3 圖數(shù)據管理 179
小結 183
第5章 數(shù)據庫實現(xiàn)與查詢優(yōu)化技術 185
5.1 數(shù)據庫查詢處理實現(xiàn)技術和查詢優(yōu)化技術的基本原理 185
5.1.1 表存儲結構 185
5.1.2 緩沖區(qū)管理 189
5.1.3 索引查詢優(yōu)化技術 190
5.1.4 基于代價模型的查詢優(yōu)化 196
5.2 內存查詢優(yōu)化技術 201
5.2.1 內存表 202
5.2.2 列存儲索引 205
5.3 查詢優(yōu)化案例分析 209
5.4 代表性的關系數(shù)據庫 226
小結 232
第3部分 數(shù)據倉庫和OLAP基礎
第6章 數(shù)據倉庫和OLAP 236
6.1 數(shù)據倉庫 236
6.1.1 數(shù)據倉庫的概念 236
6.1.2 數(shù)據倉庫的特征 237
6.1.3 數(shù)據倉庫的體系結構 238
6.1.4 數(shù)據倉庫的實現(xiàn)技術 241
6.2 OLAP聯(lián)機分析處理 249
6.2.1 多維數(shù)據模型 250
6.2.2 OLAP操作 251
6.2.3 OLAP實現(xiàn)技術 255
6.2.4 OLAP存儲模型設計 256
6.3 數(shù)據倉庫案例分析 264
6.3.1 TPC-H 265
6.3.2 SSB 274
6.3.3 TPC-DS 276
小結 287
第7章 OLAP實踐案例 288
7.1 基于SSB數(shù)據庫的OLAP案例實踐 288
7.1.1 SSB數(shù)據集分析 288
7.1.2 創(chuàng)建Analysis Services數(shù)據源 292
7.1.3 創(chuàng)建數(shù)據源視圖 295
7.1.4 創(chuàng)建多維數(shù)據集 297
7.1.5 創(chuàng)建維度 301
7.1.6 多維分析 307
7.1.7 通過Excel數(shù)據透視表查看多維數(shù)據集 308
7.2 基于FoodMart數(shù)據庫的OLAP案例實踐 311
7.3 基于TPC-H數(shù)據庫的OLAP案例實踐 326
7.4 SQL Server 2017內置統(tǒng)計功能 338
7.4.1 系統(tǒng)安裝配置 338
7.4.2 SQL Server 2017 R腳本執(zhí)行案例 340
7.4.3 SQL Server 2017 R腳本執(zhí)行與Analysis Services中統(tǒng)計功能 342
7.4.4 Analysis Services中常見的數(shù)據挖掘功能 351
7.4.5 SQL Server 2017 Python腳本執(zhí)行 361
小結 364
參考文獻 365