本書主要針對數(shù)據(jù)科學、統(tǒng)計學、商學領(lǐng)域的教學,介紹基于Python軟件的數(shù)據(jù)可視化基礎(chǔ)知識、數(shù)據(jù)計算與交互式繪圖,機器學習中的可視化工具和技術(shù),以及特定數(shù)據(jù)結(jié)構(gòu)下的可視化技術(shù),如金融數(shù)據(jù)結(jié)構(gòu)、生物數(shù)據(jù)結(jié)構(gòu)、網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu)中的可視化展示,并配以豐富的案例,緊密結(jié)合常見的統(tǒng)計方法和機器學習方法。本書配有大量實際案例和習題,涉及金融、經(jīng)濟管理、醫(yī)療影像、健康大數(shù)據(jù)、地理數(shù)據(jù)等方面的知識,內(nèi)容翔實,能讓授課教師充分備課,讓學生全面學習,極大地提升學生的動手能力,并與現(xiàn)實生活接軌,讓學生為勝任“全球信息化時代”的數(shù)據(jù)科學工作做好充分準備。
適讀人群 :本書可作為高等院校數(shù)據(jù)科學、統(tǒng)計學、商學等相關(guān)專業(yè)的教材,也可供經(jīng)管領(lǐng)域的技術(shù)人員學習使用,還可作為機器學習和人工智能等領(lǐng)域的研究人員的參考書。
1.一線院校,知名作者
本書主編為上海財經(jīng)大學統(tǒng)計與管理學院院長馮興東教授,馮教授長期從事統(tǒng)計和數(shù)據(jù)科學領(lǐng)域的本科及研究生教學工作,并主講研究生階段的數(shù)據(jù)分析與可視化課程。
2.基于Python,面向多領(lǐng)域教學
本書主要針對數(shù)據(jù)科學、統(tǒng)計學、以及應(yīng)用數(shù)學和醫(yī)學等領(lǐng)域的教學,重在介紹這些領(lǐng)域中的數(shù)據(jù)分析與可視化、探索性數(shù)據(jù)分析等內(nèi)容。
3.案例式教學,理論與實踐相結(jié)合
本書配有大量的實戰(zhàn)案例,涉及金融,經(jīng)濟管理,醫(yī)療影像,健康大數(shù)據(jù)、地理數(shù)據(jù)等,并與常見的統(tǒng)計方法、機器學習方法、統(tǒng)計建模和分析緊密結(jié)合,有助于讀者對知識點的理解與掌握。
馮興東 博士,畢業(yè)于美國伊利諾伊大學香檳分校,上海財經(jīng)大學統(tǒng)計與管理學院院長。研究領(lǐng)域為穩(wěn)健方法、分位數(shù)回歸、強化學習等,在國際重要統(tǒng)計學期刊以及人工智能大會上發(fā)表論文多篇。國際統(tǒng)計學會推選會員,國務(wù)院學位委員會第八屆學科評議組成員,全國應(yīng)用統(tǒng)計專業(yè)學位研究生教育指導委員會委員,全國工業(yè)統(tǒng)計學教學研究會副會長,中國數(shù)學會概率統(tǒng)計分會常務(wù)理事;國際統(tǒng)計學期刊Annals of Applied Statistics,Statistica Sinica以及國內(nèi)統(tǒng)計學期刊《統(tǒng)計研究》編委。
劉鑫 博士,畢業(yè)于加拿大西安大略大學,上海財經(jīng)大學應(yīng)用統(tǒng)計專業(yè)碩士項目中心主任、講席副教授、博士生導師。研究領(lǐng)域包括復雜數(shù)據(jù)建模、機器學習理論與應(yīng)用、數(shù)據(jù)分析與可視化等,在國際重要統(tǒng)計學期刊以及人工智能大會上發(fā)表論文近二十篇。上海市浦江人才計劃獲得者,上海市特邀檢察官助理,主持國家自然科學基金青年項目;任國際統(tǒng)計學期刊Annals of Applied Statistics,Journal of Multivariate Analysis,Statistica Sinica等匿名審稿人。
第 1章數(shù)據(jù)可視化概述1
1.1理解數(shù)據(jù)、信息和知識1
1.1.1數(shù)據(jù)和信息2
1.1.2知識2
1.2知識的提取流程3
1.2.1從數(shù)據(jù)中提取信息3
1.2.2從信息中提取知識4
1.3數(shù)據(jù)可視化與統(tǒng)計圖表4
1.4如何利用可視化幫助決策5
1.5總結(jié)5
本章習題6
第 2章數(shù)據(jù)可視化7
2.1利用數(shù)據(jù)可視化創(chuàng)造有趣的故事7
2.2可視化的一些實踐結(jié)果9
2.3Python中的可視化工具15
2.4交互式可視化和布局17
2.5總結(jié)19
本章習題20
第3章常見Python IDE 21
3.1Python IDE21
3.1.1Python 3.x與Python 2.722
3.1.2不同類型的交互式工具22
3.1.3不同類型的Python IDE24
3.2利用Anaconda進行可視化33
3.2.1繪制3D曲面圖33
3.2.2繪制方形樹狀圖35
3.3交互式可視化的庫39
3.3.1bokeh39
3.3.2VisPy39
3.4總結(jié)41
本章習題41
第4章數(shù)值計算與交互式繪圖43
4.1NumPy、SciPy和MKL函數(shù)43
4.1.1NumPy介紹44
4.1.2SciPy介紹49
4.1.3 MKL函數(shù)介紹55
4.2標量選擇、切片與索引55
4.2.1標量選擇55
4.2.2切片56
4.2.3數(shù)組索引57
4.3數(shù)據(jù)結(jié)構(gòu)59
4.3.1堆棧59
4.3.2元組60
4.3.3集合61
4.3.4隊列62
4.3.5字典63
4.3.6矩陣表示的字典64
4.3.7字典樹69
4.4使用matplotlib進行可視化71
4.5總結(jié)78
本章習題79
第5章統(tǒng)計學與機器學習80
5.1分類方法81
5.1.1線性回歸模型實例82
5.1.2線性回歸模型84
5.1.3決策樹87
5.1.4貝葉斯定理91
5.1.5樸素貝葉斯分類器92
5.2KNN算法93
5.3邏輯回歸97
5.4支持向量機101
5.5主成分分析103
5.6k-means聚類107
5.7總結(jié)110
本章習題110
第6章金融和統(tǒng)計模型112
6.1回報率模型和確定性模型112
6.2隨機模型120
6.2.1蒙特卡羅模擬120
6.2.2投資組合估值136
6.2.3模擬模型139
6.2.4幾何布朗運動模擬139
6.2.5基于擴散的模擬142
6.3閾值模型145
6.4總結(jié)148
本章習題148
第7章圖結(jié)構(gòu)數(shù)據(jù)和網(wǎng)絡(luò)模型150
7.1有向圖和多重圖150
7.1.1存儲圖數(shù)據(jù)151
7.1.2圖形展示153
7.2圖的聚集系數(shù)160
7.3社交網(wǎng)絡(luò)分析163
7.4可平面圖的檢驗165
7.5有向無環(huán)圖的檢驗167
7.6最大流169
7.7隨機塊模型170
7.8總結(jié)173
本章習題174
第8章高級可視化176
8.1文本數(shù)據(jù)可視化176
8.1.1利用TextBlob構(gòu)造樸素貝葉斯分類器176
8.1.2利用詞云了解電影影評181
8.2空間數(shù)據(jù)可視化183
8.3計算機模擬185
8.3.1Python隨機相關(guān)的程序包185
8.3.2SciPy中的隨機函數(shù)186
8.3.3模擬示例187
8.3.4信號處理190
8.3.5動畫193
8.4繪制交互圖194
8.5總結(jié)198
本章習題199
參考文獻200