本書基于Python 3.10版本,使用Jupyter Notebook進(jìn)行編程;以項(xiàng)目任務(wù)驅(qū)動(dòng)模式,系統(tǒng)地闡述了Python數(shù)據(jù)分析的相關(guān)知識(shí),內(nèi)容包括Python數(shù)據(jù)分析概述、NumPy數(shù)值計(jì)算實(shí)戰(zhàn)、pandas統(tǒng)計(jì)分析實(shí)戰(zhàn)、Matplotlib數(shù)據(jù)可視化實(shí)戰(zhàn)、Python數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理、基于sklearn的數(shù)據(jù)分析實(shí)戰(zhàn)、電商產(chǎn)品評(píng)論數(shù)據(jù)情感分析實(shí)戰(zhàn);通過(guò)多個(gè)實(shí)戰(zhàn)任務(wù)的學(xué)習(xí)與練習(xí),讓讀者在短時(shí)間內(nèi)掌握Python數(shù)據(jù)分析的技術(shù)和方法。為了方便讀者學(xué)習(xí),本書附有配套源代碼、教學(xué)PPT、題庫(kù)、教學(xué)視頻、教學(xué)設(shè)計(jì)等資源。本書可作為高職院校人工智能、大數(shù)據(jù)相關(guān)專業(yè)數(shù)據(jù)分析課程的教材,也可作為從事數(shù)據(jù)分析工作的相關(guān)人員的參考用書。
蘆婭云,女,中共黨員,碩士,講師,工程師,“雙師”型教師, 曾獲高教創(chuàng)新教學(xué)論文一等獎(jiǎng),湖北省信息化教學(xué)設(shè)計(jì)大賽二等獎(jiǎng),全國(guó)微課大賽三等獎(jiǎng),廣東職協(xié)論文二等獎(jiǎng)。參與省級(jí)科研成果獎(jiǎng)項(xiàng)2項(xiàng)、獲個(gè)人軟著專利5項(xiàng)、公開(kāi)發(fā)表省級(jí)國(guó)家級(jí)期刊論文10余篇、作為主要編著人參與編寫教材4本,其中,與騰訊公司合作主編教材《微信小程序開(kāi)發(fā)》被評(píng)為廣東省省級(jí)精品課程。
項(xiàng)目1 Python數(shù)據(jù)分析概述 1
任務(wù)1.1 認(rèn)識(shí)數(shù)據(jù)分析 2
任務(wù)1.2 搭建Anaconda環(huán)境 6
任務(wù)1.3 基于Jupyter Notebook創(chuàng)建餐飲訂單數(shù)據(jù)分析項(xiàng)目 12
項(xiàng)目2 NumPy數(shù)值計(jì)算實(shí)戰(zhàn) 15
任務(wù)2.1 數(shù)據(jù)的讀取與顯示 16
任務(wù)2.2 利用NumPy進(jìn)行統(tǒng)計(jì)分析 18
項(xiàng)目3 pandas統(tǒng)計(jì)分析實(shí)戰(zhàn) 23
任務(wù)3.1 從CSV文件中讀取餐飲訂單數(shù)據(jù) 24
任務(wù)3.2 創(chuàng)建餐飲訂單數(shù)據(jù)的DataFrame 30
任務(wù)3.3 利用行列索引查看餐飲訂單數(shù)據(jù)的子集 34
任務(wù)3.4 生成餐飲訂單數(shù)據(jù)的銷售額 36
任務(wù)3.5 按給定的時(shí)間周期統(tǒng)計(jì)菜品或餐飲店的銷售額 38
任務(wù)3.6 按菜品拆分銷售額數(shù)據(jù) 43
項(xiàng)目4 Matplotlib數(shù)據(jù)可視化實(shí)戰(zhàn) 50
任務(wù)4.1 基于pyplot()函數(shù)繪制圖表和圖像 51
任務(wù)4.2 繪制餐飲訂單數(shù)據(jù)中日銷售額的散點(diǎn)圖 52
任務(wù)4.3 繪制餐飲訂單數(shù)據(jù)中某家餐飲店月銷售額的折線圖 54
任務(wù)4.4 繪制餐飲訂單數(shù)據(jù)中各家餐飲店月銷售額的直方圖 57
任務(wù)4.5 繪制餐飲訂單數(shù)據(jù)中各家餐飲店月銷售額的餅圖 59
任務(wù)4.6 繪制餐飲訂單數(shù)據(jù)中月銷售數(shù)量前五的銷售額的箱形圖 61
項(xiàng)目5 Python數(shù)據(jù)探索 64
任務(wù)5.1 餐飲訂單數(shù)據(jù)的缺失值分析 65
任務(wù)5.2 餐飲訂單數(shù)據(jù)的異常值分析 68
任務(wù)5.3 餐飲訂單數(shù)據(jù)的分布分析 69
任務(wù)5.4 餐飲訂單數(shù)據(jù)的周期性分析 72
任務(wù)5.5 餐飲訂單數(shù)據(jù)的相關(guān)性分析 74
任務(wù)5.6 餐飲訂單數(shù)據(jù)的貢獻(xiàn)度分析 75
任務(wù)5.7 餐飲訂單數(shù)據(jù)的統(tǒng)計(jì)量分析 77
項(xiàng)目6 數(shù)據(jù)預(yù)處理 79
任務(wù)6.1 清洗餐飲訂單數(shù)據(jù) 80
任務(wù)6.2 集成餐飲訂單數(shù)據(jù) 84
任務(wù)6.3 規(guī)約餐飲訂單數(shù)據(jù) 85
任務(wù)6.4 轉(zhuǎn)換餐飲訂單數(shù)據(jù) 87
任務(wù)6.5 分組與聚合餐飲訂單數(shù)據(jù) 89
項(xiàng)目7 基于sklearn的數(shù)據(jù)分析實(shí)戰(zhàn) 93
任務(wù)7.1 預(yù)處理廣州珠江水道水質(zhì)化驗(yàn)數(shù)據(jù) 94
任務(wù)7.2 劃分廣州珠江水道水質(zhì)化驗(yàn)數(shù)據(jù)的訓(xùn)練集與測(cè)試集 99
任務(wù)7.3 構(gòu)建與評(píng)價(jià)廣州珠江水道總氮濃度的回歸模型 101
任務(wù)7.4 構(gòu)建廣州珠江水道水質(zhì)類別的決策樹模型 103
任務(wù)7.5 基于餐飲訂單數(shù)據(jù)的銷售額預(yù)測(cè)分析 105
任務(wù)7.6 基于餐飲訂單數(shù)據(jù)的菜品關(guān)聯(lián)分析 110
任務(wù)7.7 基于iris數(shù)據(jù)集的鳶尾花聚類分析 115
項(xiàng)目8 電商產(chǎn)品評(píng)論數(shù)據(jù)情感分析實(shí)戰(zhàn) 120
任務(wù)8.1 電商產(chǎn)品評(píng)論數(shù)據(jù)的分詞處理 121
任務(wù)8.2 電商產(chǎn)品評(píng)論數(shù)據(jù)的詞性標(biāo)注 124
任務(wù)8.3 電商產(chǎn)品評(píng)論數(shù)據(jù)的停用詞去除 127
任務(wù)8.4 電商產(chǎn)品評(píng)論數(shù)據(jù)的文本分類 132
任務(wù)8.5 電商產(chǎn)品評(píng)論數(shù)據(jù)的文本相似度計(jì)算 138
任務(wù)8.6 電商產(chǎn)品評(píng)論數(shù)據(jù)的文本情感分析 142