與本書第1版相比,ggplot2發(fā)生了諸多改造和升級,與之相應(yīng)地,Hadley Wickham對本書也進(jìn)行了更新?lián)Q代。ggplot2是R的一個數(shù)據(jù)可視化包,它能幫助用戶輕松地繪制各類圖像,包括多圖層復(fù)合圖像。ggplot2可以幫助你:
l 使用不同數(shù)據(jù)源疊加多個圖層(點、線、地圖、瓦片圖、箱線圖等),且圖層間具有自動調(diào)節(jié)的統(tǒng)一尺度。
l 添加指定平滑器,通過R卓越的建模性能,擬合線性模型、穩(wěn)健回歸、局部加權(quán)模型、廣義可加模型等。
l 存儲各類ggplot2圖像(或其中一部分),以便進(jìn)一步調(diào)整處理。
l 創(chuàng)建自定義圖像主題,滿足各類機(jī)構(gòu)或期刊對圖片的要求,以輕松地應(yīng)用到多個圖像中。
l 從視覺角度處理圖像,有助于探索如何更好地展現(xiàn)數(shù)據(jù)的各個部分。
對于每一個糾結(jié)于如何有效生動地展示數(shù)據(jù)的人,這本書是一盞指路明燈。當(dāng)然,為了學(xué)習(xí)本書,R的基本知識仍是必要的(比如如何將數(shù)據(jù)導(dǎo)入R)。ggplot2是一種專門用于制作圖像的迷你語言,本書介紹了有關(guān)它的一切。通過閱讀本書,你將能夠輕而易舉地繪制各類圖像解決問題,也能更好地把原本停留在你腦海中的圖像投射到屏幕或頁面上。
本書相對舊版的改動:
l 更新本書以適應(yīng)新的ggplot2 2.1.0,包括主題系統(tǒng)的主要更新。
l 介紹新添加的標(biāo)度、統(tǒng)計變換和幾何圖像。
l 添加更多實戰(zhàn)演練。
l 修訂全書簡介,更多關(guān)注ggplot函數(shù)而非qplot函數(shù)。
l 更新數(shù)據(jù)建模章節(jié),主要使用的R包有tidyr、dplyr和broom。
ggplot2 的發(fā)展
近五年來,數(shù)據(jù)科學(xué)變得舉足輕重,其中數(shù)據(jù)可視化的流程不可或缺。數(shù)據(jù)可視化為人類提供了對數(shù)據(jù)的直觀理解與感受。各類軟件中,R 由于它和統(tǒng)計學(xué)的淵源、開源、易用性而受到數(shù)據(jù)科學(xué)家的青睞,ggplot2 包更是數(shù)據(jù)可視化中必不可少的神兵利器。
在軟件更新?lián)Q代極快的時代,ggplot2 用它長久的生命力、龐大的使用量證實了其設(shè)計之優(yōu)良,F(xiàn)在,ggplot2 在RStudio CRAN 鏡像的每月下載量達(dá)到了驚人的45 萬!下圖展示了下載量的變化;當(dāng)然,是用ggplot2 繪制的。
本書的變化
本書英文第1 版出版于2009 年,第2 版面世于2016 年。因為英文第2 版相對于第1 版有了重大變化,所以中文版也需要大量的相應(yīng)修訂。例如,工具箱和標(biāo)度兩章有大幅更新內(nèi)容,數(shù)據(jù)分析則拆分成全新的3 章。讀者查閱這些章節(jié)的時候,實際上同步享受著這幾年內(nèi)軟件工具的變動和數(shù)據(jù)分析思維的進(jìn)步。
此外,翻譯第1 版的時候,由于0.9.* 的版本API 變動頻繁,譯者作了大量修正。而現(xiàn)在ggplot2 已經(jīng)到了穩(wěn)定的2.2.* 版,API 經(jīng)過“千錘百煉”,已經(jīng)趨于穩(wěn)定。因此,讀者閱讀本書的時候,基本不必?fù)?dān)心代碼的兼容問題。而且,最新版的ggplot2 包含了擴(kuò)展機(jī)制,開發(fā)者可以按需自行定義自己的主題、風(fēng)格、內(nèi)容。無論你想繪制什么二維靜態(tài)統(tǒng)計圖形,ggplot2 都值得一試。
還有,現(xiàn)在的英文版和中文版書籍源碼均大量采用了knitr 包的技術(shù),大量圖形都是根據(jù)所標(biāo)記的代碼直接繪制出來。這種方式大量減少了圖形排版錯誤、代碼不兼容等情況,給作者、譯者帶來了很大的便利;可以想象,對讀者閱讀、學(xué)習(xí)書中代碼也大有裨益。
最后,中文版里,為了優(yōu)化排版效果,對部分代碼塊的換行和空行作了微調(diào)(其余內(nèi)容不變);正文的圖片也改為黑白,必須用彩色的繪圖則放到正文后的彩圖附錄中。