關于我們
書單推薦
新書推薦
|
Hadoop與Spark入門
本書為一本大數(shù)據(jù)技術的入門書籍,介紹Hadoop大數(shù)據(jù)平臺和Spark大數(shù)據(jù)平臺及相關工具的原理,以及如何進行部署和簡單開發(fā)。
全書包含13章: 第1、2章介紹如何為深入學習Hadoop和Spark做環(huán)境準備,包括VMware虛擬機的創(chuàng)建和CentOS操作系統(tǒng)安裝。第3~6章介紹Hadoop大數(shù)據(jù)平臺的基本原理,包括HDFS、MapReduce計算模型、HBase數(shù)據(jù)庫,以及Hive數(shù)據(jù)倉庫的原理、部署方法和開發(fā)技術。第7~11章介紹Spark大數(shù)據(jù)平臺的基本原理,包括彈性分布式數(shù)據(jù)集、轉換與動作操作、寬依賴與窄依賴、有向無環(huán)圖表達的作業(yè)及其處理過程等,并且介紹了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和開發(fā)技術。最后兩章介紹了Flume(第12章)和Kafka(第13章)兩個工具,F(xiàn)lume用于大量日志的收集和處理,Kafka用于對大量快速到達的數(shù)據(jù)進行及時、可靠、暫時的存儲。 本書適合高等院校高年級本科生以及碩士研究生使用,也可以供非計算機專業(yè)學生及相關領域技術人員參考。
你還可能感興趣
我要評論
|