互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、病毒營銷等事物已經(jīng)為大眾所熟知,網(wǎng)絡(luò)充斥著我們?nèi)粘I畹母鱾方面。在這樣的背景下,網(wǎng)絡(luò)分析成為了定量科學(xué)發(fā)展快的領(lǐng)域之一,其起源可以追溯至20世紀(jì)30年代的社會網(wǎng)絡(luò)分析以及幾個世紀(jì)前的圖論研究。網(wǎng)絡(luò)研究離不開對數(shù)據(jù)的度量與分析,因此統(tǒng)計方法在網(wǎng)絡(luò)分析中發(fā)揮著重要作用。在網(wǎng)絡(luò)研究的相關(guān)書籍中,《網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計分析:R語言實踐》首次采用了這種統(tǒng)計視角。從基本的數(shù)據(jù)操作和網(wǎng)絡(luò)可視化,到概括網(wǎng)絡(luò)的特征,再到對網(wǎng)絡(luò)數(shù)據(jù)建立模型,《網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計分析:R語言實踐》用豐富的案例說明了如何利用多個R語言擴展包進行各類網(wǎng)絡(luò)分析。R語言擴展包igraph提供了大量用于網(wǎng)絡(luò)分析的功能,書中以其作為主要的工具。
網(wǎng)絡(luò)和網(wǎng)絡(luò)分析無疑是近年來定量科學(xué)進展大的領(lǐng)域之一。雖然作為領(lǐng)域起源的社會網(wǎng)絡(luò)分析可以追溯至20世紀(jì)30年代,圖論研究可以上溯幾個世紀(jì),但“網(wǎng)絡(luò)科學(xué)”領(lǐng)域的迅速崛起與普及只是近10到15年的事情。通過我們熟悉的互聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、病毒營銷等途徑,網(wǎng)絡(luò)已經(jīng)滲透到日常生活的方方面面,而不僅僅是一個研究領(lǐng)域或者一種研究方法了。數(shù)據(jù)的度量與分析是網(wǎng)絡(luò)研究的重要組成部分。因此,在實際應(yīng)用、研究方法以及理論發(fā)展方面,網(wǎng)絡(luò)分析都很需要或簡或繁的各類統(tǒng)計方法。與其他統(tǒng)計學(xué)分支一樣,網(wǎng)絡(luò)分析同時包括描述性和推斷性的統(tǒng)計方法。使用這些方法可以完成與網(wǎng)絡(luò)有關(guān)的各種任務(wù),包括基本的網(wǎng)絡(luò)結(jié)構(gòu)可視化與特征化,對網(wǎng)絡(luò)拓?fù)涞牟蓸印⒔Ec推斷,以及對網(wǎng)絡(luò)上的靜態(tài)和動態(tài)過程進行建模和預(yù)測。
當(dāng)前已經(jīng)有很多可以進行網(wǎng)絡(luò)分析的軟件,橫跨各種平臺、編程語言和使用環(huán)境。毫無疑問,R語言社區(qū)在網(wǎng)絡(luò)數(shù)據(jù)統(tǒng)計分析軟件的開發(fā)上尤其活躍。寫作本書時,已經(jīng)有幾十個具有某些網(wǎng)絡(luò)分析功能的R擴展包了。它們可以共同完成網(wǎng)絡(luò)分析的各類任務(wù):從標(biāo)準(zhǔn)的網(wǎng)絡(luò)數(shù)據(jù)操作、可視化與特征化(如igraph、network和sna擴展包),到網(wǎng)絡(luò)建模(如igraph,eigenmodel、ergm和mixer擴展包),再到對網(wǎng)絡(luò)拓?fù)涞耐茢啵ㄈ鏶lasso和huge擴展包)。除此之外,R的基本擴展包還提供了大量其他的分析工具和函數(shù)。
本書的寫作目的是為網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計分析提供一種使用R語言的、簡單易得的入門課程。因此,本書既不是涉及的各種R擴展包的使用手冊,也不打算介紹所涉及主題的詳盡概念和技術(shù)基礎(chǔ)。相反,我們希望在這兩者之間尋找一個平衡,并且在閱讀體驗的基礎(chǔ)上,采用(希望是。┳詈啙嵉某潭葋斫M織文字。相應(yīng)地,我們預(yù)計本書會被以下人群使用:(1)希望開展網(wǎng)絡(luò)數(shù)據(jù)統(tǒng)計分析的統(tǒng)計學(xué)者,無論是作為研究方向還是與他人合作,且希望繼續(xù)使用R作為分析工具;(2)來自類似定量領(lǐng)域(如計算機科學(xué)、統(tǒng)計物理、經(jīng)濟學(xué)等)的復(fù)雜網(wǎng)絡(luò)研究者,無論對統(tǒng)計是否熟悉,希望較快掌握R語言中的網(wǎng)絡(luò)數(shù)據(jù)統(tǒng)計分析方法;(3)應(yīng)用領(lǐng)域的實踐者,希望涉足與某些特定應(yīng)用相關(guān)的網(wǎng)絡(luò)分析方法。
Eric D. Kolaczyk是波士頓大學(xué)數(shù)學(xué)與統(tǒng)計系的統(tǒng)計學(xué)教授與統(tǒng)計學(xué)項目負(fù)責(zé)人,同時是生物信息學(xué)項目、系統(tǒng)工程方向以及計算神經(jīng)科學(xué)項目的教職人員。他撰寫的以網(wǎng)絡(luò)為主題的著作不僅發(fā)展了統(tǒng)計學(xué)的方法與理論,還涵蓋了探測計算機網(wǎng)絡(luò)上的匿名流量模式,預(yù)測蛋白質(zhì)相互作用網(wǎng)絡(luò)中的生物功能,以及刻畫社會網(wǎng)絡(luò)中行動者群體影響等應(yīng)用性的工作。他是美國統(tǒng)計協(xié)會(American Statistical Association,簡稱ASA)會士,也是電氣和電子工程師協(xié)會(Institute of Electrical and Electronics Engineers,簡稱IEEE)高級會員。
Gabor Cs5rdi是美國哈佛大學(xué)統(tǒng)計系的研究助理,獲匈牙利羅蘭大學(xué)計算機科學(xué)博士學(xué)位。他的研究包括網(wǎng)絡(luò)分析在生物學(xué)與社會科學(xué)中的應(yīng)用,生物信息學(xué)與計算生物學(xué),以及圖論算法等。他于2005年創(chuàng)建了igraph擴展包,此后一直是主要的開發(fā)者之一。
譯者序
前言
作者簡介
第1章 引言
1.1 為什么研究網(wǎng)絡(luò)?
1.2 網(wǎng)絡(luò)分析的類型
1. 2.1.網(wǎng)絡(luò)可視化與特征化
1.2.2 網(wǎng)絡(luò)建模與推斷
1.2.3 網(wǎng)絡(luò)過程
1.3 為什么使用R進行網(wǎng)絡(luò)分析?
1.4 關(guān)于本書
1.5 關(guān)于本書的R語言代碼
第2章 操作網(wǎng)絡(luò)數(shù)據(jù)
2.1 概述
2.2 創(chuàng)建網(wǎng)絡(luò)圖
2.2.1 無向圖和有向圖
2.2.2 圖的表示
2.2.3 圖的操作
2.3 網(wǎng)絡(luò)圖的修飾
2.3.1 節(jié)點、邊和圖的屬性
2.3.2 使用數(shù)據(jù)框
2.4 關(guān)于圖
2.4.1 圖的基本概念
2.4.2 特殊類型的圖
2.5 參考讀物
第3章 網(wǎng)絡(luò)數(shù)據(jù)可視化
3.1 概述
3.2 圖可視化的基本元素
3.3 圖的布局
3.4 修飾圖的布局
3.5 大型網(wǎng)絡(luò)可視化
3.6 使用R之外的可視化工具
3.7 參考讀物
第4章 網(wǎng)絡(luò)圖特征的描述性分析
4.1 概述
4.2 節(jié)點和邊的特征
4.2.1 節(jié)點度
4.2.2 節(jié)點中心性
4.2.3 邊的特征
4.3 網(wǎng)絡(luò)的凝聚性特征
4.3.1 子圖與普查
4.3.2 密度與相對頻率
4.3.3 連通性、割與流
4.4 圖分割
. 4.4.1 層次聚類
4.4.2 譜分割
4.4.3 圖分割的驗證
4.5 同配性與混合
4.6 參考讀物
第5章 網(wǎng)絡(luò)圖的數(shù)學(xué)模型
5.1 概述
5.2 經(jīng)典隨機圖模型
5.3 廣義隨機圖模型
5.4 基于機制的網(wǎng)絡(luò)圖模型
5.4.1 小世界模型
5.4.2 優(yōu)先連接模型
5.5 評估網(wǎng)絡(luò)圖特征的顯著性
5.5.1 評估網(wǎng)絡(luò)社團數(shù)量
5.5.2 評估小世界性
5.6 參考讀物
第6章 網(wǎng)絡(luò)圖的統(tǒng)計模型
6.1 概述
6.2 指數(shù)隨機圖模型
6.2.1 一般形式
6.2.2 模型界定
6.2.3 模型擬合
6.2.4 擬合優(yōu)度
6.3 網(wǎng)絡(luò)塊模型
6.3.1 模型界定
6.3.2 模型擬合
6.3.3 擬合優(yōu)度
6.4 潛變量網(wǎng)絡(luò)模型
6.4.1 一般形式
6.4.2 界定潛變量效應(yīng)
6.4.3 模型擬合
6.4.4 擬合優(yōu)度
6.5 參考讀物
第7章 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)推斷
7.1 概述
7.2 鏈路預(yù)測
7.3 關(guān)聯(lián)網(wǎng)絡(luò)推斷
7.3.1 相關(guān)網(wǎng)絡(luò)
7.3.2 偏相關(guān)網(wǎng)絡(luò)
7.3.3 i畝斯圖模型網(wǎng)絡(luò)
7.4 網(wǎng)絡(luò)的層析拓?fù)浣Y(jié)構(gòu)推斷
7.4.1 約束問題:樹拓?fù)浣Y(jié)構(gòu)
7.4.2 樹拓?fù)浣Y(jié)構(gòu)的層析推斷示例.
7.5 參考讀物
第8章 網(wǎng)絡(luò)圖上的過程建模與預(yù)測
8.1 概述
8.2 最近鄰方法
8.3 馬爾科夫隨機場
8.3.1 一般形式
8.3.2 自邏輯模型
8.3.3 自邏輯模型的推斷與預(yù)測
8.3.4 擬合優(yōu)度
8.4 核方法
8.4.1 設(shè)計圖上的核函數(shù)
8.4.2 圖上的核回歸
8.5 動態(tài)過程的建模與預(yù)測
8.5.1 傳染病過程示例
8.6 參考讀物
第9章 網(wǎng)絡(luò)流數(shù)據(jù)分析
9.1 概述
9.2 網(wǎng)絡(luò)流建模:引力模型
9.2.1 模型界定
9.2.2 引力模型的推斷
9.3 網(wǎng)絡(luò)流的預(yù)測:流量矩陣估計
9.3.1 不適定逆問題
9.3.2 層析引力方法
9.4 參考讀物
第10章 動態(tài)網(wǎng)絡(luò)
10.1 概述
10.2 動態(tài)網(wǎng)絡(luò)的表示與操作
10.3 動態(tài)網(wǎng)絡(luò)的可視化
10.4 動態(tài)網(wǎng)絡(luò)的特征化
10.5 動態(tài)網(wǎng)絡(luò)建模
參考文獻(xiàn)
索引
彩圖節(jié)選