本書主要從自然語言處理的角度全面地介紹情感分析這個主題先進的研究技術(shù)和實用算法,以幫助讀者了解通常用于表達觀點和情感的問題和語言結(jié)構(gòu)的基本結(jié)構(gòu)。它涵蓋了情感分析的所有核心領(lǐng)域,包括許多新興的主題,如辯論分析、意圖挖掘、假民意檢測,并提出了可用來分析和總結(jié)觀點的計算方法。
目 錄
Sentiment Analysis:Mining Opinions,Sentiments,and Emotions
譯者序
前言
致謝
第1章 引言1
1.1 情感分析應(yīng)用3
1.2 情感分析研究6
1.2.1 針對不同文本顆粒度的情感分析研究7
1.2.2 情感詞典及其問題8
1.2.3 辯論與評論分析9
1.2.4 意圖挖掘9
1.2.5 垃圾觀點檢測與評論質(zhì)量10
1.3 情感分析是個迷你自然語言處理任務(wù)11
1.4 本書撰寫方式11
第2章 什么是情感分析13
2.1 觀點定義14
2.1.1 觀點的定義14
2.1.2 情感對象15
2.1.3 觀點中的情感16
2.1.4 簡化的觀點定義17
2.1.5 觀點的理由和限定條件19
2.1.6 情感分析的目標(biāo)和任務(wù)20
2.2 觀點摘要定義23
2.3 感情、情緒與心情24
2.3.1 心理學(xué)中的感情、情緒與心情25
2.3.2 情感分析中的感情、情緒與心情28
2.4 觀點的不同類型30
2.4.1 常規(guī)型觀點和比較型觀點31
2.4.2 主觀的和隱含在事實中的觀點31
2.4.3 第一人稱和非第一人稱觀點34
2.4.4 元觀點35
2.5 作者和讀者視角35
2.6 小結(jié)36
第3章 文檔級情感分類37
3.1 基于監(jiān)督的情感分類38
3.1.1 基于機器學(xué)習(xí)算法的情感分類38
3.1.2 使用自定義打分函數(shù)的情感分類44
3.2 基于無監(jiān)督的情感分類45
3.2.1 使用句法模板和網(wǎng)頁檢索的情感分類45
3.2.2 使用情感詞典的情感分類46
3.3 情感評分預(yù)測48
3.4 跨領(lǐng)域情感分類49
3.5 跨語言情感分類51
3.6 文檔的情緒分類52
3.7 小結(jié)53
第4章 句子級主客觀和情感分類54
4.1 主觀性55
4.2 句子級主客觀分類56
4.3 句子級情感分類59
4.3.1 句子級情感分類的前提假設(shè)59
4.3.2 分類方法60
4.4 處理條件句61
4.5 處理諷刺句62
4.6 跨語言主客觀分類和情感分類64
4.7 在情感分類中使用語篇信息65
4.8 句子級情緒分類66
4.9 討論67
第5章 屬性級情感分類68
5.1 屬性級情感分類方法69
5.1.1 基于監(jiān)督學(xué)習(xí)的方法69
5.1.2 基于詞典的方法70
5.1.3 兩種方法的優(yōu)缺點72
5.2 情感組合規(guī)則73
5.2.1 情感組合規(guī)則概述74
5.2.2 情感減弱和情感增強表達81
5.2.3 SMALL_OR_LESS和LARGE_OR_MORE表達83
5.2.4 情緒和情感強度86
5.2.5 情感詞的含義86
5.2.6 其他方法概述88
5.3 否定和情感89
5.3.1 否定詞89
5.3.2 never92
5.3.3 其他常用的情感轉(zhuǎn)換詞94
5.3.4 否定詞移動現(xiàn)象94
5.3.5 否定范圍95
5.4 情態(tài)和情感96
5.5 并列連詞but100
5.6 非觀點內(nèi)容的情感詞102
5.7 規(guī)則表示103
5.8 詞義消歧和指代消解105
5.9 小結(jié)106
第6章 屬性和實體抽取108
6.1 基于頻率的屬性抽取109
6.2 利用句法關(guān)系110
6.2.1 利用觀點和觀點評價對象間的評價關(guān)系111
6.2.2 利用部分整體和屬性關(guān)系116
6.3 基于監(jiān)督學(xué)習(xí)的屬性抽取118
6.3.1 隱馬爾可夫模型118
6.3.2 條件隨機場119
6.4 隱含屬性的映射121
6.4.1 基于語料庫的方法121
6.4.2 基于詞典的方法122
6.5 屬性聚類124
6.6 基于主題模型的屬性抽取126
6.6.1 隱狄利克雷分配127
6.6.2 基于無監(jiān)督主題模型進行觀點屬性抽取129
6.6.3 在主題模型中加入領(lǐng)域先驗知識133
6.6.4 基于終身學(xué)習(xí)的主題模型:像人類一樣學(xué)習(xí)135
6.6.5 使用短語作為主題詞138
6.7 實體抽取與消解141
6.7.1 實體抽取與消解的問題定義142
6.7.2 實體抽取144
6.7.3 實體鏈接145
6.7.4 實體搜索和鏈接147
6.8 觀點持有者和觀點時間抽取147
6.9 小結(jié)148
第7章 情感詞典構(gòu)建149
7.1 基于詞典的方法149
7.2 基于語料庫的方法152
7.2.1 從語料庫中識別情感詞152
7.2.2 處理上下文相關(guān)的情感詞153
7.2.3 詞典自適應(yīng)155
7.2.4 其他相關(guān)工作156
7.3 隱含了情感信息(期望或者不期望)的事實型描述156
7.4 小結(jié)158
第8章 比較型觀點分析159
8.1 問題定義159
8.2 比較句識別162
8.3 比較句中的優(yōu)選實體集識別163
8.4 特殊類型的比較句164
8.4.1 非標(biāo)準(zhǔn)型比較164
8.4.2 交叉類型的比較166
8.4.3 單實體比較167
8.4.4 帶有compare和comparison的句子168
8.5 實體與屬性抽取169
8.6 小結(jié)170
第9章 觀點摘要和檢索172
9.1 基于屬性的觀點摘要172
9.2 基于屬性的觀點摘要進階175
9.3 可對照的觀點摘要176
9.4 傳統(tǒng)摘要177
9.5 比較型觀點摘要177
9.6 觀點檢索177
9.7 現(xiàn)有觀點檢索技術(shù)178
9.8 小結(jié)180
第10章 辯論與評論分析181
10.1 辯論中的立場識別181
10.2 對辯論、討論進行建模184
10.2.1 JTE模型185
10.2.2 JTE-R模型:對回復(fù)關(guān)系進行建模188
10.2.3 JTE-P模型:考慮作者之間的交互關(guān)