本书主要从自然语言处理的角度全面地介绍情感分析这个主题先进的研究技术和实用算法,以帮助读者了解通常用于表达观点和情感的问题和语言结构的基本结构。它涵盖了情感分析的所有核心领域,包括许多新兴的主题,如辩论分析、意图挖掘、假民意检测,并提出了可用来分析和总结观点的计算方法。
目 录
Sentiment Analysis:Mining Opinions,Sentiments,and Emotions
译者序
前言
致谢
第1章 引言1
1.1 情感分析应用3
1.2 情感分析研究6
1.2.1 针对不同文本颗粒度的情感分析研究7
1.2.2 情感词典及其问题8
1.2.3 辩论与评论分析9
1.2.4 意图挖掘9
1.2.5 垃圾观点检测与评论质量10
1.3 情感分析是个迷你自然语言处理任务11
1.4 本书撰写方式11
第2章 什么是情感分析13
2.1 观点定义14
2.1.1 观点的定义14
2.1.2 情感对象15
2.1.3 观点中的情感16
2.1.4 简化的观点定义17
2.1.5 观点的理由和限定条件19
2.1.6 情感分析的目标和任务20
2.2 观点摘要定义23
2.3 感情、情绪与心情24
2.3.1 心理学中的感情、情绪与心情25
2.3.2 情感分析中的感情、情绪与心情28
2.4 观点的不同类型30
2.4.1 常规型观点和比较型观点31
2.4.2 主观的和隐含在事实中的观点31
2.4.3 第一人称和非第一人称观点34
2.4.4 元观点35
2.5 作者和读者视角35
2.6 小结36
第3章 文档级情感分类37
3.1 基于监督的情感分类38
3.1.1 基于机器学习算法的情感分类38
3.1.2 使用自定义打分函数的情感分类44
3.2 基于无监督的情感分类45
3.2.1 使用句法模板和网页检索的情感分类45
3.2.2 使用情感词典的情感分类46
3.3 情感评分预测48
3.4 跨领域情感分类49
3.5 跨语言情感分类51
3.6 文档的情绪分类52
3.7 小结53
第4章 句子级主客观和情感分类54
4.1 主观性55
4.2 句子级主客观分类56
4.3 句子级情感分类59
4.3.1 句子级情感分类的前提假设59
4.3.2 分类方法60
4.4 处理条件句61
4.5 处理讽刺句62
4.6 跨语言主客观分类和情感分类64
4.7 在情感分类中使用语篇信息65
4.8 句子级情绪分类66
4.9 讨论67
第5章 属性级情感分类68
5.1 属性级情感分类方法69
5.1.1 基于监督学习的方法69
5.1.2 基于词典的方法70
5.1.3 两种方法的优缺点72
5.2 情感组合规则73
5.2.1 情感组合规则概述74
5.2.2 情感减弱和情感增强表达81
5.2.3 SMALL_OR_LESS和LARGE_OR_MORE表达83
5.2.4 情绪和情感强度86
5.2.5 情感词的含义86
5.2.6 其他方法概述88
5.3 否定和情感89
5.3.1 否定词89
5.3.2 never92
5.3.3 其他常用的情感转换词94
5.3.4 否定词移动现象94
5.3.5 否定范围95
5.4 情态和情感96
5.5 并列连词but100
5.6 非观点内容的情感词102
5.7 规则表示103
5.8 词义消歧和指代消解105
5.9 小结106
第6章 属性和实体抽取108
6.1 基于频率的属性抽取109
6.2 利用句法关系110
6.2.1 利用观点和观点评价对象间的评价关系111
6.2.2 利用部分整体和属性关系116
6.3 基于监督学习的属性抽取118
6.3.1 隐马尔可夫模型118
6.3.2 条件随机场119
6.4 隐含属性的映射121
6.4.1 基于语料库的方法121
6.4.2 基于词典的方法122
6.5 属性聚类124
6.6 基于主题模型的属性抽取126
6.6.1 隐狄利克雷分配127
6.6.2 基于无监督主题模型进行观点属性抽取129
6.6.3 在主题模型中加入领域先验知识133
6.6.4 基于终身学习的主题模型:像人类一样学习135
6.6.5 使用短语作为主题词138
6.7 实体抽取与消解141
6.7.1 实体抽取与消解的问题定义142
6.7.2 实体抽取144
6.7.3 实体链接145
6.7.4 实体搜索和链接147
6.8 观点持有者和观点时间抽取147
6.9 小结148
第7章 情感词典构建149
7.1 基于词典的方法149
7.2 基于语料库的方法152
7.2.1 从语料库中识别情感词152
7.2.2 处理上下文相关的情感词153
7.2.3 词典自适应155
7.2.4 其他相关工作156
7.3 隐含了情感信息(期望或者不期望)的事实型描述156
7.4 小结158
第8章 比较型观点分析159
8.1 问题定义159
8.2 比较句识别162
8.3 比较句中的优选实体集识别163
8.4 特殊类型的比较句164
8.4.1 非标准型比较164
8.4.2 交叉类型的比较166
8.4.3 单实体比较167
8.4.4 带有compare和comparison的句子168
8.5 实体与属性抽取169
8.6 小结170
第9章 观点摘要和检索172
9.1 基于属性的观点摘要172
9.2 基于属性的观点摘要进阶175
9.3 可对照的观点摘要176
9.4 传统摘要177
9.5 比较型观点摘要177
9.6 观点检索177
9.7 现有观点检索技术178
9.8 小结180
第10章 辩论与评论分析181
10.1 辩论中的立场识别181
10.2 对辩论、讨论进行建模184
10.2.1 JTE模型185
10.2.2 JTE-R模型:对回复关系进行建模188
10.2.3 JTE-P模型:考虑作者之间的交互关