文本情感分析(Sentiment Analysis)是指利用自然语言处理和文本挖掘技术,对带有情感色彩的主观性文本进行分析、处理和抽取的过程
情感的三种成分
主观体验: 个体对不同情感状态的自我感受 外部表现,即表情: 在情感状态发生时身体各部分的动作量化形式。 面部表情:面部肌肉变化组成的模式 姿态表情:身体其他部分的表情动作 语调表情:言语的声调、节奏、速度和音色等方面的变化 生理唤醒: 情感产生的生理反应,是一种生理的激素水平,有不同的反应模式
情感计算的发展历史
统计机器学习 2000年,Petrushin VA提出基于支持向量机的情感识别 2002年,Breazeal C提出基于高斯混合模型的情感识别 2003年,New TL提出基于隐马尔可夫模型的情感识别 深度学习 2013年,Wollmer M提出基于长短时记忆递归神经网络的情感识别 2015年,Chao LL提出基于注意力模型的情感识别
AI3.0之下的范畴观VS维度观
两个层面:情感语义,技术实现
范畴观: 把人类的情感分成基本类别。优点:与自然语言的形容词接轨,方便在普遍共识的情况下定义。 技术实现上,看做成分类任务
【如美国心理学家艾克曼在1972年提出的六种基本情绪:愤怒(anger)、惊讶(surprise)、沮丧(disgust)、快乐(joy)、恐惧(fear)和悲伤(sadness)】 【Google新发布的情绪数据集GoEmotion,包含了58000个人工标注的Reddit评论,并且将情绪分为28个类别,包括12种积极情绪、11种消极情绪、4种模棱两可的情绪类别和1种中立情绪】
维度观: 三个维度在语义上正交,三维空间内的每一个点都能表达情感状态,与范畴观相比能更丰富细致,甚至动态地描述人类的复杂情感。更契合心理学上描述的复杂情感 技术实现上,看做回归任务
PAD三维情感模型是Mehrabian和Russell于1994年提出的维度观测量模型,该模型认为“情绪具有愉悦度、激活度和优势度3个维度,其中P代表愉悦度(Pleasure-displeasure),表示个体情绪状态的正负特性,即情感的积极或消极程度, 喜欢或不喜欢程度, 这个维度体现了情感的本质;A代表激动度(Arousal-nonarousal ),表示个体的神经生理激活水平,警觉性, 与情感状态联系的机体能量的激活程度有关;D代表主客观(Dominance-submissiveness),表示个体对情景和他人的控制状态。对他人和外界环境的控制力和影响力,主要指个体对情感状态的主观控制程度,用以区分情感状态是由个体主观发出的还是受客观环境影响产生的。
范畴观与维度观并不矛盾,可以相互转化。
情感计算应该更侧重外显数据还是内隐数据?
//心理范式:测试者通过某些固定话术的引导,获取被测者的特征信息 大多数情况下,情感的外显和内隐有其统一的一面。 外显数据更容易获取,内隐数据不容易获取但相对来说更精准。伪装外显数据比伪装内隐数据容易的多。
外显与内隐之间的冲突应该如何处理,外显和外显之间的冲突该如何平衡?
AI3.0是一个数据驱动与知识驱动相融合的阶段,数据的偏向性和知识的局限性得到了更好的弥补。冲突不仅存在于被观测者身上,也存在于观测者身上。如观测者更信赖视觉通道的信息还是听觉通道的信息。一方面,可以让机器进行一个黑盒的学习,另一方面可以进行更多更细致的心理学实验,研究人是如何解决这样的冲突问题的。
情感计算应用
实际应用中,情感的个性化问题 个性化与泛化能力之间存在冲突,现有的解决方式,用一些迁移学习的技术,使得一些已经训练好的模型,在面对一些新的个体时,产生比较好的自适应。 情感计算赋能产业界 面部识别:疲劳驾驶 舆情监控 测谎 精神疾病相关检测 在不侵犯用户隐私的情况下,更好的了解用户
|