基于语法分析跨语言情感分析

成绩

中国农业大学

(2016-2017学年秋季学期)

课程名称:计算机新技术专题 授课教师:陈瑛 班 级:162班 学 号:SY20163081198 姓 名:任占奇

基于语法分析跨语言情感分析

1.前言

目前,互联网上产生了大量的用户参与的对于人物、事件、产品等有价值的评论信息。这些评论信息表达了人们的各种情感色彩和情感倾向,如喜、怒、哀、乐和批评、赞扬等。基于此,潜在的用户就可以通过浏览这些主观色彩的评论来了解大众舆论对于某一事件或产品的看法。目前,随着文化交流的增加,多语种的评价资源日益普遍,如何进行跨语言情感分析已成为自然语言处理的热点问题。

2.句法分析

句法分析是指根据给定的语法,自动地识别出语句含有的句法单位以及它们之间的关系。句法分析是对自然语言进一步语义分析的基础,已成为大多数自然语言处理应用的关键因素。句法分析大体分为两种途径: 基于规则的方法和基于统计的方法。基于规则的方法是以知识为主体的理想主义方法,采用非歧义的规则形式描述或解释歧义行为或特性。基于统计的句法分析必须以某种方式对语言的形式和语法规则进行描述,通过对已知句法分析结果进行训练获得句法分析模型。以“y dog also likes eating sausage.”为例进行句法分析,得到语法结构如图一所示[1]:

利用句法分析得到的句子主谓部分对于句子的情感贡献大小不同对于情感句的情感的分类有着重要影响。例如,对于例句“肮脏的他做出那么一件感人、伟大、美好的事。”如果单纯考虑该句的情感词的个数,“感人”、“伟大”、“美好”这种积极色彩的词语多于“肮脏”这种消极词语的数量,就会把该句子标记为积极句。如果加入主谓情感贡献度可以看出“肮脏”位于句子的主语部分,而“感人”、“伟大”、“美好”这类积极情感词则位于句子的谓语部分,当主谓赋予不同权重后,该情感句就会有可能标记为消极句,说明主谓语部分对于整个情感句的情感贡献值并不相同,因而利用主谓情感权重的不同对于正确判断情感句的极性具有重要的意义。再例如,情感句“看似这么正直的人居然说出如此狠毒的话。”如果单纯考虑这句话的两个情感词“正直”和“狠毒” 它们分别位于主语和谓语部分,而整个情感句表现出来的是消极情感。经过统计和研究我们发现: 如果单纯考虑情感句的主谓成分的情感,情感句实际上是重心后移的,即谓语部分对于情感句的情感贡献度明显大于主语部分。下图为用计算机处理情感分析的过程[2]:

联系客服:779662525#qq.com(#替换为@) 苏ICP备20003344号-4