您的当前位置:首页正文

面向理解的文本情感分析研究

2020-09-24 来源:意榕旅游网
面向理解的文本情感分析研究

面向理解的文本感情剖析研究

陪伴着互联网的飞快发展 , 用户使用网络的方式悄悄转变。用户正在从纯真的信息获取者成为信息的公布者。 这类转变使得大批带有个人感情的信息在网络中流传、发酵、齐集 , 并作用于真切社会。怎样对网络中的感情信息进行剖析和理解是自然语言办理研究的重要

课题 , 同时 , 有关技术也拥有宽泛的应用。 目前感情剖析的有关研究获得了很大进展 , 可是依旧存在一些问题 : 第一、在数据层面 , 关于面向详细语言或领域的标明数据不足 , 常常影响了感情剖析系统的性能。

针对这一问题 , 鉴于迁徙学习的感情剖析方法获得了必定的进展 , 可是有关研究关于数据迁徙过程中的错误积累以及由此惹起的负面迁

移现象缺少深入的研究 , 致使鉴于迁徙学习的感情剖析性能遇到限制。第二、在语义层面 , 目前主流的鉴于表示学习的感情剖析方法常常将感情文本和感情因素作为多个孤立的研究对象 , 缺少一致的计算系统对这些对象之间的潜伏语义关系进行剖析和理解 , 影响细粒度感情剖析性能的同时 , 也阻挡了对文本感情理解的深入。 第三、在认知层面 , 目前的文本感情剖析研究大部分集中在对文本感情表达的剖析 , 但关于怎样发现文本中所包含的感情产生原由缺少系统地研究 , 阻挡了面向理解的感情剖析研究的深入。针对上述三个层面的问题 , 本文主要进行了以下的研究工作 : 在数据层面 , 针对样例迁徙过程中的负面迁徙问题 , 本文提出了一种鉴于高斯散布负面迁徙检测的感情剖析方法。该方法一方面经过鉴于高斯散布的类噪声预计结果对迁徙过程中可

能误选的错误样本进行检测和挑选 , 另一方面利用类噪声预计的结果

1 / 4

面向理解的文本情感分析研究

对目前分类器进行鉴于近似可学习理论的性能预计

, 进而预估目前迁

移周期以后分类器的性能变化趋向 , 以防止负面迁徙的产生。在跨语

言和跨领域感情剖析数据集上的实验结果显示

, 鉴于高斯散布负面迁

, 有效

移检测的方法能够有效地迁徙来自其余语言和领域的标明数据

提升了目口号言和目标领域感情剖析的性能。剖析显示

, 鉴于高斯分 布负面迁徙检测方法性能优于其余典型样例迁徙方法

, 同时该方法可

以保证分类器性能的整体上涨趋向。 对鉴于高斯散布负面迁徙检测方

法的理论剖析显示 , 该方法遇到浓密的数据散布以及数据先验知识要

求的限制。为此 , 本文提出了一种鉴于拉德马赫和散布的类噪声预计

算法。这一算法利用最大熵对噪声的先验散布进行约减

, 并使用拉德

马赫和散布代替高斯散布进行类噪声的预计

, 进而躲避了对浓密数据 散布以及数据先验知识的要求。在此基础上

, 提出了一种鉴于类噪声

预计结果的损失函数修正算法 , 经过理论剖析证了然在训练数据足够 多的前提下该算法的收敛性。 在面向跨语言和跨领域的感情剖析数据

集上的实验结果显示 , 鉴于拉德马赫和散布的负面迁徙检测方法比目

前主流方法性能更加靠谱 , 进一步提升了跨语言和跨领域感情剖析的

正确性与通用性。这一结果也显示在数据层面长进行迁徙学习对提升

文本感情剖析性能的有效性。在语义层面

, 针对现有鉴于表示学习的

感情剖析方法常常将词语语义表示、 感情拥有者语义表示、 感情对象语义表示作为孤立表示任务的不足 , 本文提出了一种面向多源异质信

息的一致语义表示方法。 经过建立鉴于共现统计信息的多源异质网络

对感情词语、感情拥有者、 感情对象之间的潜伏关系进行鉴于网络结

2 / 4

,

面向理解的文本情感分析研究

构的描绘并利用网络节点嵌入进行语义表示。在此基础上 , 联合卷积神经网络 , 将感情词语表示作为输入 , 将感情拥有者与感情对象表示作为网络的外接特点 , 建立了一种鉴于多源异质表示学习的感情剖析方法。在大规模产点评论感情剖析数据集上的实验结果显示 , 该方法能够显然提升感情剖析性能。同时 , 细粒度的样例剖析显示经过这一方法获取的感情词语、 感情拥有者、 感情对象的语义表示拥有优秀的可解说性。在此基础上 , 本文提出了联合多源异质网络表示学习与负面迁徙检测的迁徙学习的感情剖析方法 , 实验结果显示这一方法进一步提升了感情剖析的性能 , 达到了有关数据集上的已知最好性能 , 这一结果表示在数据层面和语义层面研究方法的联合能够有效提升情

感剖析的性能。在认知层面 , 针对现有的研究缺少对感情产生原由的发现和理解研究的不足 , 在感情剖析的基础上 , 本文研究了面向理解的文本感情原由发现方法。 考虑到本研究缺少有关公然标明数据集的现状 , 本文设计建立了文本感情原由标明语料库。 在此基础上 , 本文提出了一种鉴于记忆网络的感情原由抽取方法。 这一方法第一对感情文本、感情类型和感情原由进行文本表示学习 , 将获取的感情有关表示作为记忆网络的输入 , 经过记忆网络建模感情原由与感情文本之间能否存在因果关系 , 实现感情原由文本的抽取。因为记忆网络未考虑上下文信息在词义表达过程中的作用 , 本文进一步提出了一种联合卷积操作的记忆网络注意力建模算法 , 经过上下文对词语的语义修正 , 改

进感情原由文本的抽取。在感情原由标明语料库上的实验结果显示

, ,

鉴于卷积记忆网络的方法明显提升了感情原由发现的正确率。同时

3 / 4

面向理解的文本情感分析研究

对记忆网络注意力信号的样例剖析也显示该方法拥有优秀的可解说

性。在认知层面 , 这一工作有效地推动了面向理解的文本感情剖析研

究。别的 , 本文建立的世界首个公然的感情原由标明语料库也将助于

促使有关研究的发展。

4 / 4

因篇幅问题不能全部显示,请点此查看更多更全内容