巧用词语角色:基于目标自适应图的跨目标立场检测

?PaperWeekly 原创 ? 作者|梁斌、傅勇昊

黉舍|哈尔滨工业大年夜学(深圳)

研究偏向|情感分析、立场辨认

摘要

跨目标立场检测(cross-target stance detection)的最大年夜挑衅在于我们须要从有限的已知目标(target)样本中发掘有效的语义信息来对未知的目标进行立场检测。我们发明,因为待猜测样本的目标是未知的,所以很难经由过程常识迁徙或特点共享的办法将已知目标的练习特点迁徙至未知目标的立场进修傍边。并且,不合的词语在针对不合目标表达立场时的感化是不一样的。

基于这一发明,我们摸索了一种新的从立场说话表达出发构建目标自适应的依附关系图办法,该办法可以从已有语估中主动地为不合目标构建立场信息表达关系图,称为目标自适应语用依附图(target-adaptive pragmatics dependency graph, TPDG)。

与以往基于特点共享和常识迁徙的办法不合,TPDG 同时推敲了目标自身特有的立场表达信息和不合目标之间的立场表达接洽。经由过程对目标特有立场表达信息的建模和进修,可以将这些特有信息用于协助有接洽关系的未知目标立场特点进修;此外,经由过程对目标间立场表达接洽的建模和进修,可以有效发掘出源目标和未知目标的立场表达依附关系。

最终经由过程一个多层的交互式图卷积块(interactive GCN blocks)对高低文表示和目标自适应图进行建模和特点进修,获得未知目标的立场检测成果。

论文标题:

Target-adaptive Graph for Cross-target Stance Detection

论文链接:

http://www.hitsz-hlt.com/paper/TPDG-WWW2021.pdf

办法

2.1 义务定义

给定源目标的立场标注数据集 以及未知目标的数据 ,个中 表示源目标数据中的目标, 表示关于该目标的文本描述, 是对应的立场标签。

跨目标立场检测义务是在源目标数据集 上练习模型来猜测未知目标数据集 的立场标签。针对这一义务,我们提出的 TPDG(target-adaptive pragmatics graph)模型框架如图 1 所示:

▲ 图1:目标自适应图收集模型框架

2.2 目标自适应语用依附图

目标自适应语用依附图的构建重要分为语用 权重计算目标自适应语用依附图构建两个步调。

语用权重计算:为了更好建模立场表达的高低文,我们从目标自身出发,发掘词语针对不合目标的语用权重,即词语相对于不合目标的立场表达角色。对于每一个词语 要么针对特定目标表达出特有的立场信息(in-target perspective),要么针对不合目标表达出邻近的立场信息(cross-target perspective)。

本文从这两个角度出发来计算词语的语用权重,即目标内(in-target)语用权重 和目标间(cross-target)语用权重 。词语 的目标内语用权重表达的是该词语和某个目标的接洽关系程度,是以同一个词语对于不合的目标可能会充当不合的角色,即有不一样的语用权重。

另一方面,词语的目标间语用权描述的是词语在所有目标中的通用分布特点,即目标间语用权重越大年夜解释该词语对不合目标的影响程度是类似的,相反假如目标间语用权重越小解释该词语只伴随特定目标才表示出立场信息。

a) 目标内语用权重计算

基于词语在数据集中出现的频率先验统计信息,词语 目标内语用权重 的计算方法如下公式所示:

个中 和 分别为词语 在特定目标和其他目标中出现的次数。和 分别表示词语 在已知样例的不合类别(假设有 favor 和 against 两个类别)中出现的次数。

b) 目标间语用权重计算

个中 为数据集中目标的个数,和 分别为词语 出现最多的数据集次数和起码次数。

经由上面的计算后我们词表中的随便率性一个词语 对于特定目标都有两个语用权重 和 。接下来本文将应用这两种权重来构建目标自适应语用依附图。

目标自适应语用依附图构建:对于每一个输入文本我们须要构建目标自适应语用依附图。即根据目标特有语用权重和目标间语用权重来构造目标内关系图(in-target graph)和目标间关系图(cross-target graph):

个中 D 为给定文本的依存关系矩阵,即:

个中 表示词语 和 在依存关系树中存在依存关系。

2.3 交互式卷积神经收集

对于给定的输入文本向量矩阵 ,本文经由过程一个双向 LSTM(Bi-LSTM)收集可以获得文本的隐蔽表示:

基于文本的隐蔽表示和 in-target graph、cross-target graph,本文应用一个多层交互式图卷积块来交互进修文本的目标内和跨目标立场特点信息,个中,第 l 层图卷积块计算如下:

个中 为上层图卷积的隐蔽输出,为关系图的规范化表示,为关系图的度。对于第一层图收集有:。

实验

我们在 2 个公开的跨目标立场检测数据集(SEM16 和 WT-WT)中的 12 个跨目标立场检测义务中进行实验。实验成果显示我们提出的 TPDG 办法在各个跨目标立场检测义务中的机能都达到了最优。

▲ 表1:SEM16数据集的实验成果

▲ 表2:WT-WT数据集的实验成果

结论

本文针对跨目标立场检测提出一种主动进修词语在立场表达中的角色来构建目标自适应图(TPDG)的办法。该办法经由过程进修词语的目标内和目标之间的语用权重来为高低文构建目标内关系图(in-target graph)和目标间关系图(cross-target graph)。

基于此,本文进一步提出一种多层的交互式图卷积块(interactive GCN blocks)收集来对高低文、目标内关系图、以及目标间关系图进行建模,从而为未知目标主动进修高低文的立场表达信息,获得未知目标的立场检测成果。

实验成果注解,本文提出的目标自适应图办法在不合数据集的跨目标立场检测义务中都取得了最优机能。

关于作者

梁斌,哈尔滨工业大年夜学(深圳)计算机学院博士研究生,重要研究偏向包含情感分析、立场检测、文本发掘。E-mail: bin.liang@stu.hit.edu.cn

更多浏览

# 投 稿 通 道#

让你的论文被更多人看到

若何才能让更多的优质内容以更短路径达到读者群体,缩短读者寻找优质内容的成本呢? 谜底就是:你不熟悉的人。

总有一些你不熟悉的人,知道你想知道的器械。PaperWeekly 或许可以成为一座桥梁,促使不合背景、不合偏向的学者和学术灵感互相碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或小我,在我们的平台上分享各类优质内容,可所以 最新论文解读,也可所以 进修心得技巧干货。我们的目标只有一个,让常识真正流动起来。

?? 来稿标准:

? 稿件确系小我 原创作品,来稿需注明作者小我信息(姓名+黉舍/工作单位+学历/职位+研究偏向)

? 假如文章并非首发,请在投稿时提示并附上所有已宣布链接

? PaperWeekly 默认每篇文章都是首发,均会添加“原创”标记

?? 投稿邮箱:

? 投稿邮箱:hr@paperweekly.site

? 所有文章配图,请零丁在附件中发送

? 请留下即时接洽方法,以便我们在编辑宣布时和作者沟通

??

如今,在 「知乎」也能找到我们了

进入知乎首页搜刮 「PaperWeekly」

关于PaperWeekly

PaperWeekly 是一个推荐、解读、评论辩论、报道人工智能前沿论文成果的学术平台。假如你研究或从事 AI 范畴,迎接在"大众,"号后台点击 「交换群」,小助手将把你带入 PaperWeekly 的交换群里。