《论文阅读》PAGE:一个用于会话情绪原因蕴含基于位置感知的图模型 ICASSP 2023

《论文阅读》PAGE:一个用于会话情绪原因蕴含基于位置感知的图模型 ICASSP 2023

前言

亲身阅读感受分享,细节画图解释,再也不用担心看不懂论文啦~

无抄袭,无复制,纯手工敲击键盘~

今天为大家带来的是《PAGE: A POSITION-AWARE GRAPH-BASED MODEL FOR EMOTION CAUSE ENTAILMENT IN CONVERSATION》


出版: ICASSP

时间:2023

类型:因果情绪蕴含

关键词:位置感知;情绪原因;蕴含;对话系统;图网络

作者:Xiaojie Gu, Renze Lou等

第一作者机构:Department of Computer Science, Hangzhou City University, Hangzhou, China

简介

我们通过举例来讲解作者的思路

A:"Hey, you wanna see a movie tomorrow?"

B:"Sounds like a good plan."

作者在论文中提及,如果将上述语句调换位置,则无法推断出"a good plan"其实就是指的前文提及的"see a movie"事件

因此,作者构建基于相对位置的位置关系,用于感知说话者不同语句之间的依赖关系

任务定义

在对话历史中寻找导致当前语句产生非中性情绪的原因句子

模型构架

主要包含三个模块:

1)带有情绪的语句编码(Utterances Encoding with Emotion)

2)位置感知的图(Position-aware Graph (PaG))

3)因果分类器(Causal Classifier)

Utterances Encoding with Emotion

语句和情绪分别编码,然后两者维度变换到相同维度之后相加,得到 h c h_c hc ,之后经过自注意力层和 MLP 等得到最终的 h n h_n hn

Position-aware Graph

  • 考虑到相对位置在语句之间的因果原因的转化具有重要意义
  • 考虑到相同或不同说话者句子之间的序列关系对于理解信息、增强蕴含有效果

图构建

包含节点、边( G = ( V , E , R ) \mathcal{G}=(\mathcal{V},\mathcal{E},\mathcal{R}) G=(V,E,R))

E \mathcal{E} E 包含所有对应的三元组 ( u o , r o , t , u t ) (u_o,r_{o,t},u_t) (uo,ro,t,ut)

下图为边的计算过程,首先计算距离 D o , t D_{o,t} Do,t ,然后这只一个窗口大小 w w w ,然后结合 D o , t D_{o,t} Do,t 和 w w w 来计算 r o , t r_{o,t} ro,t

图更新

相邻节点进行更新,其中 c t , r c_{t,r} ct,r 为正则化常数

Causal Classifier

p ^ o , t = σ ( MLP ( h o ′ ⊕ h t ′ ) ) (1) \hat{p}_{o,t}=\sigma(\texttt{MLP}(h_o'\oplus h_t'))\tag1 p^o,t=σ(MLP(ho′⊕ht′))(1)

将头节点和尾节点的表示相邻合并,然后输入MLP进行预测

实验结果

此外作者对Position-aware Graph提及的窗口大小进行了实验,发现随着窗口变大,图网络复杂性也随之增加,虽然小窗口表示只有目标话语的邻接矩阵,但是具有信息丰富的位置信号。经过实验表明,窗口大小为3时最为适中

相关推荐
youcans_6 小时前
【youcans论文精读】VM-UNet:面向医学图像分割的视觉 Mamba UNet 架构
论文阅读·人工智能·计算机视觉·图像分割·状态空间模型
DuHz9 小时前
论文阅读——Edge Impulse:面向微型机器学习的MLOps平台
论文阅读·人工智能·物联网·算法·机器学习·edge·边缘计算
墨绿色的摆渡人15 小时前
论文笔记(一百零五)A review of learning-based dynamics models for robotic manipulation
论文阅读
m0_6501082420 小时前
Molmo&PixMo:全开源视觉语言模型的突破之路
论文阅读·人工智能·语言模型·开源vlm·高质量多模态数据集·molmo·pixmo
m0_6501082420 小时前
OLMo 2:全开放语言模型的技术突破与实践
论文阅读·人工智能·olmo 2·全开源多模态大模型·全链路开放·训练稳定性
张较瘦_2 天前
[论文阅读] AI + 编码 | Agint:让LLM编码代理告别“混乱”,用图编译打通自然语言到可执行代码的任督二脉
论文阅读·人工智能
iiiiii112 天前
【论文阅读笔记】IDAQ:离线元强化学习中的分布内在线适应
论文阅读·人工智能·笔记·学习·算法·机器学习·强化学习
小明_GLC2 天前
DeepSeek-Math-V2论文阅读
论文阅读
张较瘦_2 天前
[论文阅读] AI + 软件工程 | Python/Java/Go通用!依赖感知分层模型DHCS让代码注释更智能
论文阅读
empti_2 天前
《大规模 3D 城市布局的语义与结构引导可控生成》翻译
论文阅读·笔记