ERC论文阅读(02)--SAC;-LSTM论文阅读笔记

SACL-LSTM论文阅读笔记

论文中心思想

这篇论文是研究ERC任务的论文,发表在2023年ACL上。作者利用对比学习和对抗训练策略来完成ERC任务,采用LSTM作为基础模型,在基础模型上使用对抗训练的方法和对比学习的方法来改进ERC任务效果,是当时第一个将对抗训练引入ERC任务的工作,该项工作基于文本模态,在常用的数据集MELD、iemocap、emoryNLP上取得了SOTA的效果。

模型架构

模型以双向LSTM作为基础模型,架构如图:

前面一个LSTM网络是对原始数据进行的表示学习,后面一个是对对抗样本进行表示学习,模型采用考虑样本分布均衡的FocalLoss与软监督对比损失函数的加权和作为损失函数。

主要创新点

第一次将对抗训练引入ERC任务;

区别于标准的对抗训练将扰动添加在上下文无关层,作者提出的方法将扰动添加在考虑了上下文的嵌入层,并且以多通道的形式添加(具体来说,这里指的是在LSTM网络的多个位置都加入扰动)

代码复现

环境配置:

安装环境的时候一直报错,要先把pytorch装上,再执行pip install -r re...

python: 3.7.16

CUDA:11.8

pytorch: 1.12.1+cu116

这里我是在网上租的GPU,所以它自带的cuda是11.8,然后按照作者的readme文件,在创建了虚拟环境并激活后需要先装上pytorch,然后再安装requirements.txt文件(我直接装requirements.txt一直报错)

之后把需要的数据下载下来,就可以直接debug等等了,(数据这里我直接下载的COSMIC处理好的文件)

然后debug论文的时候别的地方还算是比较好理解,就是有一个地方我还是不太清楚,如下图,下面这一段代码是model.py文件里面对说话者信息上下文表示进行学习的代码,里面嵌套了循环比较难以理解,我大致明白它是利用说话者所说的话语信息来学习说话人的表示,但还是不是很理解(这里如果有大佬路过知道的话,望能不吝赐教,感谢~)

其他

笔记都是本人的个人意见和想法,仅供参考,如果您有任何建议也非常欢迎留言指出~

2024-10-26

的的

相关推荐
闪闪发亮的小星星2 天前
高斯光以及高斯光公式解释
笔记
cqbzcsq2 天前
CellFlow虚拟细胞论文阅读
论文阅读·人工智能·笔记·学习·生物信息
凌晨一点的秃头猪2 天前
论文阅读 GTI(Graph-based Tree Index): 面向高维空间最近邻搜索的动态图-树混合索引结构
论文阅读
阿米亚波2 天前
【Windows】QEMU 启动 openEuler aarch64/arm64 架构系统 + 离线软件源
linux·windows·经验分享·笔记·架构·arm
自传.2 天前
尚硅谷 Vibe Coding|第三章(1) Claude Code深度使用与进阶技巧 学习笔记
笔记·学习·尚硅谷·vibecoding
有Li2 天前
PTCMIL:基于提示 token 聚类的全切片图像多实例学习分析文献速递/多模态医学影像最新进展
论文阅读·学习·数据挖掘·聚类·文献·医学生
.千余2 天前
【C++】模板进阶全解:非类型参数|全特化|偏特化|分离编译完全指南
开发语言·c++·笔记·学习·其他
自传.2 天前
尚硅谷 Vibe Coding|第二章 AI编程工具生态 学习笔记
笔记·学习·ai编程·尚硅谷·vibe coding
大模型最新论文速读2 天前
06-16 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
秋波。未央2 天前
Java Agent 开发 · Day 1 学习笔记(含作业完整标准答案)
java·笔记·学习