Talk | UCSB博士生欧阳思琦: 利用词级别对比学习实现低资源下的语音翻译

本期为TechBeat人工智能社区 553 线上Talk。

北京时间12月6日(周三 )20:00, 加州大学圣塔芭芭拉分校·博士生 --- 欧阳思琦的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: " 利用词级别对比学习实现低资源下的语音翻译 ",介绍了他们团队在利用词级别对比学习实现低资源下的语音翻译的一系列研究。

Talk·信息

主题:利用词级别对比学习实现低资源下的语音翻译

嘉宾:加州大学圣塔芭芭拉分校·博士生 欧阳思琦

时间:北京时间12月6日(周三)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=833

Talk·介绍

端到端语音翻译目标是将源语言语音直接翻译到目标语言的文本。现有的模型在数据不足的情况下表现很差,并且我们观察到模型的表现和语音-转录的特征相似度非常相关。在这篇文章里,我们提出了WACO,即词级别的对比学习方法来实现低资源下的语音翻译。我们的关键想法是将语音和转录的词级别表示通过对比学习来对齐。我们在MuST-C数据集和IWSLT 2023 Maltese-English数据集下验证了我们模型的有效性。在仅用1小时语音翻译数据的情况下,我们的模型能够超越基线模型超过9点BLEU分数。

Talk大纲

1、介绍语音翻译问题

2、描述数据的稀缺以及后果

3、阐述低资源下观察到的现象

4、提出WACO方法;实验结果

Talk·预习资料

论文链接:https://arxiv.org/abs/2212.09359

项目链接:https://github.com/owaski/WACO/

论文链接: https://aclanthology.org/2022.naacl-main.376/

Talk·提问交流

在Talk界面下的**【交流区】**参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

欧阳思琦

加州大学圣塔芭芭拉分校·博士生

欧阳思琦目前在UCSB跟随导师李磊攻读计算机博士学位。在来UCSB之前,本科就读于清华姚班,导师是吴翼老师。现在的研究方向主要在语音翻译,即将源语言的音频翻译到目标语言的文本,包括离线和实时翻译。在低资源离线翻译方面,我们开发了WACO,即利用词级别的对比学习来精细对齐语音和文本的表示,在一个真实的低资源场景中(Maltese to English),WACO利用1小时的语音翻译数据达到了13.3 BLEU,大幅超越了基线模型(4 BLEU)表现,这篇文章也被ACL 2023接收。

个人主页:

https://www.techbeat.net/grzytrkj?id=36051


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

相关推荐
Loving_enjoy5 小时前
ChatGPT详解
人工智能·自然语言处理
最好Tony7 小时前
深度学习blog-Transformer-注意力机制和编码器解码器
人工智能·深度学习·机器学习·计算机视觉·自然语言处理·chatgpt
开放知识图谱7 小时前
论文浅尝 | 编辑基于语言模型的知识图谱嵌入(AAAI2024)
人工智能·语言模型·自然语言处理·知识图谱
顾道长生'9 小时前
(NIPS-2024)PISSA:大型语言模型的主奇异值和奇异向量适配
人工智能·语言模型·自然语言处理
Macropodus9 小时前
near-synonym反义词生成(2):Prompt +Bert-MLM(FT)
自然语言处理·prompt·反义词生成·中文反义词·bert-mlm
语音之家10 小时前
CultureLLM 与 CulturePark:增强大语言模型对多元文化的理解
人工智能·语言模型·自然语言处理
小嗷犬17 小时前
【论文笔记】Visual Alignment Pre-training for Sign Language Translation
论文阅读·人工智能·机器翻译·多模态·手语翻译·手语识别
敖行客 Allthinker17 小时前
让 AMD GPU 在大语言模型推理中崭露头角:机遇与挑战
人工智能·语言模型·自然语言处理
eric-sjq19 小时前
基于xiaothink对Wanyv-50M模型进行c-eval评估
人工智能·python·语言模型·自然语言处理·github
Hoper.J20 小时前
微调 BERT:实现抽取式问答
人工智能·深度学习·自然语言处理·llm·bert