Talk | UCSB博士生欧阳思琦: 利用词级别对比学习实现低资源下的语音翻译

本期为TechBeat人工智能社区 553 线上Talk。

北京时间12月6日(周三 )20:00, 加州大学圣塔芭芭拉分校·博士生 --- 欧阳思琦的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: " 利用词级别对比学习实现低资源下的语音翻译 ",介绍了他们团队在利用词级别对比学习实现低资源下的语音翻译的一系列研究。

Talk·信息

主题:利用词级别对比学习实现低资源下的语音翻译

嘉宾:加州大学圣塔芭芭拉分校·博士生 欧阳思琦

时间:北京时间12月6日(周三)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=833

Talk·介绍

端到端语音翻译目标是将源语言语音直接翻译到目标语言的文本。现有的模型在数据不足的情况下表现很差,并且我们观察到模型的表现和语音-转录的特征相似度非常相关。在这篇文章里,我们提出了WACO,即词级别的对比学习方法来实现低资源下的语音翻译。我们的关键想法是将语音和转录的词级别表示通过对比学习来对齐。我们在MuST-C数据集和IWSLT 2023 Maltese-English数据集下验证了我们模型的有效性。在仅用1小时语音翻译数据的情况下,我们的模型能够超越基线模型超过9点BLEU分数。

Talk大纲

1、介绍语音翻译问题

2、描述数据的稀缺以及后果

3、阐述低资源下观察到的现象

4、提出WACO方法;实验结果

Talk·预习资料

论文链接:https://arxiv.org/abs/2212.09359

项目链接:https://github.com/owaski/WACO/

论文链接: https://aclanthology.org/2022.naacl-main.376/

Talk·提问交流

在Talk界面下的**【交流区】**参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

欧阳思琦

加州大学圣塔芭芭拉分校·博士生

欧阳思琦目前在UCSB跟随导师李磊攻读计算机博士学位。在来UCSB之前,本科就读于清华姚班,导师是吴翼老师。现在的研究方向主要在语音翻译,即将源语言的音频翻译到目标语言的文本,包括离线和实时翻译。在低资源离线翻译方面,我们开发了WACO,即利用词级别的对比学习来精细对齐语音和文本的表示,在一个真实的低资源场景中(Maltese to English),WACO利用1小时的语音翻译数据达到了13.3 BLEU,大幅超越了基线模型(4 BLEU)表现,这篇文章也被ACL 2023接收。

个人主页:

https://www.techbeat.net/grzytrkj?id=36051


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

相关推荐
renhongxia115 天前
世界模型作为AGI落地底层底座的作用
人工智能·深度学习·生成对抗网络·自然语言处理·知识图谱·agi
大鱼>15 天前
大语言模型+物联网:LLM理解物理世界
物联网·struts·语言模型·多模态·aiot
大模型最新论文速读16 天前
06-16 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
宝贝儿好16 天前
【LLM】第二章:HuggingFace入门学习
人工智能·深度学习·神经网络·学习·算法·自然语言处理
小小工匠16 天前
拆解大语言模型:从词向量到注意力机制的内部运行原理
人工智能·语言模型·自然语言处理
星川皆无恙16 天前
大数据k-means聚类算法:基于k-means聚类算法+NLP微博舆情数据爬虫可视化分析推荐系统(新版)
大数据·人工智能·爬虫·算法·机器学习·自然语言处理·kmeans
财经资讯数据_灵砚智能16 天前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月15日
大数据·人工智能·python·ai·信息可视化·自然语言处理·灵砚智能
暮云星影16 天前
瑞芯微rk3588利用Rockchip NPU运行大语言模型(LLM)
arm开发·人工智能·语言模型·自然语言处理
宝贝儿好16 天前
【LLM】第一章:知识体系框架概览
人工智能·深度学习·机器学习·自然语言处理
啦啦啦_999916 天前
项目之 头满分_3Bert
自然语言处理