技术栈

视觉问答

深度之眼
1 年前
人工智能·机器学习·自动驾驶·视觉问答
【论文解读】NuScenes-QA:自动驾驶场景的多模态视觉问答基准来源:投稿 作者:橡皮 编辑:学姐论文链接:https://arxiv.org/pdf/2305.14836.pdf
深度之眼
2 年前
3d·多模态·视觉问答
BMVC 23丨多模态CLIP:用于3D场景问答任务的对比视觉语言预训练来源:投稿 作者:橡皮 编辑:学姐论文链接:https://arxiv.org/abs/2306.02329
hitrjj
2 年前
自然语言处理·llm·nlp·大语言模型·文本生成·视觉问答·语言文本编码
【AI视野·今日NLP 自然语言处理论文速览 第六十一期】Tue, 24 Oct 2023AI视野·今日CS.NLP 自然语言处理论文速览 Tue, 24 Oct 2023 (showing first 100 of 207 entries) Totally 100 papers 👉上期速览✈更多精彩请移步主页