【论文速读,找找启发点】2024/6/16

ICME 2023

End-To-End Part-Level Action Parsing With Transformer

类似 DETR,通过 加 query的方式实现 端到端

ELAN: Enhancing Temporal Action Detection with Location Awareness

如何实现位置感知? => 重叠的卷积核?

Do we really need temporal convolutions in action segmentation?

No, 用 Transformer

Explicit Attention Modeling for Pedestrian Attribute Recognition

任务:Pedestrian Attribute Recognition

A Simple Masked Autoencoder Paradigm for Point Cloud

点云,自编码器

RF-based Multi-view Pose Machine for Multi-Person 3D Pose Estimation

多人, 3D姿态估计


中国计算机学会推荐国际学术会议和期刊目录(2022):https://ccf.atom.im/

搜索文献:dblp

相关推荐
神经星星1 分钟前
无需预对齐即可消除批次效应,东京大学团队开发深度学习框架STAIG,揭示肿瘤微环境中的详细基因信息
人工智能·深度学习·机器学习
神经星星2 分钟前
【vLLM 学习】调试技巧
人工智能·机器学习·编程语言
程序员Linc20 分钟前
写给新人的深度学习扫盲贴:向量与矩阵
人工智能·深度学习·矩阵·向量
xcLeigh28 分钟前
OpenCV从零开始:30天掌握图像处理基础
图像处理·人工智能·python·opencv
果冻人工智能31 分钟前
如何有效应对 RAG 中的复杂查询?
人工智能
2305_7978820940 分钟前
AI识图小程序的功能框架设计
人工智能·微信小程序·小程序
果冻人工智能41 分钟前
向量搜索中常见的8个错误(以及如何避免它们)
人工智能
碳基学AI1 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义免费下载方法
大数据·人工智能·python·gpt·算法·语言模型·集成学习
补三补四1 小时前
机器学习-聚类分析算法
人工智能·深度学习·算法·机器学习
果冻人工智能1 小时前
法官们终于似乎明白了:如果没有复制,那就没有版权
人工智能