【论文速读,找找启发点】2024/6/16

ICME 2023

End-To-End Part-Level Action Parsing With Transformer

类似 DETR,通过 加 query的方式实现 端到端

ELAN: Enhancing Temporal Action Detection with Location Awareness

如何实现位置感知? => 重叠的卷积核?

Do we really need temporal convolutions in action segmentation?

No, 用 Transformer

Explicit Attention Modeling for Pedestrian Attribute Recognition

任务:Pedestrian Attribute Recognition

A Simple Masked Autoencoder Paradigm for Point Cloud

点云,自编码器

RF-based Multi-view Pose Machine for Multi-Person 3D Pose Estimation

多人, 3D姿态估计


中国计算机学会推荐国际学术会议和期刊目录(2022):https://ccf.atom.im/

搜索文献:dblp

相关推荐
LYFlied15 小时前
在AI时代,前端开发者如何构建全栈开发视野与核心竞争力
前端·人工智能·后端·ai·全栈
core51216 小时前
深度解析DeepSeek-R1中GRPO强化学习算法
人工智能·算法·机器学习·deepseek·grpo
Surpass余sheng军16 小时前
AI 时代下的网关技术选型
人工智能·经验分享·分布式·后端·学习·架构
说私域16 小时前
基于开源AI智能名片链动2+1模式S2B2C商城小程序源码的所有物服务创新研究
人工智能
桃花键神16 小时前
openFuyao在AI推理与大数据场景中的加速方案:技术特性与实践探索
大数据·人工智能
wb0430720116 小时前
大模型(LLM)及其应用生态中的关键技术栈
人工智能
java1234_小锋16 小时前
Transformer 大语言模型(LLM)基石 - Transformer架构详解 - 自注意力机制(Self-Attention)原理介绍
深度学习·语言模型·transformer
颜颜yan_16 小时前
DevUI + Vue 3 入门实战教程:从零构建AI对话应用
前端·vue.js·人工智能
ney1878190247416 小时前
分类网络LeNet + FashionMNIST 准确率92.9%
python·深度学习·分类
Coding茶水间16 小时前
基于深度学习的无人机视角检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉