【论文速读,找找启发点】2024/6/16

ICME 2023

End-To-End Part-Level Action Parsing With Transformer

类似 DETR,通过 加 query的方式实现 端到端

ELAN: Enhancing Temporal Action Detection with Location Awareness

如何实现位置感知? => 重叠的卷积核?

Do we really need temporal convolutions in action segmentation?

No, 用 Transformer

Explicit Attention Modeling for Pedestrian Attribute Recognition

任务:Pedestrian Attribute Recognition

A Simple Masked Autoencoder Paradigm for Point Cloud

点云,自编码器

RF-based Multi-view Pose Machine for Multi-Person 3D Pose Estimation

多人, 3D姿态估计


中国计算机学会推荐国际学术会议和期刊目录(2022):https://ccf.atom.im/

搜索文献:dblp

相关推荐
Liudef0619 分钟前
DeepseekV3.2 实现构建简易版Wiki系统:从零开始的HTML实现
前端·javascript·人工智能·html
珺毅同学1 小时前
YOLO输出COCO指标及YOLOv12报错
python·深度学习·yolo
格林威2 小时前
AOI在产品质量检测制造领域的应用
人工智能·数码相机·计算机网络·计算机视觉·目标跟踪·视觉检测·制造
短视频矩阵源码定制2 小时前
矩阵系统源码推荐:技术架构与功能完备性深度解析
java·人工智能·矩阵·架构
彩云回2 小时前
多维尺度分析法(MDS)
人工智能·机器学习·1024程序员节
Rock_yzh3 小时前
AI学习日记——Transformer的架构:编码器与解码器
人工智能·深度学习·神经网络·学习·transformer
FL16238631293 小时前
智慧交通红绿灯检测数据集VOC+YOLO格式1215张3类别
深度学习·yolo·机器学习
rengang663 小时前
Spring AI Alibaba 框架使用示例总体介绍
java·人工智能·spring·spring ai·ai应用编程
FreeBuf_3 小时前
新型Agent感知伪装技术利用OpenAI ChatGPT Atlas浏览器传播虚假内容
人工智能·chatgpt
yuluo_YX3 小时前
语义模型 - 从 Transformer 到 Qwen
人工智能·深度学习·transformer