【论文速读,找找启发点】2024/6/16

ICME 2023

End-To-End Part-Level Action Parsing With Transformer

类似 DETR,通过 加 query的方式实现 端到端

ELAN: Enhancing Temporal Action Detection with Location Awareness

如何实现位置感知? => 重叠的卷积核?

Do we really need temporal convolutions in action segmentation?

No, 用 Transformer

Explicit Attention Modeling for Pedestrian Attribute Recognition

任务:Pedestrian Attribute Recognition

A Simple Masked Autoencoder Paradigm for Point Cloud

点云,自编码器

RF-based Multi-view Pose Machine for Multi-Person 3D Pose Estimation

多人, 3D姿态估计


中国计算机学会推荐国际学术会议和期刊目录(2022):https://ccf.atom.im/

搜索文献:dblp

相关推荐
Elastic 中国社区官方博客13 小时前
Elasticsearch:智能搜索的 MCP
大数据·人工智能·elasticsearch·搜索引擎·全文检索
stbomei13 小时前
从“能说话”到“会做事”:AI Agent如何重构日常工作流?
人工智能
yzx99101313 小时前
生活在数字世界:一份人人都能看懂的网络安全生存指南
运维·开发语言·网络·人工智能·自动化
许泽宇的技术分享14 小时前
LangGraph深度解析:构建下一代智能Agent的架构革命——从Pregel到现代AI工作流的技术飞跃
人工智能·架构
乔巴先生2414 小时前
LLMCompiler:基于LangGraph的并行化Agent架构高效实现
人工智能·python·langchain·人机交互
静西子16 小时前
LLM大语言模型部署到本地(个人总结)
人工智能·语言模型·自然语言处理
cxr82816 小时前
基于Claude Code的 规范驱动开发(SDD)指南
人工智能·hive·驱动开发·敏捷流程·智能体
Billy_Zuo16 小时前
人工智能机器学习——决策树、异常检测、主成分分析(PCA)
人工智能·决策树·机器学习
小王爱学人工智能16 小时前
OpenCV的图像金字塔
人工智能·opencv·计算机视觉