论文精读

m0_650108242 天前
自动化·llm·agent·论文精读·量化分析·多智能体协同系统·金融分析
【论文精读】R&D-Agent-Quant:基于多智能体框架的量化因子与模型研发自动化系统标题:R&D-Agent-Quant: A Multi-Agent Framework for Automated Quantitative Research and Development 作者:Microsoft Research Asia
m0_650108245 天前
计算机视觉·文生视频·论文精读·实例感知·实例级语义控制
【论文精读】InstanceCap:通过实例感知提升文本到视频生成效果原文标题:InstanceCap: Improving Text-to-Video Generation via Instance-aware Captioning 论文链接:https://arxiv.org/abs/2412.09283v1
m0_650108245 天前
计算机视觉·论文精读·真实世界视频超分·liem·dp loss·图像质量提升
【论文精读】STAR:基于文本到视频模型的空间-时间增强真实世界视频超分标题:STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution 作者:Rui Xie¹∗, Yinhong Liu¹∗, Penghao Zhou², Chen Zhao¹, Jun Zhou³, Kai Zhang¹, Zhenyu Zhang¹, Jian Yang¹, Zhenheng Yang², Ying Tai¹† 机构:¹南京大学,²字节跳动,³西南大
m0_6501082417 天前
人工智能·计算机视觉·论文精读·gam·共显著性目标检测·组协同学习·gcm
【论文精读】Group Collaborative Learning for Co-Salient Object Detection论文标题:Group Collaborative Learning for Co-Salient Object Detection 作者:Qi Fan, Deng-Ping Fan, Huazhu Fu, Chi Keung Tang, Ling Shao, Yu-Wing Tai 发表会议:CVPR 2021 论文链接:https://arxiv.org/abs/2104.01108 代码地址:https://github.com/fanq15/GCoNet
机器白学1 年前
ocr·论文精读
【论文精读】GOT-OCR2.0源码论文——打破传统OCR流程的多模态视觉-语言大模型架构:预训练VitDet 视觉模型+ 阿里通义千问Qwen语言模型作为本系列的开篇文章,首先定下本系列的整体基调。论文精读系列,旨在记录研读深度学习、强化学习相关论文的个人心得和理解,仅供参考,欢迎指正错误和研究探讨。
马拉AI1 年前
算法·计算机视觉·论文精读
【TPAMI 2024】告别误差,OPAL算法如何让光场视差估计变得轻而易举?作者:Peng Li; Jiayin Zhao; Jingyao Wu; Chao Deng; Yuqi Han; Haoqian Wang; Tao Yu
xiaobai_Ry1 年前
论文笔记·图神经网络·论文精读·脑科学·脑网络分析·brainnet
【区域脑图论文笔记】BrainNetCNN:第一个专门为脑网络连接体数据设计的深度学习框架文章源话早产儿/婴幼儿年龄概念【医学概念知识拓展】总结这里先了解一下论文的总体结果(其他结果在下面的笔记)
Flying Bulldog2 年前
python·mediapipe·手掌检测·关键点检测·论文精读
论文精读 && MediaPipe HandsMediaPipe Hands:On-device Real-time Hand TrackingMediaPipe手势:设备上的实时手势跟踪
我是有底线的