技术栈
论文阅读
图灵学术计算机论文辅导
4 小时前
论文阅读
·
人工智能
·
经验分享
·
科技
·
深度学习
·
考研
·
计算机视觉
提示+掩膜+注意力=Mamba三连击,跨模态任务全面超越
来gongzhonghao【图灵学术计算机论文辅导】,快速拿捏更多计算机SCI/CCF发文资讯~Mamba今年继续横扫顶刊顶会,CVPR、ICCV、IEEE TPAMI统统拿下,比如在多模态任务中表现亮眼的扩展模型,性能全面领先同类方法。作为SSM的重要分支,它们在效率与精度平衡上优势突出,理论拓展性强,在医疗影像、视频分析等领域应用广泛,创新空间巨大,想冲击高区的研究者可从混合架构设计和跨域适配入手探索。
Mr Sorry
4 小时前
论文阅读
·
笔记
TIME WEAVER: A Conditional Time Series Generation Model论文阅读笔记
摘要想象一下,根据天气、电动汽车的存在和位置生成一个城市的电力需求模式,这可以用于在冬季冻结期间进行容量规划。这样的真实世界的时间序列通常包含配对的异构上下文元数据(天气、位置等)。当前的时间序列生成方法经常忽略这种配对元数据,并且他的异质性在应用于现有方法(无论是图像、音频、视频还是时序领域)时表现出多个挑战。为了解决这一差距,我们引入了TIME WEAVER(一种新的基于扩散的模型),它利用分类、连续甚至时变变量形式的异构元数据来显著改善时间序列生成。此外,我们还表明,将标准评价指标从图像朴素地扩展到
有Li
4 小时前
论文阅读
·
医学生
通过观看数百个外科手术视频课程来学习多模态表征|文献速递-医学影像算法文献分享
Title题目Learning multi-modal representations by watching hundreds of surgical video lectures
2301_80365274
6 小时前
论文阅读
RLHF-V原论文阅读
RLHF是一种通过人类偏好反馈引导 大模型行为的训练方法,典型流程如下:生成多个候选回答 -> 人类打分排序(就有点像使用GPT的时候会冒出来两个回答,让弄选择那个更好)-> 训练一个reward模型(以人类排序为监督信号训练一个打分器) -> 用强化学习算法训练语言模型
Johan song
1 天前
论文阅读
·
论文笔记
AR-Align-NN-2024
基于注意力重排序策略的无监督多视角对比学习实体对齐框架 AR-Align-NN-2024实体对齐是知识图谱中的关键任务,旨在匹配不同知识图谱中的对应实体。由于现实场景中预对齐实体的稀缺性,无监督实体对齐研究日益受到关注。然而现有方法缺乏信息性实体引导,难以准确预测名称和结构相似的挑战性实体。为此,我们提出AR-Align框架——一种融合注意力重排序策略的无监督多视角对比学习方法。该框架采用两种数据增强技术分别生成邻域和属性的互补视图,通过多视角对比学习缩小增强实体间的语义鸿沟,并创新性地通过计算不同结构上
图灵学术计算机论文辅导
1 天前
论文阅读
·
人工智能
·
经验分享
·
考研
·
机器学习
·
计算机视觉
·
目标跟踪
1+1>2!特征融合如何让目标检测更懂 “场景”?
来gongzhonghao【图灵学术计算机论文辅导】,快速拿捏更多计算机SCI/CCF发文资讯~在多模态大模型(MLLM)时代,特征融合与目标检测的研究方向正变得愈发关键。从红外与可见光图像的融合,到语音活动检测中的特征融合,再到多模态目标检测中的特征学习,不仅展示了特征融合在不同领域的广泛应用,也揭示了该方向的创新趋势。例如,通过引入注意力机制和动态特征融合,可以显著提升小目标检测的性能。这些创新点逐渐成为顶会顶刊paper发表热门方向,如果你对这一领域感兴趣,建议从这些创新点入手。
张较瘦_
2 天前
论文阅读
·
人工智能
·
软件工程
[论文阅读] 人工智能 + 软件工程 | 增强RESTful API测试:针对MongoDB的搜索式模糊测试新方法
本文聚焦于使用MongoDB的RESTful API的基于搜索的模糊测试,提出了增强测试生成的新技术:通过自动代码 instrumentation 动态分析MongoDB状态,并允许从测试用例直接插入NoSQL数据,作为开源工具EvoMaster的扩展。实验在6个RESTful API上进行,结果显示代码覆盖率较现有白盒方法最多提升18%,且优于4种最先进的黑盒模糊测试工具,为NoSQL数据库交互的API测试提供了有效方案。
网安INF
2 天前
论文阅读
·
人工智能
·
深度学习
·
计算机视觉
·
网络安全
·
对抗攻击
【论文阅读】-《RayS: A Ray Searching Method for Hard-label Adversarial Attack》
Jinghui Chen University of California, Los Angeles jhchen@cs.ucla.edu Quanquan Gu University of California, Los Angeles qgu@cs.ucla.edu 原文链接:https://arxiv.org/pdf/2006.12792
walnut_oyb
2 天前
论文阅读
·
人工智能
·
神经网络
·
计算机视觉
·
分类
论文阅读|CVPR 2025|Mamba进一步研究|GroupMamba
论文地址:pdf 代码地址:code现有模型局限:基于 SSM 的视觉模型(如 Mamba、VMamba)在处理视觉任务时存在两大挑战:一是大模型训练不稳定(参数增多时性能下降);二是计算效率低(通道数增加会导致参数和计算成本激增),难以平衡性能与效率。
行然梦实
2 天前
论文阅读
·
算法
·
机器学习
·
数学建模
论文阅读:《多目标和多目标优化的回顾与评估:方法和算法》
提醒: 文章内容为方便作者自己后日复习与查阅而进行的书写与发布,其中引用内容都会使用链接表明出处(如有侵权问题,请及时联系)。 其中内容多为一次书写,缺少检查与订正,如有问题或其他拓展及意见建议,欢迎评论区讨论交流。
CV-杨帆
2 天前
论文阅读
论文阅读:2024 arxiv AutoDefense: Multi-Agent LLM Defense against Jailbreak Attacks
总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328
伊丽莎白鹅
3 天前
论文阅读
论文阅读--射频电源在半导体领域的应用
论文信息:左政,冯国楠,李建慧,等.射频电源在半导体领域的应用[J].软件和集成电路,2025,(04):38-43.DOI:10.19609/j.cnki.cn10-1339/tn.2025.04.007.
张较瘦_
4 天前
javascript
·
论文阅读
·
人工智能
[论文阅读] 人工智能 + 软件工程 | CASCADE:用LLM+编译器技术破解JavaScript混淆难题
arXiv:2507.17691 CASCADE: LLM-Powered JavaScript Deobfuscator at Google Shan Jiang, Pranoy Kovuri, David Tao, Zhixun Tan Subjects: Software Engineering (cs.SE); Artificial Intelligence (cs.AI); Cryptography and Security (cs.CR); Machine Learning (cs.LG);
张较瘦_
4 天前
论文阅读
·
人工智能
·
机器学习
[论文阅读] 人工智能 | 机器学习工作流的“救星”:数据虚拟化服务如何解决数据管理难题?
本文聚焦于机器学习(ML)工作流中的数据虚拟化,提出扩展数据虚拟化概念以支持大量虚拟数据集的创建与管理,这些数据集包含源数据集的路径链接和数据转换函数的调用链接。文中设计并实现了具有服务导向架构的数据虚拟化服务(DVS),包含数据虚拟化管理器(DVM)、数据查询引擎(DQE)等核心组件,并通过六个应用案例(如风力涡轮机故障检测、河流流量预测等)验证其价值,能带来存储节省、数据溯源自动化、实验可重复性提升等收益。
图灵学术计算机论文辅导
4 天前
论文阅读
·
人工智能
·
考研
·
机器学习
·
计算机视觉
·
目标跟踪
·
信息与通信
特征融合+目标检测!3篇CVPR新作把多模态目标检测拉高10个mAP
在大模型时代,多模态目标检测领域正迎来新的发展机遇与挑战。但由于全量微调成本过高,使得高效迁移学习与特征融合在多模态目标检测中的重要性愈发凸显。当前,相关研究正围绕模型高效迁移与参数更新、任务驱动动态融合、统一知识迁移框架、鲁棒迁移与领域泛化等方向展开创新。本文整理了多篇相关论文,旨在帮助读者了解前沿动态,掌握研究思路,助力大家在该领域取得突破。
Nina_717
4 天前
论文阅读
·
人工智能
AI论文阅读方法+arixiv
文件拖拽到AI,发送提示词: “请仔细阅读这篇论文,提取出其核心内容,包括研究目的、主要方法、关键结论和创新点。用简洁明了的语言总结出论文的核心概述,字数控制在300字以内。重点突出论文的研究重点和贡献,避免过多细节描述,确保内容精炼且准确反映论文主旨。”
王上上
4 天前
论文阅读
·
cnn
·
lstm
【论文阅读53】-CNN-LSTM-滑坡风险随时间变化研究
这篇论文创新性地将深度学习中 CNN 和 LSTM 结合,提出了一种高效、自动化的滑坡时变风险评估框架,为滑坡风险管理提供了新思路和实用工具。
s1ckrain
5 天前
论文阅读
·
人工智能
·
语言模型
·
大模型安全
【论文阅读】ON THE ROLE OF ATTENTION HEADS IN LARGE LANGUAGE MODEL SAFETY
原文摘要研究背景与现状背景现状研究目标与贡献目标:探索标准注意力机制与安全能力之间的联系,以填补安全性相关的可解释性研究空白。
UQI-LIUWJ
5 天前
论文阅读
·
人工智能
·
语言模型
论文笔记:Tuning Language Models by Proxy
COLM 2024尽管大型预训练语言模型(如 GPT-4、LLAMA2 等)具有很强的通用能力,但它们仍然需要进一步的微调来更好地完成特定任务,比如:
钟屿
6 天前
论文阅读
·
图像处理
·
人工智能
·
深度学习
·
计算机视觉
Multiscale Structure Guided Diffusion for Image Deblurring 论文阅读
扩散概率模型(Diffusion Probabilistic Models, DPMs)最近被用于图像去模糊,其被表述为一个以模糊输入为条件的图像条件生成过程,将高斯噪声映射到高质量图像。当在成对的域内数据上训练时,图像条件DPMs(icDPMs)显示出比基于回归的方法更真实的结果。然而,当面对域外图像时,它们在恢复图像方面的鲁棒性尚不清楚,因为它们没有强加特定的退化模型或中间约束。为此,我们引入了一种简单而有效的多尺度结构引导,作为一种隐式偏置(implicit bias),在中间层通知 icDPM 关