论文阅读

GiantGo6 小时前
论文阅读
SCI论文阅读指令(特征工程)下面是一个SCI论文阅读特征工程V3.0,把指令输入大模型中,并上传PDF论文,就可以帮你快速阅读论文。
寻丶幽风1 天前
论文阅读·人工智能·笔记·自动驾驶·模拟器·多轨迹驾驶场景
论文阅读笔记——MTGS: Multi-Traversal Gaussian SplattingMTGS 论文MTGS(Multi-Traversal Gaussian Splatting) 是一种用于多轨迹驾驶场景重建的新方法,通过共享静态几何、轨迹特定的动态节点和外观节点,分别建模静态背景、动态物体和外观变化。该方法利用 LiDAR 引导的曝光对齐和可学习的仿射变换解决轨迹内外观一致性问题,并通过深度和法线正则化提升几何精度和渲染质量。实验表明,MTGS 在 nuPlan 数据集上显著优于单轨迹基线方法,为自动驾驶模拟器和数字孪生应用提供了高质量的场景重建和新视角合成能力。
RedMery3 天前
论文阅读·笔记
论文阅读笔记:Denoising Diffusion Probabilistic Models (3)论文阅读笔记:Denoising Diffusion Probabilistic Models (1) 论文阅读笔记:Denoising Diffusion Probabilistic Models (2) 论文阅读笔记:Denoising Diffusion Probabilistic Models (3)
墨绿色的摆渡人3 天前
论文阅读·人工智能
论文笔记(七十三)Gemini Robotics: Bringing AI into the Physical World引用:原文: https://storage.googleapis.com/deepmind-media/gemini-robotics/gemini_robotics_report.pdf 代码、数据和视频:
寻丶幽风4 天前
论文阅读·人工智能·笔记·3d·自动驾驶
论文阅读笔记——MAGICDRIVE: STREET VIEW GENERATION WITH DIVERSE 3D GEOMETRY CONTROLMagicDrive 论文MagicDrive 通过对 3D 数据和文本数据的多模态条件融合和隐式视角转换,实现了高质量、多视角一致的 3D 场景生成。
dilvx4 天前
论文阅读
论文阅读:Attention is all you need省流:(2017)本文提出 Transformer,是一个用来平替 CNN & RNN 的,完全基于注意力机制的架构。Transformer 能力强、容易并行、训练时间短。
君的名字4 天前
论文阅读·人工智能·语言模型
【论文阅读】大型语言模型能否实现软件漏洞的检测与修复?这篇文章翻译自 CAN LARGE LANGUAGE MODELS FIND AND FIX VULNERABLE SOFTWARE? 大型语言模型能否实现软件漏洞的检测与修复?
weixin_612629694 天前
论文阅读·论文笔记
基于Matlab的风力发电系统仿真研究基于Matlab的风力发电系统仿真研究摘要风力发电作为清洁可再生能源,在全球能源转型中扮演着日益重要的角色。然而,风力发电系统作为一个多变量、强耦合、非线性的复杂系统,其建模与仿真研究仍面临诸多挑战。本文基于MATLAB/Simulink平台,采用模块化建模方法,构建了包含风速、风轮、传动系统和发电机等子系统的风力发电系统仿真模型。在此基础上,重点探讨了恒频恒速和恒频变速两种典型风力发电系统的仿真实现,并针对其中的变桨距控制、变速恒频控制以及双馈发电机解耦控制等关键技术进行了系统仿真分析。仿真结果表明,所
RedMery4 天前
论文阅读·笔记
论文阅读笔记:Denoising Diffusion Probabilistic Models (2)接论文阅读笔记:Denoising Diffusion Probabilistic Models (1)
寻丶幽风5 天前
论文阅读·人工智能·笔记·语言模型
论文阅读笔记——Adapter,AdapterFusion,AdapterDropAdapter 论文 Adapter 是一组轻量级的参数,被添加到模型的中间层,以保护原有预训练模型的参数。 Adapter:少量参数和近似恒等初始化。注意:仍然增加了网络深度!!! Adapter模块由两个前馈子层构成。第一个子层接收 Transformer 块的输出,并将原始输入维度 d 映射到较小的维度 m(通常m远小于d),以此限制模块的参数量。第二个子层则负责将维度m重新映射回d,作为模块的最终输出。这种设计使得 Adapter 模块能够在不调整整个模型参数的情况下,灵活适应新的下游任务,有效避
dundunmm5 天前
论文阅读·人工智能·数据挖掘·对比学习·推荐·深度聚类·多行为推荐
【论文阅读】Contrastive Clustering Learning for Multi-Behavior Recommendation论文地址:Contrastive Clustering Learning for Multi-Behavior Recommendation | ACM Transactions on Information Systems
Plan-C-5 天前
论文阅读·人工智能·深度学习
论文阅读 EEGNetEEGNET网络结构解析与复现 | 青椒的学习笔记传统基于CNN的脑机接口(BCI)研究多针对单一类型的任务(如P300分类、运动想象分类),并针对该任务的特定脑电信号特征设计模型。然而,不同BCI任务(如事件相关电位ERP和振荡节律信号)的脑电特征差异显著(如时域波形与频域节律),因此针对某一任务优化的CNN架构是否能在其他任务中保持良好性能尚未验证。这种局限性导致CNN模型的通用性存疑,即能否设计一个统一架构适应多种BCI范式。
黑洞是不黑5 天前
论文阅读·图像处理·人工智能·深度学习·计算机视觉
论文阅读——Deep Variational Network for Blind Pansharpening基于深度学习的方法在全色锐化中扮演着重要角色,全色锐化利用全色图像来增强多光谱图像的空间分辨率,同时保持其光谱特征。然而,大多数现有方法在训练过程中主要只考虑一种固定的退化情况。因此,当测试数据的退化情况未知(盲)且与训练数据不同时,这些方法的性能可能会显著下降,这在实际应用中很常见。为了解决这个问题,我们提出了一种用于盲全色锐化的深度变分网络,称为VBPN,它将退化估计和图像融合整合到一个完整的贝叶斯框架中。首先,通过将多光谱图像的噪声和模糊参数以及全色图像的噪声参数作为隐藏变量,我们使用神经网络对融合
CV-杨帆5 天前
论文阅读
论文阅读:2024-NAACL Semstamp、2024-ACL (Findings) k-SemStamp总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328
传说故事6 天前
论文阅读·人工智能
论文略读(2025.3.18-更新中)I2V3D: Controllable image-to-video generation with 3D guidance Image to Video工作,能够实现给一张图,输出一个视频,且可以控制相机。动态信息来自于用户手工设计(相机移动,人体骨骼驱动)。 pipeline:先image分割前背景,背景用viewcrafter操控,前景得到mesh。然后在blender中编辑使之运动。用render的video提几个关键帧用SDXL过一下,得到真实一点的关键帧,再用SVD插帧。 ReCamMaste
送我上青云|7 天前
论文阅读·算法·机器人·自动驾驶
Localisation using the Appearance of Prior Structure 论文阅读第三章 Localisation using the Appearance of Prior Structure
丘小羽7 天前
论文阅读
BLIP论文阅读目录现存的视觉语言预训练存在两个不足:任务领域数据集领域相关研究知识蒸馏Method单模态编码器:基于图像的文本编码器:
万里守约7 天前
论文阅读·图像处理·计算机视觉·图像分割
【论文阅读】实时全能分割模型在最近的计算机视觉领域,针对实时多任务分割的需求日益增长,特别是在交互式分割、全景分割和视频实例分割等多种应用场景中。为了解决这些挑战,本文介绍了一种新方法——RMP-SAM(Real-Time Multi-Purpose Segment Anything),旨在实现实时的多功能分割。RMP-SAM结合了动态卷积与高效的模型架构,使其能够在有限的计算资源下处理多种分割任务,且保持令人满意的准确率与速度。
勤奋的小笼包7 天前
论文阅读·人工智能·学习·语言模型·自然语言处理·chatgpt·nlp
【论文阅读】CARES:医学视觉语言模型可信度的综合基准CARES: A Comprehensive Benchmark of Trustworthiness in Medical Vision Language Models CARES:医学视觉语言模型可信度的综合基准 Accepted by NeurIPS 2024 github:地址
ZHW_AI课题组7 天前
论文阅读
【论文笔记】RAQ-VAE: Rate-Adaptive Vector-Quantized Variational Autoencoder吴思雨,女,西安工程大学电子信息学院,2023级研究生,张宏伟人工智能课题组 研究方向:人工智能与机器视觉 电子邮件:2879944563@qq.com