论文阅读

zenpluck6 小时前
论文阅读
GS-SLAM论文阅读--SplatMAP如今提升GS-SLAM的几何结构也是一个趋势,很多方法会采用深度信息和法线对高斯场景进行约束。本文也是如此,他优化了边缘场景,并且使用了一个致密化策略,而且是最近发布的,个人觉得很值得参考。
zenpluck6 小时前
论文阅读
GS论文阅读--Hard Gaussian Splatting本文也是对高斯点云的分布进行优化的,看!为了解决上面分析的问题,本文提出了硬高斯溅射,被称为HGS,从多视图显著的位置梯度和渲染误差中发现硬高斯。通过这种方式,我们的方法可以生长和优化这些硬高斯,以恢复更完整的3D场景,从而提高渲染质量。
好评笔记8 小时前
论文阅读·深度学习·机器学习·计算机视觉·面试·aigc·transformer
AIGC视频扩散模型新星:Video 版本的SD模型大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细介绍慕尼黑大学携手 NVIDIA 等共同推出视频生成模型 Video LDMs。NVIDIA 在 AI 领域的卓越成就家喻户晓,而慕尼黑大学同样不容小觑,他们深度参与了最初 SD 系列图像生成模型的研发,在扩散模型领域,展现出了强劲实力 。
XLYcmy10 小时前
论文阅读·物联网·网络安全·静态分析·漏洞挖掘·动态分析·固件
三篇物联网漏洞挖掘综述由于物联网设备存在硬件资源受限、硬件复杂异构, 代码、文档未公开的问题, 物联网设备的漏洞挖掘存在较大的挑战:
__如果20 小时前
论文阅读·qwen
论文阅读--Qwen2&2.5技术报告所有模型都是在超过7 trillion token(7万亿)的高质量、大规模数据集上预训练的沿用Qwen(Bai等人,2023a)的做法,我们采用了基于字节级字节对编码的相同Tokenizer
好评笔记1 天前
论文阅读·人工智能·深度学习·机器学习·计算机视觉·面试·aigc
AIGC视频生成模型:Stability AI的SVD(Stable Video Diffusion)模型大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细介绍Stability AI的视频生成模型SVD(Stable Video Diffusion)模型,这家公司在图像生成领域富有盛名,开发并维护了知名开源项目SD系列图像生成模型。SVD是他们在视频生成领域的尝试,主要贡献是:系统的视频数据整理工作流程,支持文本到视频、图像到视频生成和3D合成(物体从单一视角到多视角的转化)。
zenpluck1 天前
论文阅读
GS论文阅读--GeoTexDensifier本文是一个关于高斯致密化策略对高斯地图进行优化,他主要关注了几何结构和纹理信息。我最近对于高斯点的分布比较感兴趣,因为高斯点的分布决定了之后重建质量的好坏,初始化高斯很重要,但之后的维护需要致密化与修建策略,同样也很重要,我想要通过提升高斯点云的位置信息,从而使得效果达到更好。
feifeikon1 天前
论文阅读
大模型GUI系列论文阅读 DAY2续2:《使用指令微调基础模型的多模态网页导航》自主网页导航的进展一直受到以下因素的阻碍:在本研究中,我们探讨了基于视觉-语言基础模型的数据驱动离线训练方法,以改进网页代理的性能。我们提出了一种名为 WebGUM 的指令跟随多模态代理,该代理能够同时观察网页截图和HTML 页面,并输出网页导航操作,例如点击和输入文本等。
墨绿色的摆渡人1 天前
论文阅读
论文笔记(六十三)Understanding Diffusion Models: A Unified Perspective(一)引用:原文: https://arxiv.org/abs/2208.11970 代码、数据和视频:https://arxiv.org/abs/2208.11970
好评笔记2 天前
论文阅读·人工智能·深度学习·机器学习·计算机视觉·aigc·transformer
AIGC视频生成模型:ByteDance的PixelDance模型大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance,论文于2023年11月发布,模型上线于2024年9月,同时期上线的模型还有Seaweed(论文未发布)。
feifeikon2 天前
论文阅读·人工智能·语言模型
大模型GUI系列论文阅读 DAY2:《ScreenAgent:一种基于视觉语言模型的计算机控制代理》摘要 现有的大语言模型(LLM)能够调用多种工具和 API 以完成复杂任务。计算机作为最强大和最通用的工具,可能可以被训练后的 LLM 代理直接控制。借助计算机的强大能力,我们有望构建一个更通用的智能代理,以在各种日常数字化工作中协助人类。在本文中,我们构建了一个环境,使视觉语言模型(VLM)代理能够与真实的计算机屏幕进行交互。在该环境中,代理可以通过观察屏幕截图,并通过输出鼠标和键盘操作来操控图形用户界面(GUI)。
lovep12 天前
论文阅读·数据质量·大模型算法
Data Filtering Network 论文阅读和理解目录一、TL;DR二、Introduction2.1 apple的结论2.2 业界做法:2.3 我们的做法(Apple)
Eastmount2 天前
论文阅读·系统安全·powershell·自编码器·恶意代码检测
[论文阅读] (36)C&S22 MPSAutodetect:基于自编码器的恶意Powershell脚本检测模型《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学术路上期待与您前行,加油。
好评笔记2 天前
论文阅读·人工智能·深度学习·机器学习·计算机视觉·面试·aigc
AIGC视频生成国产之光:ByteDance的PixelDance模型大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance,论文于2023年11月发布,模型上线于2024年9月,同时期上线的模型还有Seaweed(论文未发布)。
feifeikon2 天前
论文阅读
大模型GUI系列论文阅读 DAY2续:《一个具备规划、长上下文理解和程序合成能力的真实世界Web代理》摘要 预训练的大语言模型(LLMs)近年来在自主网页自动化方面实现了更好的泛化能力和样本效率。然而,在真实世界的网站上,其性能仍然受到以下问题的影响:(1) 开放领域的复杂性,(2) 有限的上下文长度,(3) 在 HTML 结构上的归纳偏差不足。
qq_416276423 天前
论文阅读
VIT论文阅读与理解图1:模型概述。我们将图像分割成固定大小的补丁,线性嵌入每个补丁,添加位置嵌入,并将结果向量序列馈送到标准Transformer编码器。为了执行分类,我们使用标准方法向序列中添加一个额外的可学习的“分类令牌”。
wzx_Eleven4 天前
论文阅读·人工智能·机器学习·网络安全·密码学
【论文阅读】VCD-FL: Verifiable, collusion-resistant, and dynamic federated learning传统的联邦学习存在一些问题:拉格朗日插值 拉格朗日插值是指一种可以通过所有给定数据点准确构造多项式的方法。给定有 n 个点的集合 { ( x i , y i ) } i = 1 n \{(x_i,y_i)\}_{i=1}^n {(xi,yi)}i=1n ,我们可以使用这 n 个点拟合一个唯一的 n-1 阶多项式:
小张的读博日记4 天前
论文阅读
论文笔记-NeruIPS2024-LLM-ESR论文下载: LLM-ESR: Large Language Models Enhancement for Long-tailed Sequential Recommendation 代码: LLM-ESR
dundunmm5 天前
论文阅读·人工智能·算法·数据挖掘·聚类·深度聚类
论文阅读:Structure-Driven Representation Learning for Deep ClusteringXiang Wang, Liping Jing, Huafeng Liu, and Jian Yu. 2023. Structure-Driven Representation Learning for Deep Clustering. ACM Trans. Knowl. Discov. Data 18, 1, Article 31 (January 2024), 25 pages. https://doi.org/10.1145/3623400
小虚竹5 天前
论文阅读·chatgpt·ai写作
使用 ChatGPT 生成和改进你的论文我是虚竹哥,目标是带十万人玩转ChatGPT。ChatGPT 是一个非常有用的工具,可以帮助你生成、优化和扩展写作内容。无论你在进行研究、创意写作还是处理专业任务,了解如何有效利用 ChatGPT 来创作高质量的写作是至关重要的。以下是一些实用的技巧,帮助你在写作过程中更好地使用 ChatGPT,以及每一点的实战示例。