论文阅读

Jamence9 小时前
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
多模态大语言模型arxiv论文略读(118)➡️ 论文标题:VoiceWukong: Benchmarking Deepfake Voice Detection ➡️ 论文作者:Ziwei Yan, Yanjie Zhao, Haoyu Wang ➡️ 研究机构: 华中科技大学 ➡️ 问题背景:随着文本转语音(TTS)和语音转换(VC)技术的快速发展,检测深度伪造语音(Deepfake Voice)变得越来越重要。然而,学术界和工业界缺乏一个全面且直观的基准来评估检测器。现有的数据集在语言多样性方面有限,且缺乏在实际生产环境中遇到的多种操作。 ➡️
zsq20 小时前
论文阅读·笔记·nlp·大语言模型幻觉
【论文阅读笔记】HaDes幻觉检测benchmarkLLM幻觉检测现有方法缺点:提出 令牌级(token-level)、无参考(reference-free) 的幻觉检测任务,无需依赖外部参考文本,直接检测文本中单个令牌的幻觉风险。同时,构建了上述任务的数据集 HaDes。构建流程如下:
*Lisen20 小时前
论文阅读
论文笔记 -《MegaBlocks- Efficient Sparse Training with Mixture-of-Experts》MegaBlocks: 高效的稀疏MoE训练1 Stanford University, Stanford, California, USA 2 Microsoft Research, Redmond, Washington, USA 3 Google Research, Mountain View, California, USA. Correspondence to: Trevor [email protected]. 1、MoE的潜力与挑战
@Mr_LiuYang20 小时前
论文阅读·多模态融合·跨模态分割·deliver数据集·cmnext模型·并行池化混合器(ppx)·自查询中心(sq-hub)
Delivering Arbitrary-Modal Semantic Segmentation(CVPR2023)任意模态语义分割论文阅读paper:https://arxiv.org/pdf/2303.01480 Github:https://github.com/jamycheung/DELIVER
*Lisen20 小时前
论文阅读
论文笔记 - 《Implementing block-sparse matrix multiplication kernels using Triton》利用Triton实现高效、通用的块稀疏矩阵乘法 论文链接:https://openreview.net/pdf?id=doa11nN5vG
有Li1 天前
论文阅读·深度学习·计算机视觉
分割任意组织:用于医学图像分割的单样本参考引导免训练自动点提示方法|文献速递-深度学习医疗AI最新文献Title题目Segment Any Tissue: One-shot reference guided training-free automaticpoint prompting for medical image segmentation
Jamence1 天前
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
多模态大语言模型arxiv论文略读(119)➡️ 论文标题:ODE: Open-Set Evaluation of Hallucinations in Multimodal Large Language Models ➡️ 论文作者:Yahan Tu, Rui Hu, Jitao Sang ➡️ 研究机构: 北京交通大学 (Beijing Jiaotong University) ➡️ 问题背景:多模态大语言模型(Multimodal Large Language Models, MLLMs)在图像描述和视觉问答等任务中取得了显著进展,但这些模型面
LuH11241 天前
论文阅读·笔记·3d
【论文阅读笔记】高光反射实时渲染新突破:3D Gaussian Splatting with Deferred Reflection 技术解析会议 【SIGGRAPH Conference Papers '24】 作者 浙江大学计算机辅助设计与计算机图形学国家重点实验室 周昆教授团队
王上上1 天前
论文阅读
【论文阅读32】预期寿命预测(2024)论文聚焦于滑坡寿命(滑坡失效时间)的动态预测,针对经典预测模型(Verhulst模型、GM(1,1)模型和Saito模型)在动态条件下表现不足的问题,提出了一种基于机器学习(ML)的集成系统,**通过将多个经典模型的预测结果作为输入,**利用机器学习算法(尤其是决策树回归器DTR)构建元模型,实现对滑坡寿命的更准确预测。
张较瘦_1 天前
论文阅读·人工智能·软件工程
[论文阅读] 人工智能+软件工程(软件测试) | 当大语言模型遇上APP测试:SCENGEN如何让手机应用更靠谱想象一下:你手机里的购物APP每次更新后,可能藏着各种“坑”——比如点击“加入购物车”没反应,或者登录时突然闪退。传统的自动化测试方法像“无头苍蝇”一样随机点击屏幕,虽然能发现部分问题,但无法理解APP的真实使用场景(比如“搜索商品→加入购物车→结算”这一系列连贯操作),导致关键功能漏测。
张较瘦_2 天前
大数据·论文阅读·零售
[论文阅读] 系统架构 | 零售 IT 中的微服务与实时处理:开源工具链与部署策略综述Microservices and Real-Time Processing in Retail IT: A Review of Open-Source Toolchains and Deployment Strategies Aaditaa Vashisht (Department of Information Science and Engineering, RV College of Engineering, India), Rekha B S (Department of Information
王上上2 天前
论文阅读·cnn·lstm
【论文阅读31】-CNN-LSTM(2025)-电池健康预测本文提出了一个基于多模态充电数据和残差神经网络的 SOH 估算框架,利用真实 EV 车队大数据验证了方法的有效性,并实现开源发布,推动了电池健康管理从实验室走向实际应用。
张较瘦_3 天前
论文阅读·人工智能
[论文阅读] 人工智能 | 利用负信号蒸馏:用REDI框架提升LLM推理能力想象你在学数学题,老师只给你看正确解答,却从不讲解错误思路为啥错——这时候你可能会疑惑:“我怎么知道自己哪里容易踩坑?” 大语言模型(LLM)的蒸馏训练就面临类似问题。传统方法(如拒绝采样)只保留老师模型生成的正确推理痕迹(正样本),扔掉错误推理痕迹(负样本)。但这些负样本里藏着大量“避坑指南”:比如模型常犯的逻辑错误、边界条件遗漏等。 举个例子,在数学推理中,老师模型可能试过错误的公式套用或步骤顺序,这些失败案例对小模型学习“如何避免犯错”至关重要。但现有方法白白浪费了这些信息,导致小模型只能“学正确答
塔_Tass3 天前
论文阅读·机器学习·聚类·k-means
【论文阅读】:Weighted Graph Cuts without Eigenvectors:A Multilevel ApproachInderjit S. Dhillon, Yuqiang Guan, and Brian Kulis vol 29, TPAMI 2007
张较瘦_3 天前
论文阅读·人工智能·软件工程
[论文阅读] 人工智能+软件工程 | 理解GitGoodBench:评估AI代理在Git中表现的新基准GitGoodBench: A Novel Benchmark For Evaluating Agentic Performance On Git Tobias Lindenbauer, Egor Bogomolov, Yaroslav Zharov Cite as: arXiv:2505.22583 [cs.SE]
人有一心3 天前
论文阅读·学习
【论文阅读】多任务学习起源类论文《Multi-Task Feature Learning》该论文提出了一种通过低纬度表征多任务共性的方法.通过建立一个1维范式问题将多任务共同学习特征数进行正则化.这个问题等价于一个凸优化问题,用迭代算法进行求解.整个算法可以理解为非监督模块与监督模块,前者学习多任务的共同表征,后者使用该表征学习每个任务的目标.
Jamence3 天前
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
多模态大语言模型arxiv论文略读(113)➡️ 论文标题:Grounded Multi-Hop VideoQA in Long-Form Egocentric Videos ➡️ 论文作者:Qirui Chen, Shangzhe Di, Weidi Xie ➡️ 研究机构: Shanghai Jiao Tong University ➡️ 问题背景:当前的视频问答(VideoQA)系统在处理长形式的自拍视频时,面临多跳推理和时间定位的挑战。这些系统通常只能基于单一时间点的视觉线索回答问题,而无法处理需要跨多个时间间隔的信息整合和推理的任务。此外
寻丶幽风4 天前
论文阅读·笔记·深度学习·网络安全·差分测试
论文阅读笔记——Muffin: Testing Deep Learning Libraries via Neural Architecture FuzzingMuffin 论文Muffin首先生成DAG作为结构信息,然后利用一种贪婪的层选择算法来生成层信息。通过这种方式,Muffin能够生成多样化的DL模型。为了进行差异性测试,Muffin在模型训练阶段执行数据跟踪分析。特别是,Muffin从不同的训练阶段(即正向计算(FC)、损失计算(LC)和反向计算(BC))收集数据跟踪。然后,它根据一套提出的指标来检测不同库之间的不一致性,这些指标衡量连续层的输出变化。 借鉴 NAS 生成模版,生成 chain structure with skips、cell-bas
学术交流4 天前
论文阅读·无人机·论文笔记·航天技术
【投稿优惠】2025年航天技术 、雷达信号与无人机应用国际会议 (ATRA 2025)2025年航天技术、雷达信号与无人机应用国际会议(ATRA 2025)即将在福州拉开帷幕。本次大会将吸引来自世界各地的航天工程师、雷达技术专家、无人机开发者以及相关领域的学者和研究人员齐聚一堂,共同探讨航天技术、雷达信号处理及无人机应用的最新进展。