论文阅读

CXR-LT 2024：一场关于基于胸部X线的长尾、多标签和零样本疾病分类的MICCAI挑战赛|文献速递-深度学习人工智能医疗图像Title题目CXR-LT 2024: A MICCAI challenge on long-tailed, multi-label, and zero-shotdisease classification from chest X-ray

B612 little star king

UNIKGQA论文笔记知识图上的多跳问题回答（KGQA）的目的是在大规模知识图谱（KG）上找到自然语言问题中提到的主题实体，然后进行多跳推理得到答案实体。

勤劳的进取家

论文阅读：Do As I Can, Not As I Say: Grounding Language in Robotic Affordances地址：Do As I Can, Not As I Say: Grounding Language in Robotic Affordances

[论文阅读]Attractive Metadata Attack: Inducing LLM Agents to Invoke Malicious ToolsAttractive Metadata Attack: Inducing LLM Agents to Invoke Malicious Tools

[论文阅读] 人工智能 + 软件工程 | 当AI成为文学研究员：Agentic DraCor如何用MCP解锁戏剧数据分析本文实现并评估了DraCor平台的Model Context Protocol（MCP）服务器，该服务器能让大型语言模型（LLM）自主调用DraCor的API工具进行戏剧数据分析。通过定性实验，研究团队评估了LLM在工具选择、使用正确性、效率和可靠性方面的表现，发现“Docstring Engineering”（文档字符串工程）——即通过精心设计工具文档优化LLM与工具的交互——至关重要。这项研究不仅展示了智能体AI在计算文学研究中的潜力，也为数字人文领域的可靠基础设施建设提供了方向。

多模态大模型研究每日简报【2025-08-21】训练数据相关MetaWild: A Multimodal Dataset for Animal Re-Identification with Environmental Metadata (https://arxiv.org/abs/2501.13368) 该论文提出了一个用于动物重识别的多模态数据集MetaWild，其中包含环境元数据，如温度和昼夜节律。作者还提出了 Meta-Feature Adapter (MFA)，一个可以集成到现有视觉-语言模型（VLM）的轻量级模块，利用环境元数据和视觉信息来提

Non-stationary Diffusion For Probabilistic Time Series Forecasting论文阅读笔记摘要时间序列数据受到潜在的物理动力学和外部影响，其不确定性通常随时间而变化。现有的去噪扩散概率模型（DDPMs）受到加性噪声模型（ANM）的恒定方差假设的限制，往往不能捕捉到这种非平稳性质。本文作者利用位置尺度噪声模型（LSNM）来放宽人工神经网络的固定不确定性假设，设计了一个基于扩散的概率预测框架，称为非平稳扩散（NsDiff），实现对不确定性的变化模式进行建模。具体来说，NsDiff将基于扩散的去噪条件生成模型与预训练的条件均值和方差估计器相结合，实现自适应端点分布建模。此外，还提出了一种不确定性感知

【论文阅读】SIMBA: single-cell embedding along with features（2）代码地址：https://github.com/pinellolab/simba当前大多数单细胞分析流程仅限于细胞嵌入，并且严重依赖聚类方法，而缺乏显式建模不同特征类型之间相互作用的能力。此外，这些方法往往针对特定任务进行定制，因为不同的单细胞问题通常以不同方式被提出。

【论文阅读69】-DeepHGNN复杂分层结构下的预测这篇论文提出的 DeepHGNN 框架，把层级时间序列预测问题转化为图学习问题，通过图神经网络 + 层级插值 + 端到端一致性来提升预测精度和层级一致性，在实验中优于现有方法。

【论文笔记】STORYWRITER: A Multi-Agent Framework for Long Story Generation论文标题：StoryWriter: A Multi-Agent Framework for Long Story Generation 论文作者：Haotian Xia, Hao Peng et al. (Tsinghua University) 论文链接：https://arxiv.org/abs/2506.16445 代码链接：https://github.com/THU-KEG/StoryWriter 未提供运行代码

论文阅读 2025-8-9 [DiC, DropKey]闲来没事，找点近一年的论文看看✨ 一句话总结：DiC用沙漏架构+稀疏跳跃+条件门控重构纯Conv3x3扩散模型，在速度碾压Transformer的同时性能反超，为实时生成任务开辟新路径。

【论文阅读】-《SIGN-OPT: A QUERY-EFFICIENT HARD-LABEL ADVERSARIAL ATTACK》原文链接：https://arxiv.org/pdf/1909.10773我们研究在访问受限情况下评估机器学习系统对抗鲁棒性的最实用问题设置：用于生成对抗样本的硬标签黑盒攻击设置，其中允许有限的模型查询，并且只向查询的数据输入提供决策（标签）。针对此问题已经提出了几种算法，但它们通常需要大量（>20,000）查询来攻击一个样本。其中，一种最先进的方法（Cheng et al., 2019）表明，硬标签攻击可以建模为一个优化问题，其目标函数可以通过额外的模型查询进行二分搜索来评估，从而可以应用零阶优化算法。

【论文阅读】-《HopSkipJumpAttack: A Query-Efficient Decision-Based Attack》Jianbo Chen∗ Michael I. Jordan∗ Martin J. Wainwright∗,† University of California, Berkeley∗ Voleon Group† {jianbochen@, jordan@cs., wainwrig@}berkeley.edu 原文链接:https://arxiv.org/pdf/1904.02144

[论文阅读] 软件工程工具 | EVOSCAT可视化工具如何重塑软件演化研究本文介绍了一款名为EVOSCAT的交互式可视化工具，旨在解决大规模软件演化历史数据的分析难题。该工具通过密度散点图将百万级事件（如代码提交）可视化，支持灵活的时间轴配置、 artifact 排序和颜色编码，帮助研究者快速掌握数据集全貌、比较不同软件 artifact 的演化节奏、发现异常模式（如克隆或分叉）、评估 artifact 新鲜度等。论文通过8个真实数据集（如OpenAPI描述、GitHub工作流配置、知名开源项目历史）展示了工具的实用性，并阐述了其设计思路、核心贡献与局限性。

论文阅读系列（一）Qwen-Image Technical Report本系列活动以“深研AI论文、提升科研能力、共享学习成果”为核心宗旨，聚焦人工智能领域的经典与前沿论文，通过系统性阅读、深度拆解与公开分享，实现个人科研素养的提升与知识价值的传递。

【论文笔记】Multi-Agent Based Character Simulation for Story Writing论文标题： Multi-Agent Based Character Simulation for Story Writing - In2Writing 2025 论文作者： Tian Yu, Ken Shi, Zixin Zhao, Gerald Penn 论文链接： https://aclanthology.org/2025.in2writing-1.9/ 论文领域：故事生成，多智能体系统，角色模拟

[论文阅读] 人工智能 | 当Hugging Face遇上GitHub：预训练语言模型的跨平台同步难题与解决方案该研究通过分析325个预训练语言模型（PTLM）家族的904个Hugging Face（HF）变体，揭示了上游GitHub（GH）与下游HF平台在提交活动上的差异与同步模式。研究发现，GH聚焦模型结构和训练基础设施优化，而HF侧重文档和部署配置；两者存在八种同步模式，其中"分散同步"占比39.4%，反映出跨平台协作的结构性脱节，最终提出改善模型发布流程的实践建议。

【论文阅读】SIMBA: single-cell embedding along with features（1）代码地址：https://github.com/pinellolab/simba当前大多数单细胞分析流程仅限于细胞嵌入，并且严重依赖聚类方法，而缺乏显式建模不同特征类型之间相互作用的能力。此外，这些方法往往针对特定任务进行定制，因为不同的单细胞问题通常以不同方式被提出。

AAAI爆款：目标检测新范式，模块化设计封神之作本文选自gongzhonghao【图灵学术SCI论文辅导】关注我们，掌握更多顶会顶刊发文资讯今天，为大家推荐一个兼具前沿性与实用价值的研究方向：目标检测。

图灵学术计算机论文辅导

论文推荐|迁移学习+多模态特征融合来gongzhonghao【图灵学术计算机论文辅导】，快速拿捏更多计算机SCI/CCF发文资讯～在Cvpr、NeurIPS、AAAI等顶会中，迁移学习+多模态特征融合正以“降成本、提性能、省标注”的绝对优势成为最热赛道。