论文笔记

Jamence19 小时前
论文阅读·人工智能·深度学习·语言模型·论文笔记
多模态大语言模型arxiv论文略读(九十四)➡️ 论文标题:DenseFusion-1M: Merging Vision Experts for Comprehensive Multimodal Perception ➡️ 论文作者:Xiaotong Li, Fan Zhang, Haiwen Diao, Yueze Wang, Xinlong Wang, Ling-Yu Duan ➡️ 研究机构: Peking University、Beijing Academy of Artificial Intelligence (BAAI)、Dalian
学术-张老师1 天前
论文阅读·能源·论文笔记
【创新引领未来,能源与农业共舞】2025年能源科学与农业发展国际会议 (EESAD 2025) 征稿启事在全球气候变化、资源紧张以及人口增长的多重挑战下,能源科学和农业发展的交叉领域正在成为解决这些全球性问题的关键。为了进一步推动这两个领域的研究与应用,2025年能源科学与农业发展国际会议(EESAD 2025)将汇聚世界各地的专家学者,共同探讨前沿科技、分享研究成果,并促进跨学科合作。
Jamence2 天前
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
多模态大语言模型arxiv论文略读(八十七)➡️ 论文标题:MG-LLaVA: Towards Multi-Granularity Visual Instruction Tuning ➡️ 论文作者:Xiangyu Zhao, Xiangtai Li, Haodong Duan, Haian Huang, Yining Li, Kai Chen, Hua Yang ➡️ 研究机构: Shanghai Jiaotong University, Shanghai AI Laboratory, S-Lab, Nanyang Technological U
想看雪的瓜3 天前
论文阅读·论文笔记
Nature图形解析与绘制—热图的绘制及深入解析热图(Heatmap)是一种通过颜色编码的二维可视化图表,用不同颜色或色阶的区块直观展示数据的分布、密度或数值大小。
大模型任我行3 天前
人工智能·语言模型·自然语言处理·论文笔记
复旦:评估LLM作为教师模型的能力📖标题:Teach2Eval: An Indirect Evaluation Method for LLM by Judging How It Teaches 🌐来源:arXiv, 2505.12259
Jamence3 天前
论文阅读·人工智能·计算机视觉·语言模型·论文笔记
多模态大语言模型arxiv论文略读(八十八)➡️ 论文标题:MammothModa: Multi-Modal Large Language Model ➡️ 论文作者:Qi She, Junwen Pan, Xin Wan, Rui Zhang, Dawei Lu, Kai Huang ➡️ 研究机构: ByteDance, Beijing, China ➡️ 问题背景:多模态大型语言模型(MLLMs)在理解视觉输入并生成语言方面表现出色,广泛应用于图像描述、视觉问答和视频分析等领域。然而,这些模型在处理高分辨率和长时间视觉输入时,仍面临有效结合复
Jamence5 天前
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
多模态大语言模型arxiv论文略读(八十九)➡️ 论文标题:MMRo: Are Multimodal LLMs Eligible as the Brain for In-Home Robotics? ➡️ 论文作者:Jinming Li, Yichen Zhu, Zhiyuan Xu, Jindong Gu, Minjie Zhu, Xin Liu, Ning Liu, Yaxin Peng, Feifei Feng, Jian Tang ➡️ 研究机构: Midea Group、Shanghai University、University of
Jamence9 天前
论文阅读·人工智能·深度学习·语言模型·论文笔记
多模态大语言模型arxiv论文略读(八十三)➡️ 论文标题:LLaNA: Large Language and NeRF Assistant ➡️ 论文作者:Andrea Amaduzzi, Pierluigi Zama Ramirez, Giuseppe Lisanti, Samuele Salti, Luigi Di Stefano ➡️ 研究机构: CVLAB, University of Bologna ➡️ 问题背景:多模态大语言模型(MLLMs)在理解和生成文本方面表现出色,但它们在捕捉对象的外观和几何形状方面存在局限性。神经辐射场(N
Jamence9 天前
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
多模态大语言模型arxiv论文略读(八十)## MMWorld: Towards Multi-discipline Multi-faceted World Model Evaluation in Videos ➡️ 论文标题:MMWorld: Towards Multi-discipline Multi-faceted World Model Evaluation in Videos ➡️ 论文作者:Xuehai He, Weixi Feng, Kaizhi Zheng, Yujie Lu, Wanrong Zhu, Jiachen Li, Yu
陈苏同学10 天前
论文笔记
[已解决] LaTeX “Unicode character“ 报错 (中文字符处理)问题:写 LaTeX 文档,特别是包含中文时,经常遇到类似下图的 “Unicode character XXXXXX” 报错
学术交流13 天前
论文阅读·金融·区块链·论文笔记
2025年金融创新、区块链与信息技术国际会议(FRCIT 2025 2025)会议简称:FRCIT 2025 大会地点:中国·郑州 收录检索:提交Ei Compendex,CPCI,CNKI,Google Scholar等
PaperTen论文查重14 天前
论文笔记
毕业论文,如何区分研究内容和研究方法?这个问题问得太好了!😎“研究内容”和“研究方法”经常被初学者(甚至一些老油条)混淆,尤其写论文开题报告时,一不小心就“内容”和“方法”全混在一块儿,连导师都看懵。
摆烂仙君16 天前
aigc·论文笔记·毕设
无偿帮写毕业论文以下教程教你如何利用相关网站和AI免费帮你写一个毕业论文。毕竟毕业论文只要过就行,脱产学习这么多年,终于熬出头了,完成毕设后有空就去多看看亲人好友,祝好!
银河以北呀16 天前
人工智能·语言模型·论文笔记
通过推测搜索加速大型语言模型推理 (SpecSearch) 论文总结基于树搜索的推理方法(如思维树Tree-of-Thoughts)通过探索多个中间推理步骤,显著增强了大型语言模型(LLMs)的推理能力。然而,这些方法需要生成大量推理思考,导致推理延迟增加了几个数量级,严重限制了LLM在实时应用中的适用性。这种延迟主要源于思考生成环节,占据了超过91%的总推理时间,构成了效率的主要瓶颈。面对这些挑战,研究者们致力于开发一种能够在保持推理质量的同时显著加速基于树搜索的LLM推理过程的新框架。
学术交流21 天前
论文阅读·人工智能·数据挖掘·软件工程·论文笔记
2025年软件工程与数据挖掘国际会议(SEDM 2025)会议简称:SEDM 2025 大会地点:中国·太原 收录检索:提交Ei Compendex,CPCI,CNKI,Google Scholar等
Zhouqi_Hua24 天前
论文阅读·人工智能·笔记·语言模型·论文笔记
LLM论文笔记 27: Looped Transformers for Length Generalization长度泛化transformer结构优化1. RASP-L限制transformer无法处理包含循环的任务的长度泛化
学术交流1 个月前
论文阅读·图像处理·人工智能·论文笔记
2025年数字创意设计与图像处理国际会议 (DCDIP 2025)会议简称:DCDIP 2025 大会地点:中国·济南 收录检索:提交Ei Compendex,CPCI,CNKI,Google Scholar等
何大春1 个月前
论文阅读·深度学习·神经网络·计算机视觉·视觉检测·论文笔记
【视频时刻检索】Text-Video Retrieval via Multi-Modal Hypergraph Networks 论文阅读文章信息:发表于:WSDM '24 原文链接:https://dl.acm.org/doi/10.1145/3616855.3635757
黄雪超1 个月前
大数据·flink·论文笔记
Flink介绍——实时计算核心论文之MillWheel论文总结在实时数据处理领域,流处理系统扮演着关键角色,为用户提供更多及时的内容、帮助企业做出更快速的决策,并协助科学家从海量数据流中提取有价值的信息。然而,传统的流处理系统面临着诸多挑战,包括数据的正确性、系统的容错能力以及对时间窗口的准确处理。
c7691 个月前
人工智能·笔记·语言模型·论文笔记
【文献笔记】SatLM: Satisfiability-Aided Language Models Using Declarative PromptingSatLM: Satisfiability-Aided Language Models Using Declarative Prompting 原文代码