深度学习

君为先-bey8 小时前
深度学习·音视频·transformer·扩散模型
CogVideoX——Transformer从文本到视频的扩散模型论文标题:CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer
青风978 小时前
网络·人工智能·深度学习·神经网络·计算机视觉
SDDGR:基于稳定扩散的深度生成重放,用于类增量对象检测(CVPR 2024)在类增量学习(CIL)领域,随着生成模型的不断改进,生成重放作为一种减轻灾难性遗忘的方法越来越受到重视,但其在类增量目标检测(CIOD)中的应用受到了很大的限制,主要原因是涉及多个标签的场景的复杂性。我们提出了一种新的CIOD方法,称为稳定扩散深度生成重放(SDDGR)。我们的方法利用基于扩散的生成模型和预先训练的文本到图像扩散网络来生成逼真和多样化的合成图像。SDDGR结合了迭代细化策略,以产生高质量的图像。包含旧类的高质量图像。此外,我们采用L2知识蒸馏技术来提高合成图像中先验知识的保留。此外,我们的
忆~遂愿9 小时前
人工智能·深度学习·神经网络·机器学习·自然语言处理·软件工程·知识图谱
《大模型驱动软件测试》| 软件工程3.0时代,大模型驱动测试实战指南朱少民同济大学特聘教授、CCF杰出会员,曾任思科(中国)软件有限公司QA资深总监、多个IEEE 国际学术会议程序委员、《软件学报》《计算机学报》等审稿人。
这是谁的博客?9 小时前
深度学习·ai·架构·transformer·ssm·mamba·状态空间模型
Mamba 状态空间模型深度解析:挑战 Transformer 的新一代架构本文深入解析 Mamba 状态空间模型(SSM)的核心原理,探讨其如何通过选择性状态空间机制实现线性时间复杂度的序列处理,并与 Transformer 架构进行全面对比。读者将理解 Mamba 的数学基础、架构设计及其在长序列建模中的优势与局限。
极光代码工作室12 小时前
人工智能·python·深度学习·机器学习
基于机器学习的二手商品价格预测系统随着电子商务与共享经济的蓬勃发展,二手交易市场持续扩容。据艾瑞咨询《2023年中国二手电商发展研究报告》显示,我国二手交易市场规模已达1.8万亿元,年增长率超22%,但交易过程中普遍存在定价不透明、估价主观性强、信息不对称严重等痛点,导致买卖双方信任度低、成交周期长、平台纠纷率高。针对该问题,本文设计并实现了一套基于机器学习的二手商品价格预测系统。系统以手机、笔记本电脑、数码相机三类高频二手商品为研究对象,构建端到端的数据采集—清洗—特征工程—建模—部署闭环流程。在算法层面,对比集成学习(XGBoost、
生成论实验室12 小时前
人工智能·深度学习·语言模型·机器人·自动驾驶
我们给AI装上了判断力AI能写诗、能编程、能聊天。但它有一个致命缺陷——它不知道自己不知道。你看,大模型从接收输入到生成输出,中间没有一个环节在判断“现在是什么情况”。它只是在统计概率的驱动下,沿着最可能的路径滑行。所以它会用最自信的语气编造一个完全错误的答案——不是它在撒谎,而是它根本没有“真假”的概念。
YOLO数据集集合13 小时前
人工智能·深度学习·无人机
智慧道路病害分割识别|公路裂缝坑洞智能检测 无人机巡检深度学习数据集城市路网与高速公路长期服役易出现裂缝、坑洼等结构性损伤,传统人工巡检效率低、覆盖有限、安全风险高。基于实例分割的AI视觉检测,正成为道路养护、智慧交通、基础设施数字化的核心技术。本数据集聚焦真实道路病害场景,提供高质量标注样本与完整YOLO训练流程,可快速落地路面缺陷自动识别系统。
AndrewHZ14 小时前
人工智能·深度学习·ai·语言模型·大模型·llm·transformer
【大模型技术博客】什么是大语言模型(LLM)?从零认识AI新范式摘要:本文是《大模型技术博客》系列的开篇之作。我们将从零开始,系统性地介绍什么是大语言模型(Large Language Model, LLM),它的发展历程、核心技术特点,以及它为什么是人工智能领域的一场"范式革命"。无论你是AI初学者,还是希望转型的开发者,这篇文章都将为你打开大模型技术的大门。
AI医影跨模态组学14 小时前
人工智能·科技·深度学习·机器学习·论文·医学影像
Nat. Biomed. Eng(1区top,IF=26.6)上海科技大学钱学军团队:一种用于乳腺癌风险分层的多模态机器学习模型01文献信息本次分享的文献是由上海科技大学钱学军团队联合安徽医科大学第一附属医院、南京医科大学附属南京医院、复旦大学附属肿瘤医院、宣城人民医院、阜阳肿瘤医院等多中心医疗机构于2024年10月在Nature子刊《Nature Biomedical Engineering》(中科院1区top,IF=26.6)上发表的研究“A multimodal machine learning model for the stratification of breast cancer risk”即一种用于乳腺癌风险分层的多
十年一梦惊觉醒15 小时前
人工智能·深度学习·bert
BERT模型应用智能客服方案方案旨在解决企业自有业务场景下,且设备预算有限的小成本智能客服方案。bert模型可运行在仅CPU设备环境,且相应速度迅速,可实现企业级智能体的搭建需求。同时结合freeswitch语音识别,即可完成呼叫中心智能客服功能,freeswitch语音识别可参照往期文章,有业务需求可邮箱mokeily99@126.com或主页咨询
快乐得小萝卜15 小时前
笔记·深度学习·机器学习
笔记:TREX工具-1trex 是基于 TensorRT 导出 JSON 文件的分析工具。工作流程:trex 分析依赖三个 JSON 文件:
Biomamba生信基地16 小时前
论文阅读·深度学习·生物信息学·模型训练
《Advanced Science》前沿工具发布:STAID,空间反卷积自优化深度学习框架文章《STAID: A Self-Refining Deep Learning Framework forSpatial Cell-Type Deconvolution with Biologically InformedModeling》(IF=14.1)发布于《Advanced Science》。
一次旅行16 小时前
人工智能·深度学习
Deepseek-V4-Flash 快速部署与调用实战指南在本地部署大语言模型时,最让人头疼的往往不是模型本身的复杂度,而是环境配置的“劝退”环节。很多开发者满怀信心地下载了模型权重,却在安装依赖、匹配 CUDA 版本或调整显存参数时卡了整整一天。更糟糕的是,当终于跑通 “Hello World” 后,面对推理速度慢、显存频繁溢出以及难以集成到现有业务代码中等实际问题,又显得束手无策。这种从“能跑”到“好用”之间的巨大鸿沟,阻碍了许多人将大模型真正应用到实际项目中。
凯丨17 小时前
人工智能·深度学习·神经网络
让 AI 通宵优化神经网络:Karpathy autoresearch 的设计哲学与启示Karpathy 今年 3 月开源的 autoresearch,做了一个极简却有力的实验:把一份 5 分钟训练预算的 nanochat 单 GPU 实现交给 AI 代理,让它自主改代码、跑训练、看指标、提交或回滚,循环往复。一夜之间,~100 次实验跑下来,nanochat 达到 GPT-2 等效水平的耗时从 2.02 小时压缩到 1.80 小时——端到端提速 11%。本文将拆解这套设计背后的关键取舍,并深入探讨它与经典 AutoML / NAS 的本质区别。
AI医影跨模态组学18 小时前
人工智能·深度学习·论文·医学影像·影像组学
Sci. Adv.(IF=12.5)首都医科大学宣武医院卢洁等团队:一种用于预测乳腺癌新辅助化疗病理完全缓解的多模态全自动系统01文献信息本次分享的文献是由首都医科大学宣武医院卢洁等团队联合北京大学深圳医院、青岛大学附属医院、复旦大学附属肿瘤医院等多中心合作团队于2025年4月30日在《Science Advances》(中科院1区top,IF=12.5)上发表的研究”A multimodal and fully automated system for prediction of pathological complete response to neoadjuvant chemotherapy in breast cance
lucky_syq18 小时前
人工智能·深度学习
【深度学习核心】注意力机制(Attention)详细解析在深度学习飞速发展的当下,注意力机制(Attention Mechanism)已经成为各大模型的核心基石,无论是NLP领域的Transformer、大语言模型,还是CV领域的图像分类、目标检测模型,都离不开注意力机制的加持。
砥锋20 小时前
深度学习·机器学习
图注意力网络(GAT)深度实战:原理推导+PyG代码+从零开始写GAT层(附注意力可视化)本文深入剖析图注意力网络(GAT)的核心思想,结合 Cora 数据集,既给出基于PyTorch Geometric 的高效实现,也手把手带你从零手写GAT层,彻底搞懂注意力机制的内部运作。
动物园猫20 小时前
深度学习·yolo·目标检测
水面5种垃圾目标检测数据集分享(适用于YOLO系列深度学习分类检测任务)链接:https://pan.baidu.com/s/1mWyiyUSh-YgixFvb5KxM9w?pwd=7a7m
AI算法沐枫20 小时前
人工智能·python·深度学习·线性代数·算法·机器学习·回归
机器学习经典小项目4:泰坦尼克号生存预测今天我准备学习泰坦尼克号生存预测小项目。我问腾讯元宝要代码来学习,不过,它给我的代码,每一个都运行失败,给了我4篇代码,4篇全是运行失败,timeout,应该是泰坦尼克号数据集下载不了吧。算了,看看能不能我自己去网上找一份泰坦尼克号数据集,或者自己手搓一份泰坦尼克号的数据集吧。
君为先-bey21 小时前
人工智能·深度学习·计算机视觉·扩散模型
LeMiCa——基于扩散的高效视频生成的词典序最小最大路径缓存论文标题:LeMiCa: Lexicographic Minimax Path Caching for Efficient Diffusion-Based Video Generation