深度学习

大模型最新论文速读29 分钟前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
合成数据的正确打开方式:格式比模型重要,小模型比大模型好用来自 Hugging Face 团队的系统实验:用 1.7B 小模型生成 486B token,效果碾压已有方案,成本降低 30 倍
菜鸟‍2 小时前
深度学习·学习·transformer
【论文学习】Transformer中的数据流动
昵称小白2 小时前
深度学习·batch
图像在深度学习里是怎么表示的:像素、通道、tensor、batch(二)这一篇要解决一个非常关键的问题:图像为什么能送进神经网络?你平时看到的是“人、车、猫、路灯、天空”。 但神经网络并不直接看到这些语义,它先看到的是:
阿_旭2 小时前
人工智能·python·深度学习·辣椒成熟度检测
基于YOLO26深度学习的【辣椒成熟度检测与计数系统】【python源码+Pyqt5界面+数据集+训练代码】《博主简介》小伙伴们好,我是阿旭。 专注于计算机视觉领域,包括目标检测、图像分类、图像分割和目标跟踪等项目开发,提供模型对比实验、答疑辅导等。
高洁012 小时前
人工智能·深度学习·数据挖掘·transformer·知识图谱
大模型在天文科研中的应用:天体数据分析大模型在天文科研中的应用:天体数据分析一、 天文学面临的数据挑战 二、 大模型如何助力天体分类 三、 从海量数据中发现罕见天体 四、 光谱分析与红移测量 五、 模拟与理论验证
白羊by2 小时前
网络·人工智能·深度学习·算法·损失函数
Softmax 激活函数详解:从数学原理到应用场景Softmax激活函数是深度学习中多分类任务的核心激活函数,其核心作用是将神经网络输出层的任意实数向量,映射为总和为1的概率分布,让每个输出值都能表示对应类别的预测概率,便于后续分类决策和损失计算。
-cywen-4 小时前
人工智能·深度学习
VAE(Variational AutoEncoder)VAE 是一种生成模型,它通过学习一个连续的潜在分布(而不是固定编码),使可以从这个分布中采样并生成新数据
Z.风止5 小时前
pytorch·深度学习·机器学习
Large Model-learning(6)继续小土堆,并且尝试复现大模型项目。新建文件 train.py。之前已经搭建过,按照这张图去搭建。一种比较常用的方法是将网络放入单独的python文件里,需要的时候进行引入,所以新建model.py文件。可以直接在这个文件里去测试网络的正确性。
AI先驱体验官6 小时前
大数据·人工智能·深度学习·重构·aigc
BotCash:Nvidia企业级Agent生态,智能体平台战争的新变量当17家企业软件巨头排队接入Nvidia Agent Toolkit,当Adobe、Salesforce、SAP同时宣布支持同一个AI平台,一个被低估的信号正在发送:智能体变现的战场正在从“个人开发者”转向“企业级服务”。这不是一场技术竞赛,而是一场生态战争。BotCash等国内智能体变现平台,需要在这一天到来之前,找到自己的生态位。
jr-create(•̀⌄•́)6 小时前
人工智能·深度学习·神经网络
Deep Learning入门---神经网络概念重点名词:第三章主要介绍了神经网络的基本概念、结构以及实现方法,重点包括以下内容:神经网络由输入层、隐藏层(中间层)和输出层构成,信号通过激活函数在层间传递。 感知机使用阶跃函数作为激活函数,而神经网络通常使用平滑的激活函数(如sigmoid函数),这是两者的主要区别。
AI先驱体验官6 小时前
大数据·人工智能·深度学习·microsoft·重构·开源·交互
臻灵:数字人+大模型,实时交互的技术临界点在哪里当数字人可以听懂你的情绪,当虚拟主播可以即兴回答弹幕问题,当企业客服不再是机械地回复"您好,请问有什么可以帮助您"——我们正在见证数字人从"数字形象"向"数字员工"的质变。这个质变的关键,是数字人与大模型的深度融合。2026年,这项技术正在逼近一个临界点:数字人不仅"像人",更"懂人"。
AI医影跨模态组学8 小时前
人工智能·深度学习·论文·医学·医学影像
Radiology: Imaging Cancer 北京大学人民医院洪楠等团队:基于髋骨参考框架的非增强CT自动骶骨肿瘤分类流程评估01文献学习今天分享的是由北京大学人民医院洪楠团队联合山西人民医院放射科等团队于2026年1月8日在《Radiology: Imaging Cancer》(中科院2区,IF=6.3)上发表的研究“Assessing an Automated Noncontrast CT–based Pipeline for Sacral Tumor Classification Using a Hip Bone Reference Frame”即基于髋骨参考框架的非增强CT自动骶骨肿瘤分类流程评估,本研究开发了一种全自动
王莎莎-MinerU8 小时前
人工智能·深度学习·计算机视觉·chatgpt·pdf·软件工程
MinerU 生态全景:Skills、RAG、MCP、Cursor Rules2026年4月,Anthropic MCP 生态刚过 9700 万次安装;同月,MinerU2.5-Pro 论文(arXiv:2604.04771)发布,用 1.2B 参数在新版评测基准 OmniDocBench v1.6 上拿到 95.69 分,超过了包括 Qwen3-VL-235B、Gemini 3 Pro 在内的所有已知方法。
mahtengdbb18 小时前
人工智能·深度学习·yolo
GDSAFusion全局-局部双尺度自适应融合改进YOLOv26多尺度特征表达能力在目标检测任务中,多尺度特征融合是提升模型性能的关键技术之一。传统的特征融合方法通常采用简单的拼接或相加操作,这种方式缺乏对不同尺度特征之间语义差异的自适应建模能力,导致融合后的特征表达能力受限。为了解决这一问题,本文引入GDSAFusion(Global-Local Dual-Scale Adaptive Fusion)模块来改进YOLOv26的特征融合策略。
翔云1234568 小时前
人工智能·深度学习·机器学习
一文读懂人工智能,机器学习,深度学习,神经网络,Transformer定义:让机器具备感知、推理、决策、理解、创造等类人智能的技术总称。 包含内容定义:不硬写死规则,让机器从数据中自动学规律,从而完成预测、分类、决策。 包含内容
大模型最新论文速读10 小时前
人工智能·深度学习·算法·机器学习·自然语言处理
VQKV:KV Cache 压缩 82% 性能几乎不降VQKV 用向量量化把 KV cache 从"每个 token 存一长串浮点数"改成"存几个共享码本的索引编号",在压掉 82.8% 的缓存后仍保留 98.6% 的原始性能
AI周红伟10 小时前
人工智能·深度学习·机器学习·语言模型·openclaw
周红伟:RAG 与知识检索RAG(Retrieval-Augmented Generation,检索增强生成)是目前最主流的 LLM 落地架构之一。
乐园游梦记10 小时前
人工智能·深度学习·机器学习·开源
工业检测场景下自监督与无监督开源方案OpenMMLab+PatchCore 与其他方案对比分析核心结论:在特定工业场景下,Anomalib 集成方案、EfficientAD、SubspaceAD和Reverse Distillation等开源工具在速度、精度或部署便捷性上可能更优。选择的关键在于匹配 “检测精度、推理速度、标注成本、硬件资源” 四大工业核心需求,而非单纯追求技术先进性。
金融小师妹10 小时前
大数据·人工智能·深度学习·svn·能源
基于机器学习的黄金定价模型:风险不确定性下降后的结构重估摘要:本文通过构建AI宏观情景分析模型,结合能源价格路径、利率预期变化与市场情绪因子,系统分析黄金在预期修复阶段的定价逻辑,并评估金价是否正处于关键转折窗口。
jr-create(•̀⌄•́)10 小时前
人工智能·python·深度学习
Deep Learning入门---基本概念只总结概要,细节请看书中内容《深度学习入门:基于Python的理论与实现》 Deep Learning from Scratch