深度学习

大模型最新论文速读2 小时前
论文阅读·人工智能·深度学习·机器学习·缓存·自然语言处理
小红书提出 RedKnot:分头处理 kv 缓存,延时降低 60%效果还提升现有的 PIC 方案(位置无关 KV 缓存复用)实际加速效果并不明显,RedKnot 在注意力头粒度上复用和重算缓存,配合分层稀疏 FFN 和 SegPagedAttention,在答案质量不降的前提下,把首 token 延迟最高压到原来的约 1/3.5
星浩AI2 小时前
pytorch·深度学习·llm
(七)GPT2中文生成模型定制化微调训练[附源码]上一篇文章完成了 BERT 微调效果的系统测试与验收指标设计。本章进入生成式模型领域:使用 Hugging Face 上的 GPT-2 中文预训练模型,在本地语料上微调,训练一个中文古诗词生成模型。
卡梅德生物科技小能手3 小时前
人工智能·经验分享·深度学习
卡梅德生物科普MCAM(黑色素瘤细胞黏附分子)在人体复杂的细胞微环境与组织发育过程中,细胞间的“沟通”与“黏合”至关重要。MCAM,全称为黑色素瘤细胞黏附分子(Melanoma Cell Adhesion Molecule),也被称为CD146,是免疫球蛋白超家族中的一员,作为一种关键的跨膜糖蛋白,它不仅是细胞间交流的“黏合剂”,更在血管健康和组织稳态中扮演着不可或缺的角色。本文将从靶点属性、疾病关联、作用机制及应用趋势四个维度,系统解析MCAM的生物学价值与研究前景。
月疯3 小时前
开发语言·python·深度学习
torch:expand和repeate的区别规则:只能将 size=1 的维度扩展为更大。内存:返回视图(与原张量共享数据),高效。语法:tensor.expand(*target_shape)
xianghongtao01164 小时前
人工智能·深度学习·性能优化·prompt
把 Prompt 当成“可训练参数“:SkillOpt 如何用深度学习的纪律去优化 Agent 技能当我们把一个前沿大模型部署成 Agent,真正想做领域适配时,习惯性的三条路是:调权重、改 Prompt、或者上 RAG。但对闭源的前沿模型来说,权重根本动不了;而 Prompt 优化又往往停留在"手写—跑一跑—感觉不行再改改"的手工作坊阶段。
装不满的克莱因瓶5 小时前
人工智能·pytorch·python·深度学习·神经网络·机器学习·ai
PyTorch 与它的自动微分工具:Autograd目录前言一、什么是 Autograd二、Autograd 的核心思想三、requires_grad 的作用
EQUINOX15 小时前
人工智能·深度学习·机器学习
【ch03】Coding-attention-mechanisms原书这章主要就是搓了下注意力模块,总体还是非常easy的本章代码:ch03作者没有一上来就手撕多头注意力机制或者说子注意力机制,而是用了一个思想相同,但是实现上简化的一个简单版本的注意力机制。
老饼讲解-BP神经网络5 小时前
人工智能·深度学习·神经网络
具体说说-RBF神经网络-newrbe函数和newrb函数的区别刚开始接触RBF神经网络时,会发现matlab提供了newrb和newrbe两个函数来构建RBF神经网络,那到底该使用哪一个呢?其实只要知道它们的区别,自然就知道该使用哪一个了。下面我们就来说说newrb和newrbe的区别。
机器学习之心6 小时前
深度学习·算法·cnn-lstm·shap分析·198种组合算法
198种组合算法+优化CNN-LSTM+SHAP分析+新数据预测+多输出!深度学习可解释分析,强烈安利,粉丝必备摘要:本文介绍了一套基于MATLAB的完整回归预测解决方案,融合22种智能优化算法、CNN-LSTM深度学习网络与SHAP可解释性分析,支持多输出预测与新数据推理。通过粒子群优化(PSO)自动搜索最优网络超参数,结合SHAP值量化各输入特征的贡献度,实现高精度预测与模型透明化的双重目标。实验结果表明,优化后的模型在测试集上RMSE降低约11%,R2达到0.975以上。
小糖学代码6 小时前
人工智能·深度学习·机器学习
机器学习:5.深度学习深度学习(Deep Learning)是一种有着多个层次的表征学习方式,通过简单但非线性的模块,自动地将每个层次的特征(从原始输入开始)转变为更高级抽象的表征形式。它主要通过神经网络来实现。
yuegu7776 小时前
深度学习·harmonyos
HarmonyOS应用<节气通>开发第24篇:响应式布局设计响应式布局是现代应用开发的重要组成部分,能够让应用在不同屏幕尺寸和设备上都有良好的显示效果。本文将介绍如何在HarmonyOS应用中实现响应式布局,包括:
m沐沐7 小时前
人工智能·pytorch·python·深度学习·机器学习·pycharm·cnn
【深度学习】PyTorch CNN 手写数字识别(卷积神经网络)使用 PyTorch 框架搭建卷积神经网络(CNN),识别 MNIST 数据集中的手写数字(0-9)。 简单来说:让电脑学会看懂手写的 0-9 数字,就像人认数字一样。 在运行代码前,必须安装依赖库,打开电脑的命令提示符(CMD)/ 终端,执行以下命令:
San813_LDD7 小时前
人工智能·深度学习
[深度学习]Promot标题预测实战:来自DeepSeek的心路历程分析———一个关于“猜你喜欢”式标题推荐的实验记录前几天,一位博主朋友给我发来一长串CSDN文章链接,说:“帮我给每篇起个标题,原来的太朴素了,发出去没人点。”我看了看——`[QT]日志与调试`、`[Excel]函数嵌套`、`[Python/R]绘图巧思`……内容其实都挺有料,但标题确实像实验室里的试管标签:准确,但毫无阅读欲望。于是我开始帮他逐篇拟定新标题。做着做着,我忽然冒出一个念头:能不能先预测他会选哪个?这就是“标题预测实验”的由来——连续29轮,每篇我给出2~4个备选,标出我最推荐的“方案一”,然后
王莎莎-MinerU7 小时前
人工智能·深度学习·机器学习·pdf·ocr·个人开发
从 OCR 到 Context Engineering:用 MinerU 搭一个可复现文档解析评测过去我们说文档解析,很多人脑子里想的是 OCR:把图片里的字识别出来就行。但到了 Agent 和 RAG 的场景,这个标准已经不够了。
叫我:松哥7 小时前
人工智能·python·深度学习·神经网络·算法·cnn
基于卷积神经网络的静态手势语识别算法,在测试集上的识别准确率达到97.5%1前言随着人工智能技术的飞速发展,人机交互方式正经历着从传统的键盘、鼠标向更自然、更直观的交互方式转变。语音识别、手势语识别、人脸识别等自然交互技术逐渐成为研究热点,在智能家居、医疗康复、虚拟现实、游戏娱乐等领域展现出巨大的应用潜力。
虎妞05007 小时前
pytorch·深度学习·ai·模型部署·cuda
PyTorch 2.0 生产级部署与性能优化指南torch.compile 通过图捕获和算子融合将训练速度提升 30-200%。三种模式:default(平衡)、reduce-overhead(小 batch 优化)、max-autotune(极致推理性能)。
独自归家的兔7 小时前
人工智能·深度学习
Claude Fable 5 与 Claude Mythos 5 全面解析及定价策略分析近年来,生成式 AI 领域竞争愈发激烈,各大厂商纷纷推出多样化产品以满足不同用户需求。Anthropic 作为其中的佼佼者,其 Claude 系列模型在性能、可用性和安全性方面都展现了明显优势。本文将重点解析 Claude Fable 5 与 Claude Mythos 5 两款模型,从功能特性、使用场景、定价策略到市场策略进行全面分析,帮助开发者和企业用户更好地理解和选择。
YOLO数据集集合7 小时前
人工智能·深度学习·目标检测·无人机
智能道路病害识别 公路巡检深度学习数据集实战 | 路面缺陷检测 无人机视觉 道路养护AI方案10299期标签:#计算机视觉 #深度学习 #目标检测 #路面病害识别 #公路智能巡检 #YOLO实战 #基础设施监测 #无人机视觉检测
月疯7 小时前
人工智能·pytorch·深度学习
torch:transpose和permute的用法图像通道调整:(B, H, W, C) → (B, C, H, W) 用 permute(0, 3, 1, 2)
直接冲冲冲7 小时前
人工智能·pytorch·深度学习
pytorch-深度学习-引言(1)传统软件开发特点(2)传统编程的局限面对天气预测、问答、图像识别、个性化推荐等任务,人工难以设计完整逻辑:任务模式动态变化、内在关联极度复杂,相关计算也超出人类认知与设计能力。