技术栈
深度学习
昵称是6硬币
6 小时前
图像处理
·
人工智能
·
深度学习
·
yolo
·
目标检测
·
计算机视觉
YOLOv11: AN OVERVIEW OF THE KEY ARCHITECTURAL ENHANCEMENTS目标检测论文精读(逐段解析)
论文地址:https://www.arxiv.org/abs/2410.17725 Rahima Khanam and Muhammad Hussain Ultralytics公司发布 CVPR 2024
heimeiyingwang
9 天前
人工智能
·
深度学习
·
算法
【深度学习加速探秘】Winograd 卷积算法:让计算效率 “飞” 起来
在深度学习领域,卷积神经网络(CNN)被广泛应用于图像识别、目标检测、语义分割等任务。然而,卷积操作作为 CNN 的核心计算单元,其计算量巨大,消耗大量的时间和计算资源。随着模型规模不断增大,传统卷积算法的计算效率成为限制深度学习发展的一大瓶颈。
IAM四十二
9 天前
android
·
深度学习
·
tensorflow
Google 端侧 AI 框架 LiteRT 初探
学习和了解 Google 官方提供的 LiteRT 在 Android 的部署,以经典的手写数字识别模型为例,逐步了解 LiteRT 的使用方法。
小白菜333666
9 天前
人工智能
·
深度学习
·
算法
DAY 37 早停策略和模型权重的保存
@浙大疏锦行
yizhimie37
9 天前
深度学习
DAY 40 训练和测试的规范写法
@浙大疏锦行https://blog.csdn.net/weixin_45655710知识点回顾:作业:仔细学习下测试和训练代码的逻辑,这是基础,这个代码框架后续会一直沿用,后续的重点慢慢就是转向模型定义阶段了。
zeroporn
9 天前
人工智能
·
深度学习
·
算法
·
自然语言处理
·
embedding
·
word2vec
·
skip-gram
以玄幻小说方式打开深度学习词嵌入算法!! 使用Skip-gram来完成 Word2Vec 词嵌入(Embedding)
在浩瀚的修真界中,存在一种上古秘术名为《词嵌真经》。修士们发现,世间万物皆有其“道韵”,而语言中的每个字词都暗含天地法则。传统修炼方式需逐个参悟字词,耗时千年方能小成。
丶Darling.
9 天前
深度学习
·
神经网络
·
学习
深度学习与神经网络 | 邱锡鹏 | 第五章学习笔记 卷积神经网络
我们希望有一个新的网络可以提取局部不变性前两个输入都不卷,从第三个开始卷,因为滤波器的长度是3每次选定三个数卷,比如前三个,1,1,2
大模型最新论文速读
10 天前
人工智能
·
深度学习
·
机器学习
·
缓存
·
语言模型
·
自然语言处理
Agent成本降低46%:缓存规划器的思路模板
论文标题Cost-Efficient Serving of LLM Agents via Test-Time Plan Caching
丶Darling.
10 天前
深度学习
·
神经网络
·
学习
深度学习与神经网络 | 邱锡鹏 | 第七章学习笔记 网络优化与正则化
所以找个平坦最小值就好了,不一定需要全局最小值总体趋势还是减少的。时不时变大是为了找到更好的局部最优效果比随机梯度要好
SHIPKING393
10 天前
人工智能
·
深度学习
·
机器学习
【机器学习&深度学习】机器学习核心的计算公式:wx+b
目录前言一、什么是 wx + b?二、通俗理解:加权打分 + 起步线三、数学角度:向量点积 + 偏移四、在机器学习中的应用
抽风的雨610
10 天前
人工智能
·
python
·
深度学习
【python深度学习】Day 56 时序数据的检验
记忆口诀:p越小,落在置信区间外,越拒绝原假设。时序部分需要铺垫的知识非常多,相信这次应该说清楚了假设检验相关的基础知识。
苏苏susuus
10 天前
人工智能
·
pytorch
·
深度学习
深度学习:PyTorch人工神经网络优化方法分享(1)
简单来说,优化方法主要是从两个角度来入手,一个是梯度,一个是学习率。梯度下降法简单来说就是一种寻找使损失函数最小化的方法**。
丶Darling.
10 天前
深度学习
·
神经网络
·
学习
深度学习与神经网络 | 邱锡鹏 | 第六章学习笔记 循环神经网络
s是单个词的意思,b是一个词的开始,e是一个词的结束没有结果产生的部分就是编码部分,有结果产生的部分就是解码部分
喜欢吃豆
10 天前
网络
·
人工智能
·
python
·
深度学习
·
大模型
·
mcp
快速手搓一个MCP服务指南(一):FastMCP 快速入门指南详解
FastMCP 是一个用于搭建工具型服务器的框架,可通过简单的代码快速创建支持工具调用的服务。本指南旨在帮助用户从零开始搭建首个 FastMCP 服务器,涵盖服务器创建、工具添加、测试及运行的全流程。
全栈派森
10 天前
后端
·
深度学习
·
神经网络
机器学习第六课: 卷积神经网络
大家好,我是Petter Guo一位热爱探索的全栈工程师。在这里,我将用最接地气的方式,带你玩转前端、后端到 DevOps 的硬核技术,解锁AI,助你打通技术任督二脉,成为真正的全能玩家!!
王哥儿聊AI
10 天前
人工智能
·
深度学习
·
机器学习
LED-Merging: 无需训练的模型合并框架,兼顾LLM安全和性能!!
摘要:对预训练大型语言模型(LLMs)进行微调以适应特定任务,会带来巨大的计算和数据成本。虽然模型合并提供了一种无需训练的解决方案,用于整合多个特定任务的模型,但现有方法存在安全性与效用性之间的冲突,即增强通用能力会降低安全防护。我们发现了两个根本原因:由于简单的基于参数大小的选择,导致神经元误识别,以及在合并过程中不同任务的神经元相互干扰。为了解决这些挑战,我们提出了LEDMerging,这是一个三阶段框架,通过基于梯度的归因来定位特定任务的神经元,通过多模型重要性融合动态选择关键神经元,并通过参数隔离
广州山泉婚姻
10 天前
深度学习
写字楼里的薄荷糖
林小满第一次注意到陈屿,是在茶水间。她抱着一摞设计稿转弯,差点撞上迎面而来的人。文件散落一地,其中几张还沾了他手里马克杯溢出的咖啡。“抱歉抱歉!”林小满手忙脚乱地蹲下去捡,抬头时撞进一双含笑的眼睛里。
杰瑞学AI
10 天前
人工智能
·
深度学习
·
机器学习
全链接神经网络,CNN,RNN各自擅长解决什么问题
全连接神经网络(Fully Connected Neural Network, FCNN/DNN)、卷积神经网络(Convolutional Neural Network, CNN)和循环神经网络(Recurrent Neural Network, RNN)是深度学习中三种最基础且重要的架构,它们各自的核心设计理念使其擅长处理不同类型的数据和问题:
心灵Haven
10 天前
人工智能
·
深度学习
4-深度学习网络层
Embedding矩阵是可训练的参数,一般会在模型构建时随机初始化 也可以使用预训练的词向量来做初始化,此时也可以选择不训练Embedding层中的参数
马里马里奥-
10 天前
人工智能
·
深度学习
·
计算机视觉
深度学习和计算机视觉的关系的理解
深度学习作为人工智能的重要分支,近年来在计算机视觉领域取得了革命性突破。计算机视觉的核心任务包括图像分类、目标检测、语义分割等,而深度学习通过神经网络模型自动学习图像特征,极大提升了这些任务的准确率和效率。