技术栈
深度学习
副露のmagic
1 小时前
人工智能
·
深度学习
深度学习基础复健
来自《神经网络与深度学习》Neural Networks and Deep Learninghttps://nndl.github.io/ 邱锡鹏 xpqiu@fudan.
番茄大王sc
1 小时前
人工智能
·
深度学习
·
考研
·
学习方法
·
论文笔记
2026年科研AI工具深度测评(一):文献调研与综述生成领域,维普科创助手领跑学术严谨性
在AI大模型席卷全球的2026年,科研工作者迎来了工具层面的深刻变革。从文献检索到综述撰写,AI正在重塑整个学术流程。然而,面对通用大模型(如ChatGPT、Grok、DeepSeek等)在学术场景中频繁出现的“幻觉”问题(虚假引用、编造参考文献、逻辑偏差),一款真正基于版权学术数据库、强调可信与溯源的专用科研AI工具显得尤为珍贵。
爱吃泡芙的小白白
3 小时前
人工智能
·
深度学习
·
神经网络
·
模型压缩
神经网络压缩实战指南:让大模型“瘦身”跑得更快
在人工智能应用遍地开花的今天,动辄数百MB甚至数GB的神经网络模型已成为部署到移动端、边缘设备的“甜蜜负担”。模型压缩技术,作为连接前沿AI研究与产业落地的关键桥梁,正受到学术界与工业界的空前关注。本文将基于最新的技术调研,为你系统梳理量化、蒸馏、剪枝等核心技术的原理与进展,并结合移动端、NLP、工业视觉等典型场景的实战案例,提供一份从理论到实践的压缩技术全景指南。无论你是希望优化手机APP体验的开发者,还是致力于在边缘设备部署大模型的研究者,本文都将为你指明方向。
YelloooBlue
4 小时前
深度学习
·
conda
·
tensorflow
深度学习 SOP: conda通过命令快速构建指定版本tensorflow gpu环境。
在深度学习环境配置中,尤其是TensorFlow的GPU环境,对各个依赖的版本非常苛刻,本文旨在探索一种持续可用的SOP,方便配置任何版本的TensorFlowGPU环境。
AI即插即用
4 小时前
图像处理
·
人工智能
·
深度学习
·
神经网络
·
计算机视觉
·
视觉检测
即插即用系列 | AAAI 2026 WaveFormer: 当视觉建模遇上波动方程,频率-时间解耦的新SOTA
论文题目:WaveFormer: Frequency-Time Decoupled Vision Modeling with Wave Equation
逄逄不是胖胖
5 小时前
人工智能
·
深度学习
《动手学深度学习》-55-2RNN的简单实现
咚咚王者
5 小时前
人工智能
·
rnn
·
深度学习
人工智能之核心技术 深度学习 第四章 循环神经网络(RNN)与序列模型
第四章 循环神经网络(RNN)与序列模型如果说 CNN 是处理空间结构(如图像)的利器,那么 RNN(Recurrent Neural Network) 就是专为时间序列/顺序数据设计的深度学习模型。它在自然语言处理(NLP)、语音识别、时间序列预测等领域扮演着核心角色。
机 _ 长
6 小时前
python
·
深度学习
·
yolo
·
目标检测
·
机器学习
·
计算机视觉
YOLO26 改进 | 训练策略 | 知识蒸馏 (Response + Feature + Relation)
这篇文章给大家带来的是 YOLO26 知识蒸馏 (Knowledge Distillation) 的终极实战教程。我们将演示如何利用一个参数量更大的 YOLO26-M (Teacher) 模型来指导参数量较小的 YOLO26-N (Student) 模型进行训练。
美狐美颜sdk
6 小时前
前端
·
图像处理
·
人工智能
·
深度学习
·
美颜sdk
·
直播美颜sdk
·
美颜api
抖动特效在直播美颜sdk中的实现方式与优化思路
在直播行业高度同质化的今天,“清晰不卡”早已只是及格线,真正能让用户留下来的,往往是那些让画面“动起来”的细节体验。
Yeats_Liao
7 小时前
python
·
深度学习
·
神经网络
·
架构
·
开源
异步推理架构:CPU-NPU流水线设计与并发效率提升
在构建DeepSeek高性能推理服务时,我们往往将目光聚焦在昂贵的昇腾NPU算力上,却忽视了CPU在整个推理链路中的关键角色。实测数据显示,在未经优化的推理服务中,CPU与NPU的串行等待可能导致30%以上的算力浪费。
哥布林学者
7 小时前
深度学习
·
ai
吴恩达深度学习课程五:自然语言处理 第三周:序列模型与注意力机制(一)seq2seq 模型
此分类用于记录吴恩达深度学习课程的学习笔记。 课程相关信息链接如下:本篇为第五课第三周的内容,3.1和3.6的内容。
gsgbgxp
8 小时前
深度学习
·
ubuntu
WSL迁移至非系统盘
WSL 跨文件系统(即从 WSL 内部访问 /mnt/d/ 下的文件)读写性能确实较差,这会显著拖慢深度学习数据加载(Dataloader)的速度。可以选择将 WSL 发行版迁移到 D 盘,并将代码和数据移入 WSL 的文件系统内部(例如 /home/user/project)。
乾元
8 小时前
前端
·
网络
·
人工智能
·
深度学习
·
安全
·
架构
绕过艺术:使用 GANs 对抗 Web 防火墙(WAF)
⚠️ 免责声明 本文仅用于网络安全技术交流与学术研究。文中涉及的技术、代码和工具仅供安全从业者在获得合法授权的测试环境中使用。任何未经授权的攻击行为均属违法,读者需自行承担因不当使用本文内容而产生的一切法律责任。技术无罪,请将其用于正途。
机 _ 长
9 小时前
人工智能
·
深度学习
·
yolo
·
目标检测
·
计算机视觉
YOLO26 蒸馏改进全攻略:从理论到实战 (Response + Feature + Relation)
在深度学习落地应用中,我们常常需要在“高精度的大模型”和“高效率的小模型”之间做权衡。知识蒸馏 (Knowledge Distillation, KD) 技术打破了这一僵局:它允许我们训练一个轻量级的学生模型 (Student Model),通过模仿一个强大的教师模型 (Teacher Model) 的行为,从而在保持低计算成本的同时,获得接近大模型的性能。
轻览月
9 小时前
深度学习
·
机器学习
·
cnn
·
卷积神经网络
【DL】卷积神经网络
卷积其实是一种数学运算,常用于信号处理和图像处理领域。它的基本思想是将一个函数与另一个函数进行点积,并通过滑动窗口的方式计算整个输入数据的值。一维卷积的数学表示如下:
逄逄不是胖胖
9 小时前
pytorch
·
深度学习
·
机器学习
《动手学深度学习》-55-1RNN的复杂实现
可以看出结果可以正常输出,但是由于网络没有很好训练,所以结果几乎是乱猜
A尘埃
10 小时前
人工智能
·
深度学习
·
机器学习
数值特征标准化StandardScaler和类别不平衡SMOTE
标准差是衡量数据集中数值分散程度或变异程度的一个重要指标,标准差越大,表示数据点越分散;标准差越小,表示数据点越集中(方差是标准差的平方)
软件算法开发
10 小时前
深度学习
·
算法
·
matlab
·
lstm
·
一维时间序列预测
·
卷尾猴优化
·
csa-lstm
基于卷尾猴优化的LSTM深度学习网络模型(CSA-LSTM)的一维时间序列预测算法matlab仿真
目录1.程序功能描述2.测试软件版本以及运行结果展示3.部分程序4.算法理论概述CSA优化原理LSTM网络原理
高洁01
10 小时前
深度学习
·
算法
·
机器学习
·
数据挖掘
·
知识图谱
知识图谱如何在制造业实际落地应用
知识图谱如何在制造业实际落地应用一、 制造业知识图谱的核心特点 二、 典型落地应用场景 三、 落地实施五步法 四、 技术栈推荐 五、 挑战与应对 六、 未来趋势
逄逄不是胖胖
10 小时前
人工智能
·
深度学习
·
gru
《动手学深度学习》-56门控循环单元GRU
标准 RNN(Recurrent Neural Network)存在一个致命缺陷:无法捕捉长距离依赖(Long-term Dependencies)。