深度学习

生命是有光的4 小时前
人工智能·深度学习·cnn
【深度学习】卷积神经网络CNN假如我们要处理一个30*30的图片,那么平铺展开后,输入层就是900个神经元,假如下一层的神经元是1000个,那么这个全连接层的总参数量就是90w个,参数过于庞大!
泰恒5 小时前
人工智能·深度学习·yolo·机器学习·计算机视觉
国内外大模型的区别与差距当前(2026年)全球AI大模型格局已从“美国独大”演变为中美双雄并立、局部领域各有优劣的态势。根据斯坦福《2026年AI指数报告》,中美顶级模型性能差距已缩小至2.7%,国内模型在中文场景、落地成本、应用渗透上实现反超,但在底层原创、通用推理、芯片算力、全球生态上仍存差距。两者并非简单“强弱之分”,而是技术路线、战略目标、产业生态的系统性差异。
加勒比海带666 小时前
大数据·图像处理·人工智能·python·深度学习·目标检测·计算机视觉
目标检测算法——低空智能实验室开放数据集汇总附下载链接【点赞+收藏】
带娃的IT创业者6 小时前
深度学习·automl·调参·超参数调优·optuna·自动机器学习·ray tune
调参工具箱——Optuna、Ray Tune 入门📚 《从零到一造大脑:AI架构入门之旅》专栏 专栏定位:面向中学生、大学生和 AI 初学者的科普专栏,用大白话和生活化比喻带你从零理解人工智能 本系列共 43 篇,分为八大模块:
AI自动化工坊9 小时前
人工智能·深度学习·机器学习·ai·token·caveman
Caveman技能实战:优化AI对话风格实现65%的token成本节省如果你在使用Claude、GPT等AI编程助手时,发现token成本快速上涨,这篇文章将为你提供实用的解决方案。近期在HackerNews获得883点热议的Caveman技能,通过优化AI对话风格实现了平均65%的token节省。本文将从技术实现、安装配置、实际效果等方面进行全面解析。
tyler_download10 小时前
人工智能·深度学习·transformer
揉扁搓圆transformer架构:KL散度损失函数的说明深度学习网络以及基于transformer架构的大模型都可以看做是一个函数,我们把输入传递给函数进行运算,函数的输出就是我们想要的结果。例如我们在使用大模型编程时,我们把需要实现的功能用自然语言描述出来,这就对应函数的输入, 然后模型返回我们所需要的代码实现,这就是函数的输出。问题在于我们需要确定模型给出的答案却是是我们所需要的,在给定的例子中,我们要确保模型给出的代码能正确运行,同时代码实现的结果跟我们所描述的功能要一致。
蔡俊锋10 小时前
人工智能·深度学习·ai·ai学习
AI前沿动态高效追踪指南在 AI 技术爆炸式迭代的当下,信息过载已经成为从业者和学习者的核心痛点 —— 每天有上百篇新论文、数十个新模型发布,如何高效筛选高价值信息、精准追踪前沿动态,是跟上 AI 技术节奏的关键。
前端摸鱼匠10 小时前
人工智能·深度学习·面试·大模型·transformer·求职招聘
【AI大模型春招面试题21】什么是Transformer的“预归一化”与“后归一化”?两者的差异及影响?你好!咱们直接切入正题。这道题在现在的架构演进(尤其是从 BERT 到 LLaMA 系列)背景下,属于必考题。它不仅仅考察你对归一化层位置的记忆,更考察你对深层网络训练稳定性、梯度流以及现代大模型架构设计哲学的理解。
披着羊皮不是狼11 小时前
人工智能·深度学习
深度学习核心架构全解析1. CNN的本质2. 基于CNN的图像分类算法3. 基于CNN的图像检测算法处理完“空间”信息,接下来要处理“时间”信息。 4. 循环神经网络(RNN)
张二娃同学11 小时前
人工智能·python·深度学习·神经网络·yolo
深度学习入门:YOLOv5 与 Fast R-CNN的认识目标检测难的地方,不只是“能不能识别出来”,还在于“速度、精度和部署成本如何平衡”。YOLOv5 代表单阶段检测思路,强调实时性和工程落地;Fast R-CNN 代表两阶段检测思路,强调候选区域建模和区域级判别。本文从原理、结构、参数、指标和应用场景五个层面展开,对两者做一篇适合初学者阅读、也能直接用于选型参考的对比分析。
阿杰学AI11 小时前
人工智能·深度学习·ai·语言模型·aigc·sft·监督微调
AI核心知识119—大语言模型之 监督微调 (简洁且通俗易懂版)监督微调 (Supervised Fine-Tuning, 简称 SFT) 是把大语言模型从一个“野生学霸” 变成“全能助理” 的第一道关键工序。
AI先驱体验官12 小时前
大数据·人工智能·深度学习·重构·开源·aigc
臻灵:数字人形象驱动新突破,NVIDIA开源PersonaPlex带来的技术变局2026年4月,NVIDIA开源PersonaPlex数字人形象驱动代码库,这是数字人驱动领域首次出现的主流开源方案。与此同时,Google发布AI Edge Gallery展示边缘AI应用能力,本地化部署数字人的。形象驱动和边缘部署,两个技术变量同时突破,实时交互数字人的商业化落地从"可能"变为"可行"。本文从技术进展、场景落地、实践路径三个维度,系统探讨数字人技术的最新发展。
郝学胜-神的一滴12 小时前
人工智能·pytorch·python·深度学习·神经网络·程序人生·机器学习
激活函数:神经网络的「非线性灵魂」,让模型从“直线”走向“万能”在深度学习的世界里,激活函数是一个看似微小、却决定网络能力的核心组件。很多初学者会问:神经网络层层叠加,难道不是越深层能力越强?答案藏在一个关键逻辑里——没有激活函数,再深的网络,也只是一层线性回归。
Project_Observer12 小时前
大数据·数据库·深度学习·机器学习·深度优先
列表视图中的筛选列您知道吗?您可以在 Zoho Projects 中跨列表筛选列。这样,您无需频繁切换到筛选面板,即可快速缩小大型数据集的范围,从而更轻松地专注于当前工作中的重要内容。
极光代码工作室13 小时前
人工智能·python·深度学习·机器学习
基于机器学习的信用卡欺诈检测系统设计随着数字支付规模持续扩大,信用卡欺诈已成为全球金融安全的重大威胁。据2023年Nilson Report统计,全球因支付欺诈造成的损失高达410亿美元,其中约68%源于未被及时识别的异常交易。传统基于规则引擎的检测方法存在误报率高、泛化能力弱、难以应对新型欺诈模式等固有缺陷。本文针对高度不平衡(欺诈样本占比常低于0.1%)、高维稀疏、实时性要求严苛的信用卡交易数据特点,设计并实现了一套端到端的智能欺诈检测系统。系统采用SMOTE-Tomek Links过采样+特征工程优化策略缓解类别失衡问题;构建集成学习
quetalangtaosha13 小时前
人工智能·深度学习·计算机视觉
Anomaly Detection系列(CVPR2025 EG-MPC论文解读)Noise-Resistant Video Anomaly Detection via RGB Error-Guided Multiscale Predictive Coding and Dynamic Memory
思绪无限13 小时前
深度学习·yolo·目标检测·yolov12·yolo全家桶·人群密度检测系统
YOLOv5至YOLOv12升级:人群密度检测系统的设计与实现(完整代码+界面+数据集项目)摘要:开发面向复杂场景的人群密度检测系统对于公共安全预警、城市精细化治理与大型活动管理具有重要价值。本文围绕“YOLOv5 至 YOLOv12 的升级演进”主线,给出一个可落地的人群密度检测工程方案:以 YOLO 系列为核心完成拥挤人群的检测计数与密度评估,并对不同版本模型在同一数据集上的精度与速度表现进行对比分析;系统端采用 Python 3.12 与 PySide6 构建桌面端可视化界面,支持图片/视频/摄像头多源输入、阈值与 IOU 调参、检测框与计数统计展示、结果导出与历史记录管理,同时引入 SQ
何伯特13 小时前
深度学习·transformer·机器翻译
手撕Transformer:一个完整的机器翻译实例详解2017年,Google Brain团队发表了题为《Attention Is All You Need》的论文,提出了Transformer架构。这篇论文彻底改变了自然语言处理领域,成为后续BERT、GPT等大模型的基石。
阿_旭14 小时前
深度学习·r语言·cnn
【深度学习实战】Mask R-CNN肺部分割全流程:从数据到模型的完整指南在医学影像分析中,肺部分割是一项基础而关键的任务。无论是胸部X光片还是CT扫描,准确的肺部分割都能:传统的肺部分割依赖人工标注,耗时且主观。而Mask R-CNN的出现,彻底改变了这一局面。作为一款强大的实例分割模型,它不仅能检测肺部区域,还能生成精确的像素级分割掩码。
极光代码工作室14 小时前
人工智能·python·深度学习·机器学习
基于机器学习的垃圾短信识别系统随着移动通信技术的迅猛发展和智能手机的全面普及,短信作为基础通信手段仍被广泛使用。然而,垃圾短信(Spam SMS)泛滥问题日益严重,不仅干扰用户正常通信体验,更成为电信诈骗、钓鱼攻击与恶意推广的重要载体。据中国信息通信研究院《2023年电信网络诈骗治理报告》显示,全年拦截垃圾短信超186亿条,其中含欺诈诱导内容的占比达37.2%,对社会公共安全与个人信息保护构成严峻挑战。本研究聚焦于构建高精度、低延迟、可落地的垃圾短信智能识别系统,采用“数据驱动+特征工程+多模型融合”的技术路线:首先基于真实场景采集并