深度学习

AI自动化工坊2 小时前
人工智能·深度学习·机器学习·ai·token·caveman
Caveman技能实战:优化AI对话风格实现65%的token成本节省如果你在使用Claude、GPT等AI编程助手时,发现token成本快速上涨,这篇文章将为你提供实用的解决方案。近期在HackerNews获得883点热议的Caveman技能,通过优化AI对话风格实现了平均65%的token节省。本文将从技术实现、安装配置、实际效果等方面进行全面解析。
tyler_download2 小时前
人工智能·深度学习·transformer
揉扁搓圆transformer架构:KL散度损失函数的说明深度学习网络以及基于transformer架构的大模型都可以看做是一个函数,我们把输入传递给函数进行运算,函数的输出就是我们想要的结果。例如我们在使用大模型编程时,我们把需要实现的功能用自然语言描述出来,这就对应函数的输入, 然后模型返回我们所需要的代码实现,这就是函数的输出。问题在于我们需要确定模型给出的答案却是是我们所需要的,在给定的例子中,我们要确保模型给出的代码能正确运行,同时代码实现的结果跟我们所描述的功能要一致。
蔡俊锋3 小时前
人工智能·深度学习·ai·ai学习
AI前沿动态高效追踪指南在 AI 技术爆炸式迭代的当下,信息过载已经成为从业者和学习者的核心痛点 —— 每天有上百篇新论文、数十个新模型发布,如何高效筛选高价值信息、精准追踪前沿动态,是跟上 AI 技术节奏的关键。
前端摸鱼匠3 小时前
人工智能·深度学习·面试·大模型·transformer·求职招聘
【AI大模型春招面试题21】什么是Transformer的“预归一化”与“后归一化”?两者的差异及影响?你好!咱们直接切入正题。这道题在现在的架构演进(尤其是从 BERT 到 LLaMA 系列)背景下,属于必考题。它不仅仅考察你对归一化层位置的记忆,更考察你对深层网络训练稳定性、梯度流以及现代大模型架构设计哲学的理解。
披着羊皮不是狼4 小时前
人工智能·深度学习
深度学习核心架构全解析1. CNN的本质2. 基于CNN的图像分类算法3. 基于CNN的图像检测算法处理完“空间”信息,接下来要处理“时间”信息。 4. 循环神经网络(RNN)
张二娃同学4 小时前
人工智能·python·深度学习·神经网络·yolo
深度学习入门:YOLOv5 与 Fast R-CNN的认识目标检测难的地方,不只是“能不能识别出来”,还在于“速度、精度和部署成本如何平衡”。YOLOv5 代表单阶段检测思路,强调实时性和工程落地;Fast R-CNN 代表两阶段检测思路,强调候选区域建模和区域级判别。本文从原理、结构、参数、指标和应用场景五个层面展开,对两者做一篇适合初学者阅读、也能直接用于选型参考的对比分析。
阿杰学AI4 小时前
人工智能·深度学习·ai·语言模型·aigc·sft·监督微调
AI核心知识119—大语言模型之 监督微调 (简洁且通俗易懂版)监督微调 (Supervised Fine-Tuning, 简称 SFT) 是把大语言模型从一个“野生学霸” 变成“全能助理” 的第一道关键工序。
AI先驱体验官5 小时前
大数据·人工智能·深度学习·重构·开源·aigc
臻灵:数字人形象驱动新突破,NVIDIA开源PersonaPlex带来的技术变局2026年4月,NVIDIA开源PersonaPlex数字人形象驱动代码库,这是数字人驱动领域首次出现的主流开源方案。与此同时,Google发布AI Edge Gallery展示边缘AI应用能力,本地化部署数字人的。形象驱动和边缘部署,两个技术变量同时突破,实时交互数字人的商业化落地从"可能"变为"可行"。本文从技术进展、场景落地、实践路径三个维度,系统探讨数字人技术的最新发展。
郝学胜-神的一滴5 小时前
人工智能·pytorch·python·深度学习·神经网络·程序人生·机器学习
激活函数:神经网络的「非线性灵魂」,让模型从“直线”走向“万能”在深度学习的世界里,激活函数是一个看似微小、却决定网络能力的核心组件。很多初学者会问:神经网络层层叠加,难道不是越深层能力越强?答案藏在一个关键逻辑里——没有激活函数,再深的网络,也只是一层线性回归。
Project_Observer5 小时前
大数据·数据库·深度学习·机器学习·深度优先
列表视图中的筛选列您知道吗?您可以在 Zoho Projects 中跨列表筛选列。这样,您无需频繁切换到筛选面板,即可快速缩小大型数据集的范围,从而更轻松地专注于当前工作中的重要内容。
极光代码工作室5 小时前
人工智能·python·深度学习·机器学习
基于机器学习的信用卡欺诈检测系统设计随着数字支付规模持续扩大,信用卡欺诈已成为全球金融安全的重大威胁。据2023年Nilson Report统计,全球因支付欺诈造成的损失高达410亿美元,其中约68%源于未被及时识别的异常交易。传统基于规则引擎的检测方法存在误报率高、泛化能力弱、难以应对新型欺诈模式等固有缺陷。本文针对高度不平衡(欺诈样本占比常低于0.1%)、高维稀疏、实时性要求严苛的信用卡交易数据特点,设计并实现了一套端到端的智能欺诈检测系统。系统采用SMOTE-Tomek Links过采样+特征工程优化策略缓解类别失衡问题;构建集成学习
quetalangtaosha5 小时前
人工智能·深度学习·计算机视觉
Anomaly Detection系列(CVPR2025 EG-MPC论文解读)Noise-Resistant Video Anomaly Detection via RGB Error-Guided Multiscale Predictive Coding and Dynamic Memory
思绪无限6 小时前
深度学习·yolo·目标检测·yolov12·yolo全家桶·人群密度检测系统
YOLOv5至YOLOv12升级:人群密度检测系统的设计与实现(完整代码+界面+数据集项目)摘要:开发面向复杂场景的人群密度检测系统对于公共安全预警、城市精细化治理与大型活动管理具有重要价值。本文围绕“YOLOv5 至 YOLOv12 的升级演进”主线,给出一个可落地的人群密度检测工程方案:以 YOLO 系列为核心完成拥挤人群的检测计数与密度评估,并对不同版本模型在同一数据集上的精度与速度表现进行对比分析;系统端采用 Python 3.12 与 PySide6 构建桌面端可视化界面,支持图片/视频/摄像头多源输入、阈值与 IOU 调参、检测框与计数统计展示、结果导出与历史记录管理,同时引入 SQ
何伯特6 小时前
深度学习·transformer·机器翻译
手撕Transformer:一个完整的机器翻译实例详解2017年,Google Brain团队发表了题为《Attention Is All You Need》的论文,提出了Transformer架构。这篇论文彻底改变了自然语言处理领域,成为后续BERT、GPT等大模型的基石。
阿_旭7 小时前
深度学习·r语言·cnn
【深度学习实战】Mask R-CNN肺部分割全流程:从数据到模型的完整指南在医学影像分析中,肺部分割是一项基础而关键的任务。无论是胸部X光片还是CT扫描,准确的肺部分割都能:传统的肺部分割依赖人工标注,耗时且主观。而Mask R-CNN的出现,彻底改变了这一局面。作为一款强大的实例分割模型,它不仅能检测肺部区域,还能生成精确的像素级分割掩码。
极光代码工作室7 小时前
人工智能·python·深度学习·机器学习
基于机器学习的垃圾短信识别系统随着移动通信技术的迅猛发展和智能手机的全面普及,短信作为基础通信手段仍被广泛使用。然而,垃圾短信(Spam SMS)泛滥问题日益严重,不仅干扰用户正常通信体验,更成为电信诈骗、钓鱼攻击与恶意推广的重要载体。据中国信息通信研究院《2023年电信网络诈骗治理报告》显示,全年拦截垃圾短信超186亿条,其中含欺诈诱导内容的占比达37.2%,对社会公共安全与个人信息保护构成严峻挑战。本研究聚焦于构建高精度、低延迟、可落地的垃圾短信智能识别系统,采用“数据驱动+特征工程+多模型融合”的技术路线:首先基于真实场景采集并
卡梅德生物科技小能手7 小时前
经验分享·深度学习·生活
深度解析CD66b (癌胚抗原相关细胞粘附分子8):中性粒细胞的关键调控靶点CD66b(CEACAM8)是免疫球蛋白超家族CEA家族的核心成员,作为一种高度糖基化的糖基磷脂酰肌醇(GPI)锚定糖蛋白,它主要特异性表达于粒细胞表面。本文将从分子生物学机制、临床诊断应用及药物研发管线三个维度,系统解析CD66b在细胞粘附、免疫信号传导及炎症反应调控中的核心作用,探讨其在炎症性疾病诊疗中的技术价值。
bryant_meng7 小时前
人工智能·深度学习·llm·资讯
【Reading Notes】(8.9)Favorite Articles from 2025 September领导说:“年轻人不要总想着钱,要想着怎么成长。”,听到这话,你会怼回去吗?(2025-09-01)读懂Transformer的内核,了解大模型基石(2025-09-02)
思绪无限7 小时前
深度学习·yolo·目标检测·yolov12·yolo全家桶·pcb板缺陷检测
YOLOv5至YOLOv12升级:PCB板缺陷检测系统的设计与实现(完整代码+界面+数据集项目)摘要:PCB 板缺陷检测对工业质检的效率与一致性至关重要。本文围绕 YOLOv5 至 YOLOv12 的升级路线,讲解如何构建可落地的 PCB 缺陷检测系统,并提供完整代码、可运行界面与数据集工程。系统支持图片、视频与摄像头检测,输出缺陷类别、置信度、标注框与统计结果,可调 Conf/IoU 阈值并支持结果保存与导出;界面采用 PySide6 实现多模型权重导入与一键切换,结合 SQLite 完成登录注册与历史记录持久化,便于多用户管理与结果追溯。算法部分在统一数据集上对 YOLOv5—YOLOv12 多
快乐得小萝卜7 小时前
人工智能·深度学习
Xfeat部署系列-1-暴力匹配加速!当匹配两个特征点时SLAM系统一般选择最近邻的一些缩小匹配范围的一些方法,直接暴力匹配一般是全局最优的,但是往往伴随着很多时间的消耗。因此这里使用cuda对暴力匹配做优化使得计算时间可被SLAM系统接受