深度学习

AI技术控2 分钟前
人工智能·python·深度学习·语言模型·自然语言处理·prompt
Prompt Engineering 在企业大模型应用中的实践:从提示词模板到可控输出在大模型应用开发中,Prompt Engineering 是最容易被低估、也最容易被误解的部分。很多人认为提示词只是“把问题问清楚一点”,或者在系统提示词里写几句“你是一个专业助手”。这种方式做 Demo 可能够用,但一旦进入企业级场景,问题就会集中暴露:
手写码匠38 分钟前
人工智能·深度学习·算法·aigc
手写 AI Prompt Injection 防护系统:从零实现 LLM 安全边界2022 年 9 月,一位安全研究员向 Remotely Save(一个 Obsidian 插件)发送了一段特殊提示词,成功让插件读取并泄露了用户本地的 API Key。这是公开记录中最早的 Prompt Injection 攻击案例之一。到了 2024 年,这类攻击已经演变为基于 Agent 的自动化工具调用链,攻击者可以通过精心构造的提示词让 LLM 执行危险操作——发送邮件、修改文件、转账——整个过程中 LLM 只是忠实地"执行了指令"。
小何code1 小时前
深度学习·生成对抗网络·gan·图像生成
人工智能【第31篇】生成对抗网络GAN入门:AI的创造力之源作者的话:在前面的文章中,我们学习了各种监督学习和无监督学习算法,以及深度学习中的CNN、RNN等架构。今天,我们将进入一个充满想象力的领域——生成对抗网络(GAN)。GAN让AI拥有了"创造力",可以生成逼真的图像、音乐、文本,甚至视频。从DeepFake到AI绘画,从风格迁移到超分辨率,GAN的应用无处不在。让我们一起探索这个让AI学会"造假"的神奇技术!
穗余1 小时前
人工智能·深度学习·自然语言处理
大模型注意力机制(Attention)精讲总结Attention mechanism如果说:Transformer 是大模型的大脑架构那么:就是:也是:
幻奏岚音1 小时前
大数据·人工智能·深度学习
AI时代生产力变革与高效使用一、AI 的功能现状与对生产力影响1.1 技术演进要探讨如何提升生产力,首先必须审视 AI 目前的技术水位及其对传统工作流的冲击,而AI的爆发式发展是如此惊人:2022年11月ChatGPT发布,开启了“对话即生产”时代。AI从关键词检索转向复杂语义理解,解决了知识生产缺少经验积累的冷启动难题,初稿撰写、代码查错和创意头脑风暴的效率提升数倍。随后在2023和2024期间,GPT-4、Claude 3等模型相继问世,实现多模态与长文本处理飞跃,AI能够深度分析百万字级技术手册或数十个PDF组成的知识库,角色
沪漂阿龙1 小时前
人工智能·深度学习
面试题:PEFT 参数高效微调详解——什么是 PEFT、为什么需要 PEFT、LoRA/QLoRA/Adapter 原理与优缺点全解析1.1 这道题不是只问一个缩写,而是在问你有没有训练成本意识大模型越大,训练和部署成本越高。过去模型规模不大时,遇到一个新任务,全量微调整个模型还比较自然;但到了百亿、千亿参数时代,动不动就更新全部参数,不仅显存吃不消,训练周期、存储成本和多任务维护成本也会迅速上升。
一切皆是因缘际会2 小时前
人工智能·深度学习·机器学习·ai·架构
AI产业发展全景解析:技术突破、行业落地与未来展望2025 AI产业发展全景解析:技术突破、行业落地与未来展望2025年,AI技术的突破不再局限于参数规模的堆砌,而是聚焦“效率提升、能力融合、落地适配”,实现了从“实验室”到“产业端”的高效转化,其中基础超级模型、多模态融合、工程化能力三大方向的突破最为显著。
大模型最新论文速读2 小时前
人工智能·深度学习·机器学习·计算机视觉·自然语言处理
OpenSeeker-v2:仅用 1w 条数据 + SFT,训练 Deep Research 达到 SOTA一句话介绍所有人都在堆 CPT、SFT、RL 三段式训练,而本文选择把全部筹码押在数据合成上:只用 1.06w 条高难度轨迹和一次纯 SFT,就在四个主流 deep search 榜单上反超阿里通义 DeepResearch 等工业级模型
翼达口香糖2 小时前
大数据·人工智能·深度学习·语言模型·数据分析·边缘计算
当大模型吃掉你的App,从高德开放平台看AI服务重构作为一个还在习惯用手机软件的老用户,最近有幸参加了一下高德开放平台的Al产品发布会。这场高德AI发布会给我提了个醒,大模型真正的商业化拐点,可能不在模型本身,而在它如何吃掉我们手机里的一个个App。当MCP协议让AI能实时调用地图、天气、打车服务时,"打开软件"这个动作本身,就开始变得不那么频繁了。 其实从24年上旬之前,SaaS(软件即服务)这个模式思维其实还挺流行的。具体来说,比如生活中在手机上安装一个地图软件,然后用这个地图软件上提供的服务,比如说导航、路线规划、交通情况查询这些服务。那个时候其实C
tzc_fly12 小时前
人工智能·深度学习·机器学习
AnisoAlign:各向异性模态对齐这篇论文《Anisotropic Modality Align》(各向异性模态对齐)是一篇深入探讨多模态大语言模型(MLLM)底层表征空间的理论与方法相结合的优秀研究。它打破了以往对“模态鸿沟(Modality Gap)”的粗略认知,从严格的几何视角对其进行了重新定义,并据此提出了一种极其有效且无需配对数据的对齐算法(AnisoAlign),最终实现了仅用纯文本数据就能训练出媲美甚至超越真实图文预训练模型的MLLM。
我没胡说八道12 小时前
人工智能·经验分享·深度学习·考研·aigc·学习方法
2026论文工具选购指南:降重、降AI率、排版一站式筛选当下论文定稿的核心难题,早已不只是重复率超标,AI检测率过高、格式排版繁琐错乱成为更多同学毕业、投稿的阻碍。很多人分别使用降重、降AI、排版三类工具,来回复制粘贴不仅耗时费力,还容易导致文档格式崩坏、原创内容泄露。
初心未改HD12 小时前
人工智能·深度学习·算法
深度学习之MLP与反向传播算法详解多层感知机(Multi-Layer Perceptron,MLP)是深度学习的基础模型,也是理解神经网络工作原理的核心起点。本文从MLP的基本结构出发,详细讲解前向传播的矩阵运算过程,并深入剖析反向传播算法中链式法则的推导与梯度计算。通过使用NumPy从零实现一个完整的MLP网络,并在鸢尾花数据集上完成训练与验证,帮助读者建立对神经网络核心机制的完整认知。文中还涵盖了学习率选择、权重初始化、梯度检查等关键训练技巧,是一篇面向工程实践的MLP入门与进阶指南。
沪漂阿龙13 小时前
人工智能·深度学习·机器学习
面试题:训练-蒸馏详解——知识蒸馏、Teacher-Student、强弱蒸馏、Qwen3 强到弱蒸馏流程全解析1.1 蒸馏解决的不是“能不能训练”,而是“能不能低成本落地”大模型越做越强,但真实落地时会遇到一个很现实的问题:大模型效果好,却不一定适合所有线上场景。它可能推理慢、显存占用高、调用成本贵,也不一定适合端侧部署或高并发服务。
txg66613 小时前
人工智能·深度学习·安全·transformer
HgtJIT:基于异构图 Transformer 的即时漏洞检测框架“ 随着软件系统持续演进,漏洞检测任务从“离线分析”逐步转向“实时监测”。传统图神经网络模型虽然能够捕获程序语法与控制流结构,但在处理多类型节点、跨语义关系以及快速推理需求时仍显不足。
技术小黑14 小时前
pytorch·深度学习·算法·cnn
CNN算法实战系列03 | DenseNet121算法实战与解析相比 ResNet50V2 的优化点:DenseNet121 结构:Dense Block层数输出通道
z小猫不吃鱼15 小时前
人工智能·深度学习·transformer
02 Transformer 基础:Self-Attention 原理详解ViT 的核心不是“把图像切成 patch”这么简单。图像切成 patch 只是第一步。真正让 ViT 能够建模图像全局关系的,是 Transformer Encoder 中的 Self-Attention。在 CNN 中,图像信息通常通过卷积层逐步传播。一个像素或者一个局部区域想要和远处区域发生关系,往往需要经过多层卷积堆叠。而在 Self-Attention 中,所有 token 之间都可以直接计算关系。如果放到 ViT 中理解:
2zcode16 小时前
深度学习·yolo11·输电线路耐张线夹压接
基于YOLO11的输电线路耐张线夹压接缺陷检测系统摘要:输电线路耐张线夹压接质量直接关系到电力系统的安全稳定运行。传统的人工巡检方式效率低、主观性强,难以满足现代电网智能化管理需求。本文提出了一种基于YOLO11深度学习算法的耐张线夹压接缺陷智能检测系统。
数智工坊17 小时前
论文阅读·人工智能·深度学习·计算机视觉·transformer
【BLIP-2论文阅读】:冻结预训练模型的多模态预训练革命想象一下,你想训练一个能看懂图片又能说会道的AI,但发现需要同时训练一个10亿参数的视觉模型和一个70亿参数的语言模型,这得花多少电费?2023年之前的多模态预训练就是这么烧钱——所有模型都要端到端从头训练,算力成本高得离谱,普通实验室根本玩不起。
夫唯不争,故无尤也17 小时前
人工智能·深度学习
深度学习优化器:AdamW与SGD的区别在深度学习的训练中,优化器的核心作用是导航与寻优。它利用损失函数的梯度信息,决定模型参数(权重)更新的方向和步长。如果将训练模型比作“下山”,损失函数是地形,梯度指示了当前最陡峭的下坡方向,那么优化器就是你的“步伐策略”——它决定了你是小步慢走、大步快跑,还是借助惯性冲过平坦的鞍点。