深度学习

过期的秋刀鱼!4 小时前
人工智能·深度学习
人工智能-深度学习-线性回归深度学习是机器学习的一个子集机器学习分为两类: 1、监督学习是最广泛的最常用的监督学习指的是 x到Y的映射,或者输入到输出的映射算法,监督学习的关键特征是,给学习算法提供包含正确答案的示例, 如房价预测,对于数据是你和一条曲线还是你和一条直线,给定一个新的X输出预测的Y值,这是一个回归的例子,任务是预测一个数字
IE065 小时前
人工智能·深度学习
深度学习系列84:使用kokoros生成tts语音Kokoro TTS 以其轻量级设计和高效性能脱颖而出。作为一个仅有82M参数的文本转语音(TTS)模型,Kokoro 在 TTS Spaces Arena 中击败了许多参数规模更大的竞争对手,成为语音合成领域的一颗新星。最新1.1版本安装如下:
IE065 小时前
人工智能·深度学习
深度学习系列83:使用outetts模型采用 LLaMa 架构基础,结合 WavTokenizer 音频标记化技术,将连续音频波形转换为离散令牌序列,每秒处理 150 个令牌。v2版本通过 CTC 强制对齐技术,实现文本与音频的精确映射,无需预处理即可生成时间戳对齐的语音流;v3版本使用whisper进行文本对齐。窗口化重复惩罚机制的引入,显著提升了语音输出的连贯性和自然度,尤其在长文本合成中表现稳定。 多语言支持是其核心亮点之一。模型直接支持英语、中文、阿拉伯语等 20 余种语言的文本输入,无需罗马化处理。训练数据覆盖高资源语言(如英语、
亚里随笔7 小时前
人工智能·深度学习·机器学习·语言模型·llm·rlhf
突破性框架TRAPO:统一监督微调与强化学习的新范式,显著提升大语言模型推理能力大语言模型的后训练方法正迎来重大突破!清华大学与蚂蚁集团联合提出的TRAPO框架通过创新性地统一SFT与RL训练,在数学推理任务上实现了显著性能提升。该框架解决了传统两阶段训练中的根本性矛盾,通过Trust-Region SFT和自适应专家指导机制,实现了更稳定、更高效的模型训练,为推理增强型LLMs发展开辟了新道路。
AI即插即用9 小时前
图像处理·人工智能·深度学习·目标检测·计算机视觉·视觉检测
即插即用系列 | TGRS 2025 MGAM:面向遥感微小目标检测的多尺度高斯注意力机制论文标题:Multiscale Gaussian Attention Mechanism for Tiny-Object Detection in Remote Sensing Images
cqbzcsq9 小时前
论文阅读·人工智能·python·深度学习·生物信息学
蛋白质功能预测模型DAMPE论文阅读报告来自中山大学,2025.10.27提交在arxiv上的论文,模型的名字和某个暗物质探测器相同(论文地址:[2510.23273] A Novel Framework for Multi-Modal Protein Representation Learning
啊巴矲10 小时前
人工智能·深度学习
小白从零开始勇闯人工智能:深度学习初级篇(初识深度学习及环境的配置与安装)深度学习是机器学习的一个重要分支,其核心在于构建模仿人脑神经元连接方式的人工神经网络,通过数据驱动的方式自动学习多层次的特征与复杂规律。一个典型的人工神经网络由大量相互连接的人工神经元分层组织而成,包括输入层、一个或多个隐藏层以及输出层。其工作过程可分为两个阶段:首先是训练,网络通过处理海量数据,借助反向传播算法和梯度下降等优化方法,反复调整内部连接的权重参数,以使预测输出与真实标签之间的误差最小化,训练完成后进入推断,此时固定网络参数,可对新输入的数据进行预测。总之深度学习是一种基于深层神经网络架构、并
Fuly102410 小时前
人工智能·深度学习·计算机视觉
多模态大模型应用技术栈模型选型任务类型: 文本→图像生成 模型选择: Stable Diffusion / Qwen-Image 等 应用场景: 商品图、海报、广告图生成 loRA微调
雪花desu10 小时前
人工智能·深度学习·语言模型·chatgpt·langchain
深度解析RAG(检索增强生成)技术随着ChatGPT、文心一言等大语言模型(LLM)的爆发,AI的能力边界被不断拓宽。然而,当企业试图将这些“通才”模型应用到垂直领域或私有业务中时,往往会遭遇“水土不服”。
wang_chao11811 小时前
深度学习·yolo·计算机视觉
Yolov5训练自定义数据集的步骤本博客记录的内容是通过Yolov5工程训练自制数据集并进行推理。如下图为数据集制作文件夹内容,其中mp4视频即需要制作数据集的画面。   首先通过getframe.py将video1217.mp4按帧提取出图像到当前文件夹内的image文件夹内。
weixin_4029399912 小时前
深度学习·stable diffusion
【大模型】stable-diffusion-3.0和3.5模型训练刚开始训练,目前只能勉强跑起来 medium的微调模型。 先记录几个有用的网址,防止以后乱了找不到。huggingfaceface: https://huggingface.co/stabilityai/stable-diffusion-3.5-large
一代明君Kevin学长13 小时前
人工智能·深度学习·transformer
Transformer为什么使用多个注意力头?Transformer为什么使用多个注意力头?单头注意力如同用单一滤镜观察数据,难以同时捕捉语法、语义、指代等异构特征。 多头机制通过子空间投影分解,实现了并行化特征专家的效果,在几乎不增加计算量的前提下显著提升模型容量
小喵要摸鱼13 小时前
深度学习·强化学习
深度强化学习 Deep Q-learning:把深度学习引入强化学习参考:Deep Q-Learning in Reinforcement LearningDeep Q-learning 是一种利用 深度学习 帮助机器在 复杂情境 中 做出决策 的方法。它在状态数量极大的环境中尤为有效,例如视频游戏或机器人领域。
zhaodiandiandian14 小时前
人工智能·深度学习
从深度学习到大模型,AI技术演进的机遇与挑战近年来,人工智能已从实验室的学术探索走向产业应用的核心舞台,成为驱动科技变革的关键力量。从早期依赖人工编写规则的专家系统,到如今具备强大泛化能力的大语言模型,AI技术历经半个多世纪的迭代,完成了从规则驱动到数据驱动的范式转变,深刻改变了人类与技术交互的方式。在这一演进过程中,技术突破带来了前所未有的发展机遇,也伴随着亟待解决的诸多挑战。
ekprada14 小时前
人工智能·深度学习·机器学习
Day50 - 预训练模型与CBAM集成在深度学习实践中,我们经常遇到这样的问题:如何优化一个已经训练好的模型(如ResNet18)?直接修改模型结构(如插入注意力模块)是否会破坏原有的特征提取能力?
BigerBang14 小时前
人工智能·pytorch·深度学习·算法
LoRA 全方位指南:从底层原理到 Qwen-Image-Edit 实战在 AI 绘画和微调领域,LoRA (Low-Rank Adaptation) 已经成为了一项不可或缺的技术。它让我们能够以极低的显存成本和文件大小,撬动庞大的基础模型,实现风格化、角色定制或特定任务的编辑。
这张生成的图像能检测吗14 小时前
人工智能·深度学习·半监督·图神经网络·分类模型
(论文速读)GCN:基于图卷积网络的半监督分类论文题目:SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS(基于图卷积网络的半监督分类)
Coovally AI模型快速验证14 小时前
人工智能·深度学习·目标检测·机器学习·自动驾驶·无人机
深度学习驱动的视频异常检测(VAD),AI如何让监控更智能?你是否曾想过,在成千上万的监控视频中,如何让计算机自动识别出打架、闯入、徘徊等异常事件?这正是视频异常检测(Video Anomaly Detection, VAD) 所要解决的核心问题。随着深度学习技术的飞速发展,VAD 已成为计算机视觉领域的热点研究方向,并在智能安防、自动驾驶、内容审核等领域展现出巨大应用潜力。
西西弗Sisyphus14 小时前
人工智能·深度学习·神经网络·mlp
最基础的神经网络可视化 包括源码flyfish多层感知机(Multilayer Perceptron, MLP)是最经典、最基础的神经网络模型之一,属于前馈神经网络(Feedforward Neural Network)的范畴。理解 MLP 的原理是掌握更复杂神经网络(如 CNN、RNN、Transformer)的基础。
renhongxia115 小时前
图像处理·人工智能·深度学习·无人机
基于多智能体深度强化学习的高炮反无人机算法针对日益增长的无人机集群威胁,传统防空方法在应对高机动、低慢小目标时面临决策滞后的挑战。本文提出一种基于多智能体深度强化学习(MADRL)的高炮防空协同反制算法。该方法将多门高炮构建为分布式智能体,通过集中训练-分散执行的框架,使其在共享战场态势信息的基础上,学习协同火力分配、目标交接与射击诸元优化的策略。算法利用深度确定性策略梯度(DDPG)或近端策略优化(PPO)等机制,使智能体集群能在动态对抗环境中自适应调整战术,有效提升对无人机饱和攻击的拦截效率与系统生存能力。仿真结果表明,该算法在应对多批次、不