模型训练

华为云开发者联盟13 天前
docker·ai·容器·模型训练·华为云modelarts
基于云主机的ModelArts模型训练实践,让开发环境化繁为简本文分享自华为云社区《【开发者空间实践】云主机安装Docker并制作自定义镜像在ModelArts平台做模型训练》,作者: 开发者空间小蜜蜂。
颜淡慕潇16 天前
深度学习·模型训练·cnns
【深度学习】深入解析卷积神经网络(CNNs)卷积神经网络(Convolutional Neural Networks, CNNs)是深度学习领域中一种极为重要的算法,尤其在计算机视觉任务中表现出色。CNNs 模拟人类视觉系统,通过多层的卷积操作提取特征,最终实现对图像的分类、识别等任务。本文将深入探讨 CNNs 的基本结构、工作原理、关键技术以及在实际应用中的表现。
机器学习是魔鬼1 个月前
llama·模型训练·ai功能岛·矩池云
LLaMA-Factory 上手即用教程LLaMA-Factory 是一个高效的大型语言模型微调工具,支持多种模型和训练方法,包括预训练、监督微调、强化学习等,同时提供量化技术和实验监控,旨在提高训练速度和模型性能。
SmallBambooCode1 个月前
linux·人工智能·python·阿里云·debian·脚本·模型训练
【人工智能】阿里云PAI平台DSW实例一键安装Python脚本阿里云的DSW实例自带的镜像很少而且并不好用,所以我在这里写三个一键编译安装Python3.8,Python3.9,Python3.10的Shell脚本。
Thanks_ks1 个月前
深度学习·docker·tensorflow·模型部署·容器化技术·模型训练·flask 应用
利用 TensorFlow 与 Docker 构建深度学习模型训练与部署流水线在深度学习领域,构建、训练和部署模型是一个复杂且耗时的过程。本文将介绍如何利用 TensorFlow 构建深度学习模型,并通过 Docker 容器化技术实现模型的训练与部署,从而简化整个流水线,提高开发效率。我们将通过实战代码,展示从模型构建到部署的全过程。
算家云2 个月前
人工智能·aigc·图像生成·模型训练·抠图·背景去除·内容创作
BRIA-RMBG-1.4容器构建指南BRIA-RMBG-1.4 是 BRIA AI 公司开发的一款先进的背景去除模型,旨在高效、准确地从各种类别和类型的图像中分离前景和背景。
青云交2 个月前
大数据·机器学习·数据处理·模型训练·应用案例·kubeflow·资源利用
大数据新视界 --大数据大厂之 Kubeflow 在大数据与机器学习融合中的应用探索💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。💖💖💖
青云交2 个月前
大数据·人工智能·分布式机器学习·数据处理·模型训练·ray·应用场景
大数据新视界 --大数据大厂之 Ray:分布式机器学习框架的崛起💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。💖💖💖
一颗小树x2 个月前
实例分割·模型训练·目标检测与跟踪·yolo11·关键点姿态估计
YOLO11模型训练 | 目标检测与跟踪 | 实例分割 | 关键点姿态估计本文分享YOLO11的模型训练,训练任务包括物体分类、目标检测与跟踪、实例分割 、关键点姿态估计、旋转目标检测等。
Alluxio5 个月前
大数据·人工智能·机器学习·缓存·自动驾驶·alluxio·模型训练
案例分享|Alluxio在自动驾驶数据闭环中的应用分享嘉宾:孙涛 - 中汽创智智驾工具链数据平台开发专家关于中汽创智:中汽创智科技有限公司(以下简称“中汽创智”)由中国一汽、东风公司、南方工业集团、长安汽车和南京江宁经开科技共同出资设立。聚焦智能底盘、新能动力、智能网联三大业务领域,围绕“车端+云端+通信端”生态体系,开展前瞻、共性、平台、核心技术和产品研发及产业孵化。
SunStriKE5 个月前
机器学习·llm·模型训练
LLM并行训练7-混合并行总结根据前面的系列文章, 对预训练大模型里用到的主要并行加速技术做了一系列拆分分析. 但是在实际的训练里往往是多种并行混合训练. 我们要怎么配置这些并行策略才能让训练框架尽可能的减少通信瓶颈, 提升GPU计算利用率呢? 这里的变量太多了, 以最简单的3D并行为例:
Thomas_Cai5 个月前
深度学习·模型训练·梯度消失·梯度爆炸
模型训练中出现loss为NaN怎么办?在训练的某个阶段,学习率可能设置得过高,导致模型参数更新幅度过大,甚至可能出现数值不稳定的情况。你可以尝试降低学习率,并观察训练过程中的变化。
SunStriKE5 个月前
深度学习·llm·模型训练
LLM并行训练6-激活优化激活指的是一些在fp时计算得到的临时tensor, 会用于bp时的计算. 如果能在fp计算后把临时tensor缓存下来就可以加速bp, 缺点在于激活会占用大量显存. 以一层transformer结构为例分析下各层存在的激活.
梦醒三叹5 个月前
学习·大模型·模型训练
昇思MindSpore 基础入门学习-使用静态图加速学习-CSDNAI编译框架分为两种运行模式,分别是动态图模式以及静态图模式。MindSpore默认情况下是以动态图模式运行,但也支持手工切换为静态图模式。两种运行模式的详细介绍如下:
华为云开发者联盟5 个月前
mindspore·模型训练·华为云开发者联盟·dcgan
教你基于MindSpore用DCGAN生成漫画头像本文分享自华为云社区《【昇思25天学习打卡营打卡指南-第二十天】DCGAN生成漫画头像》,作者:JeffDing。
loveisastory6 个月前
bert·mindspore·模型训练·情绪识别·模型验证·模型推理·模型泛化
昇思25天学习打卡营第11天 | LLM原理和实践:基于MindSpore实现BERT对话情绪识别BERT全称是来自变换器的双向编码器表征量(Bidirectional Encoder Representations from Transformers),它是Google于2018年末开发并发布的一种新型语言模型。与BERT模型相似的预训练语言模型例如问答、命名实体识别、自然语言推理、文本分类等在许多自然语言处理任务中发挥着重要作用。模型是基于Transformer中的Encoder并加上双向的结构,因此一定要熟练掌握Transformer的Encoder的结构。
CXDNW6 个月前
网络·人工智能·深度学习·机器学习·计算机·机器学习算法·模型训练
全面了解机器学习目录一、基本认识1. 介绍2. 机器学习位置二、机器学习的类型1. 监督学习2. 无监督学习3. 强化学习
SunStriKE6 个月前
深度学习·模型训练
LLM并行训练3-数据并行在参数存储时采取fp32, 开始进行fp/bp时转成fp16运算, 拿到fp16梯度后再转回fp32更新参数.
设计师阿威6 个月前
ai作画·stable diffusion·ai绘画·模型训练·ai工具·ai教程
用AI绘画-Stable Diffusion稳定生成指定人物的2-3人场景图,制作小说配图从未如此轻松!大家好,我是设计师阿威最近,尝试在写故事,然后用sd配图。其中,单人场景很容易生成。但是多人场景的话,很难稳定生成满意的图像。
ming_3116 个月前
深度学习·tts·模型训练·文字转语音
一个轻量级的TTS模型实现python 版本 3.9本次采用LJSpeech数据集,百度网盘下载地址 链接:https://pan.baidu.com/s/1DDFmPpHQrTR_NvjAfwX-QA 提取码:1234