模型训练

loveisastory1 天前
bert·mindspore·模型训练·情绪识别·模型验证·模型推理·模型泛化
昇思25天学习打卡营第11天 | LLM原理和实践:基于MindSpore实现BERT对话情绪识别BERT全称是来自变换器的双向编码器表征量(Bidirectional Encoder Representations from Transformers),它是Google于2018年末开发并发布的一种新型语言模型。与BERT模型相似的预训练语言模型例如问答、命名实体识别、自然语言推理、文本分类等在许多自然语言处理任务中发挥着重要作用。模型是基于Transformer中的Encoder并加上双向的结构,因此一定要熟练掌握Transformer的Encoder的结构。
CXDNW5 天前
网络·人工智能·深度学习·机器学习·计算机·机器学习算法·模型训练
全面了解机器学习目录一、基本认识1. 介绍2. 机器学习位置二、机器学习的类型1. 监督学习2. 无监督学习3. 强化学习
SunStriKE9 天前
深度学习·模型训练
LLM并行训练3-数据并行在参数存储时采取fp32, 开始进行fp/bp时转成fp16运算, 拿到fp16梯度后再转回fp32更新参数.
设计师阿威12 天前
ai作画·stable diffusion·ai绘画·模型训练·ai工具·ai教程
用AI绘画-Stable Diffusion稳定生成指定人物的2-3人场景图,制作小说配图从未如此轻松!大家好,我是设计师阿威最近,尝试在写故事,然后用sd配图。其中,单人场景很容易生成。但是多人场景的话,很难稳定生成满意的图像。
ming_31118 天前
深度学习·tts·模型训练·文字转语音
一个轻量级的TTS模型实现python 版本 3.9本次采用LJSpeech数据集,百度网盘下载地址 链接:https://pan.baidu.com/s/1DDFmPpHQrTR_NvjAfwX-QA 提取码:1234
陈橘又青1 个月前
人工智能·语言模型·自然语言处理·文心一言·模型训练
让 AI 写高考作文丨10 款大模型 “交卷”,实力水平如何?文章部分素材来源 | CSDN(ID:CSDNnews)在科技日新月异的今天,人工智能(AI)已不再是遥不可及的未来科技,而是逐渐融入我们日常生活的实用工具。从智能语音助手到自动驾驶汽车,从智能家居系统到精准医疗诊断,AI技术正以其强大的计算能力和数据分析能力,改变着我们的工作方式、生活方式乃至思维方式。
灵魂画师向阳1 个月前
ai作画·stable diffusion·aigc·ai绘画·模型训练·ai教程·lora模型
【AI绘画Stable Diffusion】单人LoRA模型训练,打造你的专属模型,新手入门宝典请收藏!大家好,我是灵魂画师向阳本期我将教大家如何进行LoRA模型训练,打造你的专属模型,内容比较干,还请耐心看完!
深度学习算法与自然语言处理3 个月前
人工智能·算法·自然语言处理·大模型·gpu·模型微调·模型训练
大模型实战案例:8卡环境微调马斯克开源大模型 Grok-1节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。
SpikeKing3 个月前
可视化·模型训练·wandb·permission
Training - 使用 WandB 配置 可视化 模型训练参数欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://blog.csdn.net/caroline_wendy/article/details/137529140
OpenBayes3 个月前
数据库·人工智能·机器学习·语言模型·数据集·模型部署·模型训练
【OpenBayes 官方教程】在模型训练中使用子域名访问服务本教程主要为大家讲解 OpenBayes 上如何在模型训练中使用子域名访问服务,新朋友点击下方链接注册后,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费使用时长哦!
OpenBayes4 个月前
人工智能·深度学习·机器学习·ai·开源·gpu算力·模型训练
【OpenBayes 官方教程】数据读写绑定功能本教程主要为大家介绍怎样在 OpenBayes 上进行数据的绑定以及如何使用已绑定的数据,新朋友点击下方链接注册后,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费使用时长哦!
Milkha4 个月前
llm·nlp·模型训练
Huggingface初上手即ERNIE-gram句子相似性实战大模型如火如荼的今天,不学点语言模型(LM)相关的技术实在是说不过去了。只不过由于过往项目用到LM较少,所以学习也主要停留在直面——动眼不动手的水平。Huggingface(HF)也是现在搞LM离不开的工具了。
命运之手6 个月前
人工智能·机器学习·tensorflow·模型训练·tflite
【机器学习】TensorFlowLite安装和模型训练Linux,部分库不支持Apple芯片做AI这部分的开发,还是强烈建议装个Linux双系统或虚拟机这些比折腾Windows和Mac上的移植环境要轻松得多
摔跤猫子6 个月前
python·模型训练·数据预处理·地标景点识别
基于Python实现地标景点识别地标景点识别是一种基于计算机视觉技术的应用,旨在通过对图像进行分析和处理,自动识别出图片中的地标景点。本文将介绍地标景点识别的背景和原理,并使用Python编程语言来实现一个简单的地标景点识别系统。
华为云开发者联盟6 个月前
模型训练·模型训练优化
从工程化角度,详解鹏程·脑海大模型训练过程从工程化的角度,对鹏城.脑海大模型训练语料处理、模型训练优化、模型应用等方面做出了全面详细的经验分享。
Miha_Singh6 个月前
人工智能·pytorch·python·深度学习·模型训练·数据并行
PyTorch数据并行(DP/DDP)浅析一直以来都是用的单机单卡训练模型,虽然很多情况下已经足够了,但总有一些情况得上分布式训练:由于还没遇到过一张显卡放不下整个模型的情况,本文的分布式训练仅限数据并行。主要从数据并行的原理和一些简单的实践例子进行说明。
AncilunKiang7 个月前
深度学习·教程·autodl·模型训练·远程炼丹
AutoDL 使用记录创建实例需要依次选择:计费方式 → \to → 地区 → \to → GPU型号与数量 → \to → 主机
机器学习社区7 个月前
大模型·prompt·大语言模型·模型训练·模型优化
一种全新且灵活的 Prompt 对齐优化技术并非所有人都熟知如何与 LLM 进行高效交流。一种方案是,人向模型对齐。 于是有了 「Prompt工程师」这一岗位,专门撰写适配 LLM 的 Prompt,从而让模型能够更好地生成内容。
华为云开发者联盟8 个月前
tensorflow·模型训练·昇腾·数据预处理
昇腾迁移丨4个TensorFlow模型训练案例解读本文分享自华为云社区《TensorFlow模型训练常见案例》,作者: 昇腾CANN。基于TensorFlow的Python API开发的训练脚本默认运行在CPU/GPU/TPU上,为了使这些脚本能够利用昇腾AI处理器的强大算力,需要将其迁移到昇腾平台。
高 朗10 个月前
pytorch·python·模型训练
Pytorch学习笔记(模型训练)在同一个包下创建train.py和model.py,按照步骤先从数据处理,模型架构搭建,训练测试,统计损失,如下面代码所示