技术栈
训练
小北的AI科技分享
2 天前
架构
·
模型
·
训练
人工智能大模型:从技术突破到人机交互重塑
当前科技领域里,人工智能大模型属于极具革命性的技术突破当中的一个,这些模型借助在海量数据之上开展训练,从而获取了理解、生成以及处理人类语言还有其他类型信息的能力,自2020年GPT - 3发布开始直至如今各类多模态模型出现,大模型技术正以令人惊叹的速度重塑着人机交互的方式。
微尘hjx
22 天前
人工智能
·
python
·
深度学习
·
yolo
·
机器学习
·
训练
·
yolo11
【深度学习02】YOLO模型的数据集、训练、验证、预测、导出
目录一、数据集1.1、第一种结构(YOLOv5风格)1.2、第二种结构(YOLOv8风格)1.3、两种结构的本质区别
Swizard
1 个月前
python
·
算法
·
ai
·
训练
数据不够代码凑?用 Albumentations 让你的 AI 模型“看”得更广,训练快 10 倍!
作为一名 CV 算法工程师,你一定经历过这种绝望: 老板丢给你 100 张产品瑕疵照片,让你训练一个准确率 99% 的检测模型。 你看着那少得可怜的数据,内心在咆哮:“这肯定会过拟合(Overfitting)啊!模型根本学不到特征,只会死记硬背!”
其美杰布-富贵-李
1 个月前
人工智能
·
pytorch
·
python
·
优化
·
训练
PyTorch Optimizer 与 Scheduler 指南
在深度学习训练中,学习率(Learning Rate) 是最重要的超参数之一。固定学习率的局限:训练曲线示意:
其美杰布-富贵-李
1 个月前
笔记
·
深度学习
·
特征工程
·
训练
·
数据清理
数据清理与特征工程完整指南
在机器学习和深度学习项目中,数据预处理通常占据 60-80% 的时间,这是因为:原始数据往往不可直接使用
Swizard
1 个月前
python
·
算法
·
ai
·
训练
拒绝“狗熊掰棒子”!用 EWC (Elastic Weight Consolidation) 彻底终结 AI 的灾难性遗忘
想象一下,你训练了一个神经网络来识别手写数字(MNIST),准确率高达 99%。接着,你希望能复用这个聪明的脑子,让它继续学习识别时尚单品(Fashion-MNIST)。
Swizard
1 个月前
python
·
算法
·
训练
别再迷信“准确率”了!一文读懂 AI 图像分割的黄金标尺 —— Dice 系数
想象这样一个痛点场景:你正在训练一个 AI 模型,任务是从脑部核磁共振(MRI)扫描中找出极小的肿瘤区域。你熬夜跑完代码,发现模型在验证集上的 Accuracy(准确率)高达 99.9%!
Swizard
2 个月前
算法
·
ai
·
训练
告别样本不平衡噩梦:Focal Loss 让你的模型学会“划重点”
你是否遇到过这种令人抓狂的场景?你在训练一个癌症检测模型,数据集中 99% 都是健康样本(负样本),只有 1% 是患病样本(正样本)。你满怀期待地跑完训练,发现模型的准确率(Accuracy)高达 99%!
Yeliang Wu
2 个月前
微调
·
多模态
·
训练
·
ms-swift
基于ms-swift框架微调多模态模型(Ubuntu22.04)
作者:吴业亮 博客:wuyeliang.blog.csdn.net本文从核心原理到实操步骤,完整讲解基于微软ms-swift(ModelScope Swift)框架在Ubuntu22.04系统上微调多模态模型(如Qwen-VL、LLaVA、MiniCPM-V等)的全流程。
Yeliang Wu
2 个月前
微调
·
embedding
·
训练
·
ms-swift
基于 ms-swift 框架微调 Embedding 模型(Ubuntu22.04):从原理到实践
作者:吴业亮 博客:wuyeliang.blog.csdn.netEmbedding模型的核心是将文本转化为低维稠密向量,使语义相似的文本向量距离更近、语义相异的更远。微调的目标是让预训练Embedding模型适配特定领域/任务(如金融、医疗文本相似度匹配),核心逻辑是:
Yeliang Wu
2 个月前
微调
·
训练
·
unsloth
Unsloth 从原理到实践(基于Ubuntu 22.04)
作者:吴业亮 博客:wuyeliang.blog.csdn.netUnsloth 是一款面向大语言模型(LLM)的高效微调框架,主打低资源占用、超高训练速度,核心优化了 QLoRA/LoRA 微调流程,适配 Ubuntu 22.04 等Linux环境,支持 Llama、Mistral、Phi、Gemma 等主流开源模型。本文从原理到全流程实践,覆盖环境搭建、数据集处理、微调、模型合并、量化、评测、监控等核心环节。
我很哇塞耶
2 个月前
人工智能
·
ai
·
大模型
·
训练
OpenAI公开新的模型训练方法:或许能解决模型撒谎问题,已在GPT-5 thiking验证
研究人员在GPT-5-Thinking上进行了实验。结果显示,通过这种训练,通过“坦白”来监测模型的不当行为是可行的,即使模型在主要回答中撒了谎,它往往也能在随后的“坦白”中诚实交代
dundunmm
5 个月前
人工智能
·
大模型
·
硬件
·
软件
·
训练
·
推理
【每天一个知识点】训推一体机
训推一体机一般指 集“模型训练(Training)+ 推理部署(Inference Serving/推理服务)”于一体的智能计算设备。这种一体机的设计思路是,把 AI 模型从研发到应用的全过程(数据准备 → 训练 → 验证 → 部署 → 推理)都封装在一台硬件平台里,便于企业、科研机构或高校快速落地 AI 应用。
太空眼睛
9 个月前
lora
·
微调
·
sft
·
训练
·
deepspeed
·
llama-factory
·
deepseek
【LLaMA-Factory】使用LoRa微调训练DeepSeek-R1-Distill-Qwen-7B
如果不禁用开源驱动,直接安装nvidia-smi,会安装失败,在日志文件/var/log/nvidia-installer.log中会出现以下错误信息 ERROR: Unable to load the kernel module 'nvidia.ko'
文慧的科技江湖
9 个月前
人工智能
·
开源
·
储能
·
训练
·
光伏
·
推理
图文结合 - 光伏系统产品设计PRD文档 -(慧哥)慧知开源充电桩平台
版本号:1.0 修订日期:2023年10月 作者:功能描述:实时采集并展示电站运行数据
文慧的科技江湖
10 个月前
人工智能
·
架构
·
开源
·
训练
·
推理
AI平台如何实现推理?数算岛是一个开源的AI平台(主要用于管理和调度分布式AI训练和推理任务。)
数算岛是一个开源的AI平台,主要用于管理和调度分布式AI训练和推理任务。它基于Kubernetes构建,支持多种深度学习框架(如TensorFlow、PyTorch等)。以下是数算岛实现模型推理的核心原理、架构及具体实现步骤:
大0马浓
1 年前
人工智能
·
python
·
训练
训练大模型LLM选择哪种开发语言最好
训练大型语言模型(LLM)时,选择合适的编程语言主要取决于效率、生态支持、开发便利性以及特定需求(如性能优化或硬件适配)。以下是常见语言的分析和推荐:
大0马浓
1 年前
数据库
·
训练
·
rag
LLM训练如何从图片提取信息存入向量数据库
数据泄露风险特征对齐偏差计算资源瓶颈通过上述方案,可实现从图片到结构化向量数据的完整链路,为LLM提供跨模态理解能力。实际部署时需根据场景需求在精度(大模型)和速度(轻量化模型)之间取得平衡。
engchina
1 年前
数据库
·
adb
·
oracle
·
训练
在Autonomous DB中创建训练数据集
在机器学习中,构建高质量的训练数据集是模型成功的关键,尤其当需要利用公司内部数据时。如何高效、灵活地构建这些数据集是每个数据工程师面临的重要问题。本文将详细介绍如何在Autonomous DB中创建学习数据集,并结合SQL和JSON格式生成适用于训练的样本数据。
伊织code
1 年前
人工智能
·
语言模型
·
自然语言处理
·
训练
·
minimind
MiniMind - 从0训练语言模型
《AI 技术资讯分享》扫码入群:https://www.yuque.com/yizhi-lentn/zctmmg/xpamt1qpp2xv8q8b