微调

养肥胖虎2 天前
ai·微调·rag
RAG学习笔记(2):关于rag和模型微调,同一个问题它们分别怎么处理好家伙,今天我们来聊一个很容易混在一起的问题:这两个东西看起来都能让大模型回答得更贴近业务.但它们解决的问题其实不一样.
TGITCIC2 天前
微调·sft·llama·模型训练·训练·大模型训练·llama-factory
大模型训练师的炼丹之道 (1)-最新版llama-factory环境搭建和全排错在人工智能的演进图谱中,大模型训练始终占据着技术金字塔的顶端。它不仅是AI Agent开发的上层建筑,更是当Agent应用发展到一定深度后,不可避免必须跨越的技术鸿沟。唯有掌握底层模型的塑造能力,才能真正突破通用能力的天花板。
闲人编程3 天前
ai·开源·微调·智能体·决策·自进化·决策矩阵
开源 vs 闭源:构建Agent该如何选择基座模型?“当你为Agent选择基座模型时,你不仅在选择一个‘大脑’,更是在选择成本曲线、隐私边界、可控程度和进化速度。开源与闭源早已不是宗教之争,而是一道需要精密计算的工程决策题。在2026年Agent全面落地的今天,这道题的答案比任何时候都更复杂。”
小何code5 天前
lora·大模型·微调·prompt工程
人工智能【第26篇】大模型应用实战:Prompt工程与微调技巧作者的话:在前面的文章中,我们学习了GPT等大语言模型。然而,拥有强大的模型只是第一步,如何有效地使用这些模型才是真正的挑战。本文将深入讲解Prompt工程(提示工程)和微调技巧,帮助你从"会用"大模型进阶到"用好"大模型!
乔江seven8 天前
人工智能·深度学习·计算机视觉·微调·imagenetdogs
【跟李沐学AI】24 狗的品种识别(ImageNet Dogs)本章内容与上一章节的图像分类任务(CIFAR-10)相近,主要区别在于:① 图像数据更复杂,多样性更大,图像增广处理不一致;② 使用预训练的模型,并采用冻结微调策略; ③ 预测的输出不再是类别,而是一个包含所有类别预测概率的向量。
xian_wwq9 天前
笔记·学习·微调·llama factory
【学习笔记】大模型微调实战指南作为AI工程师,掌握大模型微调是落地垂直领域应用的核心技能。毕竟通用大模型无法覆盖企业私有知识、行业专属场景,而微调能让模型快速适配特定需求。
cooldream200915 天前
微调·unsloth
Unsloth微调实战:用LoRA技术打造专属文言文翻译模型在大语言模型(LLM)飞速发展的今天,如何利用有限的显卡资源高效完成模型微调,成为了众多开发者和研究者关注的焦点。Unsloth 作为一款新兴的模型训练加速框架,通过优化显存占用和训练速度,让普通开发者也能在消费级GPU上完成高质量的模型微调工作。本文将以文言文翻译任务为实战案例,手把手教您搭建完整的Unsloth微调环境,并完成从环境配置到模型推理的全流程操作。
Flying pigs~~17 天前
数据库·人工智能·缓存·微调·知识库·rag
RAG智慧问答项目核心技术:Python+LangChain+Milvus+BGE-M3+BGE-Reranker-Large+bert-base-chinese微调+Qwen2.5-14B (INT8)+光明AI大模型+PaddleOCR+MySQL+Redis+FastAPI+Docker+Vue3+Typescript
Java后端的Ai之路20 天前
人工智能·lora·微调
什么是“多模态微调”?对了,分享一个我最近常看的AI人工智能学习渠道,讲得挺有章法的,不端着也不故弄玄虚。不感兴趣划走就行,感兴趣的可以自己去验证一下。
Flying pigs~~20 天前
人工智能·深度学习·lora·大模型·微调·transformer
LoRA 面试完全指南:低秩分解原理 + Transformer 应用关键词:LoRA、低秩分解、参数高效微调、PEFT、TransformerLoRA(Low-Rank Adaptation)是一种参数高效微调方法,通过在预训练模型旁注入可训练的低秩分解矩阵,大幅减少需要训练的参数数量。
Flying pigs~~21 天前
人工智能·大模型·微调·prompt
大模型Prompt-Tuning技术详解:从入门到进阶一文读懂NLP范式演进、Fine-Tuning与Prompt-Tuning的核心原理随着ChatGPT、GPT-4等大模型的爆火,Prompt-Tuning技术逐渐成为学术界和工业界关注的焦点。本文将系统介绍NLP任务的四种发展范式,深入剖析Fine-Tuning和Prompt-Tuning的核心原理,并带你了解面向超大规模模型的先进微调技术。
乔江seven22 天前
人工智能·深度学习·计算机视觉·微调
【李沐 | 动手学深度学习】 21 计算机视觉:微调目录前言网络架构为什么要进行微调?1 微调详解1.1 微调的核心步骤1.2 常用的微调策略2 代码实现
kylin-运维23 天前
微调·训练·unsloth studio·离线环境
Unsloth Studio 使用问题记录离线环境,官方docker镜像,k8s环境使用手动下载源码https://github.com/ggml-org/llama.cpp传到unsloth内 根据报错日志的路径,创建目录
x_lrong24 天前
微调·部署·昇腾·ascend·llamafactory·qwen3·vllm-ascend
昇腾Ascend环境微调部署Qwen3(LlamaFactory+vLLM-Ascend)环境介绍:GitCode:实例:NPU basic · 1 * NPU 910B · 16v CPU · 64GB
AI、少年郎1 个月前
人工智能·python·ai·大模型·微调·大模型训练·minimind
MiniMind 第 4 篇:《数据工程|Tokenizer 训练 + 预训练 / SFT/DPO 全数据集处理》承接上一篇内容:我们拆解了 MiniMind 底层核心架构,吃透了 RMSNorm、SwiGLU、RoPE 三大组件的工程实现与优化逻辑。现在,终于轮到 LLM 最关键的「粮草」—— 数据工程。
博士僧小星1 个月前
人工智能·lora·大模型·微调·peft·qlora·prefix tuning
人工智能|大模型——训练——大模型微调全栈指南:从Transformer架构、10+种PEFT原理、流程与实战(全网最详细)本文是一份面向工程落地的大模型参数高效微调(PEFT)深度技术指南。全文覆盖:① 大模型“预训练→微调”两阶段范式本质;② Transformer 架构中各 PEFT 方法的作用位置与数学原理;③ LoRA、QLoRA、Adapter Tuning、Prefix Tuning、Prompt Tuning、P-Tuning v1、P-Tuning v2 共 7 种主流方法的完整技术解构(含公式、结构图示逻辑、参数量级、实证效果);④ 从 PDF 文档→Markdown→QA 数据集→微调训练→监控部署的端到
发光的叮当猫1 个月前
人工智能·微调·rag·ai工程
AI工程可能会遇到的一些问题1,检索质量太差,根本没有检索到正确内容原因:embedding不行,相似度算错,语义没对齐。query没有被改写,完全没有上下文,检索失败。
羊小猪~~2 个月前
python·考研·算法·ai·大模型·llm·微调
LLM--SFT简介SFT,监督微调,指在预训练模型的基础上,通过有标注的数据进行下一步训练,使其称为在特定任务上表现良好。
deephub2 个月前
人工智能·深度学习·机器学习·微调·prompt
知识引导上下文优化(KgCoOp):一种解决灾难性遗忘的 Prompt Tuning 机制视觉-语言模型(VLMs)如 CLIP 彻底改变了零样本图像识别的处理方式。这类模型在包含 4 亿个图像-文本对的大规模数据集上进行训练,捕获了海量通用知识,具备了识别未被明确训练过对象的能力。
魔乐社区2 个月前
微调·llama·qwen3.5
在魔乐社区使用llama-factory微调Qwen3.5-4B模型我们依然是搭建一个miniconda可以使用下面的命令验证是否安装成功:显示llamafactory的版本,则表示安装成功