【星海出品】大模型微调-Part-One

LoRA (Low-Rank Adaptation of Large Language Model)

大规模语言模型的低秩适应

低秩: 指矩阵的秩远小于其行数和列数,意味着数据中存在大量冗余信息 。

NLA - 自然语言自编码器(Natural Language Autoencoder(s))

DeepSeek-Flash(即DeepSeek-V4-Flash)的总参数量为2840亿(284B),但在实际推理时,只会激活约130亿(13B)的参数

LLaMA-Factory

Unsloth Pro + LoRA-XT + QLoRA

HuggingFace生态: https://huggingface.co/

阿里巴巴达摩院提出的魔塔社区: https://modelscope.cn

行业有人称其为中国版的HuggingFace

LLaMA-Factory: https://github.com/hiyouga/LLaMA-Factory

Unsloth: https://github.com/unslothai/unsloth

适用 RTX 5080

使用的5080 16G显存 甜点级 大模型

文本生成模型:8B-13B级别(如Llama 3 8B/13B、Qwen2.5 14B)全精度模型

对比ollama提供的cloud 模型速度比,本地速度快出一小截

可能涉及到本地调整的参数与云上不同,以及云传的网络过滤延迟等。

相关推荐
coldstarry1 小时前
sheng的学习笔记-AI-xgboost
人工智能·机器学习·boosting
2601_959986241 小时前
M4Markets:把工具可用性做到位——逻辑梳理与提示整理
大数据·人工智能
笑尘~Y1 小时前
每日GitCode开源项目精选
语言模型
程序员小崔日记1 小时前
十年后回头看,2026 年或许是程序员行业的转折点
人工智能·ai编程·claudecode
ZzT1 小时前
给 Claude Code 装个 profiler:每个工具调用慢在哪,瀑布流时间线里一眼看见
人工智能·github·claude
阿聪谈架构2 小时前
第13章:AI异步与生产部署 —— 让 AI 服务稳定高效地面向用户
人工智能·后端
黑暗森林观察者2 小时前
AI Agent 的"记忆进化":Skills 自进化框架如何让 Agent 越用越聪明?
人工智能
兆。2 小时前
LangChain大模型服务集成指南:面向AI应用开发者
人工智能·langchain
刘一说2 小时前
AI科技热点日报 | 2026年5月29日
人工智能·科技