【星海出品】大模型微调-Part-One

LoRA (Low-Rank Adaptation of Large Language Model)

大规模语言模型的低秩适应

低秩: 指矩阵的秩远小于其行数和列数,意味着数据中存在大量冗余信息 。

NLA - 自然语言自编码器(Natural Language Autoencoder(s))

DeepSeek-Flash(即DeepSeek-V4-Flash)的总参数量为2840亿(284B),但在实际推理时,只会激活约130亿(13B)的参数

LLaMA-Factory

Unsloth Pro + LoRA-XT + QLoRA

HuggingFace生态: https://huggingface.co/

阿里巴巴达摩院提出的魔塔社区: https://modelscope.cn

行业有人称其为中国版的HuggingFace

LLaMA-Factory: https://github.com/hiyouga/LLaMA-Factory

Unsloth: https://github.com/unslothai/unsloth

适用 RTX 5080

使用的5080 16G显存 甜点级 大模型

文本生成模型:8B-13B级别(如Llama 3 8B/13B、Qwen2.5 14B)全精度模型

对比ollama提供的cloud 模型速度比,本地速度快出一小截

可能涉及到本地调整的参数与云上不同,以及云传的网络过滤延迟等。

相关推荐
vanuan几秒前
MCP协议实战(Java版):用Spring Boot让AI直接查你的数据库
人工智能
雪隐24 分钟前
个人电脑玩AI-06让5060 Ti给你打工——不光能画画,Qwen3-TTS还能学人说话,连我老板都信了!
人工智能·后端·python
Coffeeee1 小时前
帮你快速理解AI Agent之我想招个Android实习生
android·人工智能·agent
新新技术迷1 小时前
AI聊天自动跟随滚动,附回到底部按钮
人工智能
先锋部队1 小时前
用Web Worker解析AI返回的大文本不卡UI
人工智能
把你拉进白名单1 小时前
8.OpenClaw源码解析——三层洋葱重试
人工智能·llm·agent
用户632415031781 小时前
拖文档进AI对话框解析,前端要处理哪些脏活
人工智能
姗姗来迟了1 小时前
AI回答里的引用来源卡片,前端怎么做
人工智能
用户7106207733401 小时前
Codex-端口配置错误排查案例(stream disconnected before completion)
人工智能
IT_陈寒2 小时前
JavaScript的默认参数挖坑实录,我掉进去了
前端·人工智能·后端