羊驼系列大模型LLaMa、Alpaca、Vicuna

南宫凝忆2024-01-21 13:32

羊驼系列大模型：大模型的安卓系统

GPT系列：类比ios系统，不开源

LLaMa让大模型平民化

LLaMa优势

用到的数据：大部分英语、西班牙语，少中文

模型下载地址

https://huggingface.co/meta-llama

Alpaca模型

Alpaca是斯坦福从Meta的LLaMA 7B微调而来的全新模型 (套壳)仅用了52k数据，性能约等于GPT-3.5。

训练成本奇低，总成本不到600美元

在8个80GB A100上训练了3个小时，不到100美元;
生成数据使用OpenAl的AP1，500美元。(数据标注: 问题问chatgpt，用它的回答作为标注数据)

Alpaca模型的训练

Vicuna模型

Vicuna简介

具体工作流程

用GPT4做评估，用更厉害的大模型做大模型

ChatGPT没找到合适的盈利模式

诸驼对比

华驼模型

百川大模型

LLaMa+中文数据

LLaMa2.0

具备人的情商

国内大模型清华6B(中英文数据各一半)、百度文心一言是原创，其它的套壳。

找大模型工作不要找研究型工作，而要找将大模型落地的工作。

微调的本质

原生llama用的通用语料
在自己的数据上进行微调，让模型能够满足自己的需求

羊驼系列的共性

上一篇：RabbitMQ与SpringAMQP

下一篇：31岁被毕业了

热门推荐

01Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 02全球最强模型Grok4，国内已可免费使用！（附教程）03Coze 开源了，送上保姆级私有化部署方案【建议收藏】04扣子开源本地部署教程丨Coze智能体小白喂饭级指南 05KGG转MP3工具|非KGM文件|解密音频 06腾讯还是太全面了，限时免费！超全CodeBuddy IDE保姆级教程！（附案例）07【手把手攻略】国家育儿补贴正式开领！一键算清你能拿多少钱？附补贴领取计算器 0801-开源版COZE-字节 Coze Studio 重磅开源！保姆级本地安装教程，手把手带你体验 09干翻 Typora！MilkUp：完全免费的桌面端 Markdown 编辑器！10coze 开源版本地部署及踩过的坑【喂饭级教程】