【大模型】Llama 3.2 大语言模型初探:模型权重下载

文章目录

  • 一、简介
  • 二、权重下载
    • [2.1 方法一:Meta 官网申请下载](#2.1 方法一:Meta 官网申请下载)
    • [2.2 方法二:使用 hugging face 下载](#2.2 方法二:使用 hugging face 下载)

一、简介

Llama(Large Language Model Meta AI)是 Meta(原 Facebook)开发的一系列开源大型语言模型。它的目标是提供一个高性能、可扩展的基础模型,供研究社区和开发者使用,推动人工智能领域的开放研究。

发布时间:Llama 系列模型于 2023 年 2 月首次发布。

开源性质:Llama 是开源的,但仅限于非商业用途和研究目的,需要申请访问权限。

模型规模:Llama 提供了多种规模的模型,参数量从 70 亿(7B)到 650 亿(650B)不等。

  • Llama-7B:70 亿参数
  • Llama-13B:130 亿参数
  • Llama-30B:300 亿参数
  • Llama-65B:650 亿参数

二、权重下载

2.1 方法一:Meta 官网申请下载

首先来到 Meta官网

点击 Download models

在页面中填入相关信息,并勾选想要下载的 models

注:国家、地区最好选择 US

提交后会跳转另一个界面,并有一封邮件发到你的邮箱

按照步骤简单配置一下环境

bash 复制代码
pip install llama-stack

查看有哪些模型

bash 复制代码
llama model list

会弹出如下相关可下载的模型

可能的报错:llama: command not found

可能的原因:python版本过低,查看自己python版本是否低于3.10。若是,则重新安装一个python 3.10的版本

然后选择自己想要下载模型的对应的ID,替换下面命令中的MODEL_ID

bash 复制代码
llama model download --source meta --model-id  MODEL_ID

此时会弹出一个让你输入 URL 链接的窗口
注意!!要将你邮件收到的那个很长的URL复制,然后粘贴到终端中。直接复制网页中的链接可能会失败。。。(听说)

如果正常,则会开始下载,下载成功就可以愉快的使用了

可能的报错:403 Forbidden

注意,模型下载在国内网络会出现"不好"的情况,需要使用"更佳"的网络来下载

尝试方法1:再申请一次,重新用新的连接(有时确实容易出现莫名的失败)

尝试方法2:使用了"更佳"的网络,但是还是失败。可能是因为当前终端没有挂载代理.

查看 http_proxy 和 https_proxy 环境变量

bash 复制代码
echo $http_proxy
echo $https_proxy

临时设置

bash 复制代码
export https_proxy=你的代理网址

取消设置

bash 复制代码
unset https_proxy

如果还是不行,可以参考官网相关issue来查看自己的解决方案

2.2 方法二:使用 hugging face 下载

待记录...


相关推荐
ss.li几秒前
TripGenie:畅游济南旅行规划助手:个人工作纪实(二十二)
javascript·人工智能·python
小天才才10 分钟前
前沿论文汇总(机器学习/深度学习/大模型/搜广推/自然语言处理)
人工智能·深度学习·机器学习·自然语言处理
草莓熊Lotso24 分钟前
【数据结构初阶】--算法复杂度的深度解析
c语言·开发语言·数据结构·经验分享·笔记·其他·算法
KyollBM30 分钟前
【CF】Day75——CF (Div. 2) B (数学 + 贪心) + CF 882 (Div. 2) C (01Trie | 区间最大异或和)
c语言·c++·算法
新加坡内哥谈技术40 分钟前
Meta计划借助AI实现广告创作全自动化
运维·人工智能·自动化
CV点灯大师44 分钟前
C++算法训练营 Day10 栈与队列(1)
c++·redis·算法
GGBondlctrl1 小时前
【leetcode】递归,回溯思想 + 巧妙解法-解决“N皇后”,以及“解数独”题目
算法·leetcode·n皇后·有效的数独·解数独·映射思想·数学思想
西猫雷婶1 小时前
pytorch基本运算-导数和f-string
人工智能·pytorch·python
Johny_Zhao1 小时前
华为MAAS、阿里云PAI、亚马逊AWS SageMaker、微软Azure ML各大模型深度分析对比
linux·人工智能·ai·信息安全·云计算·系统运维
顽强卖力1 小时前
第二十八课:深度学习及pytorch简介
人工智能·pytorch·深度学习