【大模型】Llama 3.2 大语言模型初探:模型权重下载

文章目录

  • 一、简介
  • 二、权重下载
    • [2.1 方法一:Meta 官网申请下载](#2.1 方法一:Meta 官网申请下载)
    • [2.2 方法二:使用 hugging face 下载](#2.2 方法二:使用 hugging face 下载)

一、简介

Llama(Large Language Model Meta AI)是 Meta(原 Facebook)开发的一系列开源大型语言模型。它的目标是提供一个高性能、可扩展的基础模型,供研究社区和开发者使用,推动人工智能领域的开放研究。

发布时间:Llama 系列模型于 2023 年 2 月首次发布。

开源性质:Llama 是开源的,但仅限于非商业用途和研究目的,需要申请访问权限。

模型规模:Llama 提供了多种规模的模型,参数量从 70 亿(7B)到 650 亿(650B)不等。

  • Llama-7B:70 亿参数
  • Llama-13B:130 亿参数
  • Llama-30B:300 亿参数
  • Llama-65B:650 亿参数

二、权重下载

2.1 方法一:Meta 官网申请下载

首先来到 Meta官网

点击 Download models

在页面中填入相关信息,并勾选想要下载的 models

注:国家、地区最好选择 US

提交后会跳转另一个界面,并有一封邮件发到你的邮箱

按照步骤简单配置一下环境

bash 复制代码
pip install llama-stack

查看有哪些模型

bash 复制代码
llama model list

会弹出如下相关可下载的模型

可能的报错:llama: command not found

可能的原因:python版本过低,查看自己python版本是否低于3.10。若是,则重新安装一个python 3.10的版本

然后选择自己想要下载模型的对应的ID,替换下面命令中的MODEL_ID

bash 复制代码
llama model download --source meta --model-id  MODEL_ID

此时会弹出一个让你输入 URL 链接的窗口
注意!!要将你邮件收到的那个很长的URL复制,然后粘贴到终端中。直接复制网页中的链接可能会失败。。。(听说)

如果正常,则会开始下载,下载成功就可以愉快的使用了

可能的报错:403 Forbidden

注意,模型下载在国内网络会出现"不好"的情况,需要使用"更佳"的网络来下载

尝试方法1:再申请一次,重新用新的连接(有时确实容易出现莫名的失败)

尝试方法2:使用了"更佳"的网络,但是还是失败。可能是因为当前终端没有挂载代理.

查看 http_proxy 和 https_proxy 环境变量

bash 复制代码
echo $http_proxy
echo $https_proxy

临时设置

bash 复制代码
export https_proxy=你的代理网址

取消设置

bash 复制代码
unset https_proxy

如果还是不行,可以参考官网相关issue来查看自己的解决方案

2.2 方法二:使用 hugging face 下载

待记录...


相关推荐
图学习小组1 分钟前
Degradation-Aware Feature Perturbation for All-in-One Image Restoration
人工智能·深度学习·计算机视觉
CoovallyAIHub4 分钟前
AAAI 2026这篇杰出论文说了什么?用LLM给CLIP换了个“聪明大脑”
深度学习·算法·计算机视觉
迎仔5 分钟前
05-AI与网络安全
人工智能·安全·web安全
Aric_Jones8 分钟前
后台文章发布页添加 AI 自动生成摘要功能
人工智能
9呀12 分钟前
【ros2】OccupancyGrid消息里的resolution
人工智能·机器人
DuHz14 分钟前
通过超宽带信号估计位置——论文精读
论文阅读·人工智能·机器学习·自动驾驶·汽车
静听松涛13315 分钟前
大语言模型长上下文技术突破:如何处理超长文本的注意力机制与架构图解
人工智能·语言模型·架构
yuanmenghao16 分钟前
Linux 性能实战 | 第 10 篇 CPU 缓存与内存访问延迟
linux·服务器·缓存·性能优化·自动驾驶·unix
Physicist in Geophy.16 分钟前
一维波动方程(从变分法角度)
线性代数·算法·机器学习
我送炭你添花16 分钟前
电子世界的奇妙冒险:从一个电阻开始(系列目录)
人工智能·单片机·嵌入式硬件·fpga开发