【大模型】Llama 3.2 大语言模型初探:模型权重下载

文章目录

  • 一、简介
  • 二、权重下载
    • [2.1 方法一:Meta 官网申请下载](#2.1 方法一:Meta 官网申请下载)
    • [2.2 方法二:使用 hugging face 下载](#2.2 方法二:使用 hugging face 下载)

一、简介

Llama(Large Language Model Meta AI)是 Meta(原 Facebook)开发的一系列开源大型语言模型。它的目标是提供一个高性能、可扩展的基础模型,供研究社区和开发者使用,推动人工智能领域的开放研究。

发布时间:Llama 系列模型于 2023 年 2 月首次发布。

开源性质:Llama 是开源的,但仅限于非商业用途和研究目的,需要申请访问权限。

模型规模:Llama 提供了多种规模的模型,参数量从 70 亿(7B)到 650 亿(650B)不等。

  • Llama-7B:70 亿参数
  • Llama-13B:130 亿参数
  • Llama-30B:300 亿参数
  • Llama-65B:650 亿参数

二、权重下载

2.1 方法一:Meta 官网申请下载

首先来到 Meta官网

点击 Download models

在页面中填入相关信息,并勾选想要下载的 models

注:国家、地区最好选择 US

提交后会跳转另一个界面,并有一封邮件发到你的邮箱

按照步骤简单配置一下环境

bash 复制代码
pip install llama-stack

查看有哪些模型

bash 复制代码
llama model list

会弹出如下相关可下载的模型

可能的报错:llama: command not found

可能的原因:python版本过低,查看自己python版本是否低于3.10。若是,则重新安装一个python 3.10的版本

然后选择自己想要下载模型的对应的ID,替换下面命令中的MODEL_ID

bash 复制代码
llama model download --source meta --model-id  MODEL_ID

此时会弹出一个让你输入 URL 链接的窗口
注意!!要将你邮件收到的那个很长的URL复制,然后粘贴到终端中。直接复制网页中的链接可能会失败。。。(听说)

如果正常,则会开始下载,下载成功就可以愉快的使用了

可能的报错:403 Forbidden

注意,模型下载在国内网络会出现"不好"的情况,需要使用"更佳"的网络来下载

尝试方法1:再申请一次,重新用新的连接(有时确实容易出现莫名的失败)

尝试方法2:使用了"更佳"的网络,但是还是失败。可能是因为当前终端没有挂载代理.

查看 http_proxy 和 https_proxy 环境变量

bash 复制代码
echo $http_proxy
echo $https_proxy

临时设置

bash 复制代码
export https_proxy=你的代理网址

取消设置

bash 复制代码
unset https_proxy

如果还是不行,可以参考官网相关issue来查看自己的解决方案

2.2 方法二:使用 hugging face 下载

待记录...


相关推荐
天若有情67313 分钟前
用 C++ 实现选择题答案随机生成器:从生活灵感走向代码实践
c++·算法·生活
LeeZhao@13 分钟前
【AGI】智谱开源2025:一场AI技术民主化的革命正在到来
人工智能·开源·aigc·语音识别·agi
个推技术18 分钟前
个推助力小米米家全场景智能生活体验再升级
人工智能
科技快报22 分钟前
中兴移动互联终端三剑齐发 AI、5G-A、WiFi7构建高效智能网络
网络·人工智能·5g
惊雲浅谈天23 分钟前
Self-Supervised Prompt Optimization
人工智能·prompt
树莓集团27 分钟前
海南自贸港的数字先锋:树莓集团的战略布局解析
大数据·人工智能·物联网·百度·创业创新
dorabighead40 分钟前
小哆啦解题记:螺旋矩阵
算法·矩阵·力扣·大话算法
kk努力学编程1 小时前
C语言综合案例:学生成绩管理系统
c语言·开发语言·算法
阿正的梦工坊1 小时前
变分扩散模型 ELBO 重构推导详解
人工智能·深度学习·算法·机器学习
自信的小螺丝钉1 小时前
Leetcode 1477. 找两个和为目标值且不重叠的子数组 前缀和+DP
算法·leetcode·前缀和·动态规划