大模型笔记1: Longformer环境配置

论文:

https://arxiv.org/abs/2004.05150

首先保证电脑上配置了git.

git环境配置:

https://blog.csdn.net/Andone_hsx/article/details/87937329

|----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 3.1、找到git安装路径中bin的位置,如:D:\Program Files\Git\bin 找到git安装路径中git-core的位置,如:D:\Program Files\Git\libexec\git-core; 注:"D:\Program Files\Git\"是安装路径,可能与你的安装路径不一样,要按照你自己的路径替换"D:\Program Files\Git\" 3.2、右键"计算机"->"属性"->"高级系统设置"->"环境变量"->在下方的"系统变量"中找到"path"->选中"path"并选择"编辑"->将 3.1中找到的bin和git-core路径复制到其中->保存并退出 注:"path"中,每个路径之间要以英文输入状态下的分号------";"作为间隔 |
| D:\Program Files\Git\mingw64\bin D:\Program Files\Git\mingw64\libexec\git-core |

安装环境

|------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| conda create --name longformer python=3.7 y conda activate longformer conda install cudatoolkit=10.0 y pip install git+https://github.com/allenai/longformer.git |

报错:

|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| ERROR: Could not find a version that satisfies the requirement pandas>=0.20.3 (from test-tube) (from versions: none) ERROR: No matching distribution found for pandas>=0.20.3 |
| No module named 'pandas' |

Install装不上, 在anaconda navigator装的

更换清华源后似乎可以继续运行了, 参考:

https://www.cnblogs.com/raiuny/p/15950043.html

|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| conda config --add channels Index of /anaconda/cloud/pytorch/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror conda config --set show_channel_urls yes conda config --set auto_activate_base false pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple |

好几次报错128, 也许是RP问题, 总之重新运行几次后安装成功了.

环境安装成功会显示successful.

接着跑tests文件夹的test_readme.py, 注意需要下载longformer-base-4096.tar.gz

这个文件我放在项目目录下的/tmp文件夹和tests/tmp都无法读取, 因此修改了self.model_dir路径为绝对路径, 并注释下载解压代码, 就可以运行了:

相关推荐
苏九黎10 小时前
搭建大语言模型
人工智能·语言模型·自然语言处理
deephub10 小时前
基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展
人工智能·深度学习·语言模型·知识图谱·图神经网络
果冻人工智能13 小时前
人工智能大语言模型起源篇,低秩微调(LoRA)
人工智能·深度学习·语言模型
野蛮的大西瓜13 小时前
如何持续优化呼叫中心大模型呼出机器人的性能?
java·人工智能·语言模型·自然语言处理·机器人·信息与通信
Soungkayou15 小时前
BERTective: Language Models and Contextual Information for Deception Detection
人工智能·深度学习·语言模型
UQI-LIUWJ21 小时前
论文结论:GPTs and Hallucination Why do large language models hallucinate
人工智能·语言模型·自然语言处理
有梦想的鱼1 天前
大语言模型画图(流程图、框架图)
人工智能·语言模型·自然语言处理
rommel rain1 天前
KeyFormer:使用注意力分数压缩KV缓存
语言模型·transformer
野蛮的大西瓜2 天前
评估一套呼叫中心大模型呼出机器人的投入回报比?
java·语言模型·自然语言处理·机器人·信息与通信
野蛮的大西瓜2 天前
大模型呼出机器人能够解决哪些问题?
java·人工智能·语言模型·自然语言处理·机器人·信息与通信