服务器对kaggle比赛的数据集下载

1.在本地获取 Kaggle API Key(kaggle.json)

登录你的 Kaggle 账号。

点击右上角头像 → Setting。

滚动到 API 区域,点击 Create New Token。

会下载一个文件:kaggle.json(包含用户名和密钥)。


2.建议安装conda环境进行隔离

3.安装 Kaggle CLI

pip install kaggle命令即可

4.配置 Kaggle 密钥文件

创建 .kaggle 文件夹:

bash 复制代码
mkdir -p ~/.kaggle

手动创建:

bash 复制代码
vim ~/.kaggle/kaggle.json

使用i进入编辑模式,看到下面最后一行有INSERT即可以编辑,去复制步骤一下载的kaggle.json文件,使用Ctrl+Shift+V命令粘贴 kaggle.json 的内容进去

然后esc退出编辑模式,:wq保存并退出即可

也可以设置权限:

bash 复制代码
chmod 600 ~/.kaggle/kaggle.json

如果不设置也行,就是下载数据集的时候有warning

5.下载数据集

一般来说,kaggle的数据集下载分为竞赛数据集、公开数据集和特定文件

如果数据集属于某个 Kaggle 竞赛(如 classify-leaves),使用 competitions download 命令:

bash 复制代码
kaggle competitions download -c <竞赛名称>

示例:

bash 复制代码
kaggle competitions download -c classify-leaves

文件会以 zip 格式下载到当前目录,解压命令:

bash 复制代码
unzip classify-leaves.zip

下载公开数据集

如果数据集是公开的(如 titanic 数据集),使用 datasets download 命令:

bash 复制代码
kaggle datasets download -d <数据集作者/数据集名称>
相关推荐
X.AI66630 分钟前
YouTube评论情感分析项目84%正确率:基于BERT的实战复现与原理解析
人工智能·深度学习·bert
Hard_Liquor1 小时前
Datawhale秋训营-“大运河杯”数据开发应用创新大赛
人工智能·深度学习·算法
Saniffer_SH1 小时前
搭载高性能GPU的英伟达Nvidia DGX Spark桌面性能小怪兽国内首台开箱视频!
人工智能·深度学习·神经网络·ubuntu·机器学习·语言模型·边缘计算
Tiandaren2 小时前
自用提示词01 || Prompt Engineering || 学习路线大纲 || 作用:通过启发式的问题来带动学习
人工智能·pytorch·深度学习·nlp·prompt·1024程序员节
大象耶3 小时前
自然语言处理前沿创新方向与技术路径
论文阅读·人工智能·深度学习·计算机网络·机器学习
南方的狮子先生3 小时前
【逻辑回归】从线性模型到逻辑回归
算法·机器学习·逻辑回归
Theodore_10226 小时前
深度学习(3)神经网络
人工智能·深度学习·神经网络·算法·机器学习·计算机视觉
文火冰糖的硅基工坊6 小时前
[人工智能-大模型-70]:模型层技术 - 从数据中自动学习一个有用的数学函数的全过程,AI函数计算三大件:神经网络、损失函数、优化器
人工智能·深度学习·神经网络
文火冰糖的硅基工坊7 小时前
[人工智能-大模型-69]:模型层技术 - 计算机处理问题的几大分支:数值型性问题、非数值型问题?
算法·决策树·机器学习
OG one.Z8 小时前
05_逻辑回归
算法·机器学习·逻辑回归