服务器对kaggle比赛的数据集下载

1.在本地获取 Kaggle API Key(kaggle.json)

登录你的 Kaggle 账号。

点击右上角头像 → Setting。

滚动到 API 区域,点击 Create New Token。

会下载一个文件:kaggle.json(包含用户名和密钥)。


2.建议安装conda环境进行隔离

3.安装 Kaggle CLI

pip install kaggle命令即可

4.配置 Kaggle 密钥文件

创建 .kaggle 文件夹:

bash 复制代码
mkdir -p ~/.kaggle

手动创建:

bash 复制代码
vim ~/.kaggle/kaggle.json

使用i进入编辑模式,看到下面最后一行有INSERT即可以编辑,去复制步骤一下载的kaggle.json文件,使用Ctrl+Shift+V命令粘贴 kaggle.json 的内容进去

然后esc退出编辑模式,:wq保存并退出即可

也可以设置权限:

bash 复制代码
chmod 600 ~/.kaggle/kaggle.json

如果不设置也行,就是下载数据集的时候有warning

5.下载数据集

一般来说,kaggle的数据集下载分为竞赛数据集、公开数据集和特定文件

如果数据集属于某个 Kaggle 竞赛(如 classify-leaves),使用 competitions download 命令:

bash 复制代码
kaggle competitions download -c <竞赛名称>

示例:

bash 复制代码
kaggle competitions download -c classify-leaves

文件会以 zip 格式下载到当前目录,解压命令:

bash 复制代码
unzip classify-leaves.zip

下载公开数据集

如果数据集是公开的(如 titanic 数据集),使用 datasets download 命令:

bash 复制代码
kaggle datasets download -d <数据集作者/数据集名称>
相关推荐
AI医影跨模态组学16 小时前
如何将纵向CT影像组学特征与局部晚期胃癌化疗时空异质性及耐药演化建立关联,并进一步解释其与化疗响应、淋巴结转移及生存预后的机制联系
人工智能·深度学习·论文·医学·医学影像·影像组学
有为少年17 小时前
从概率估计到“LLM 训练是有损压缩”
人工智能·线性代数·机器学习·计算机视觉·矩阵
小飞象—木兮17 小时前
《销售数据分析标准实践手册》:核心内涵与关键指标、落地销售数据分析的全流程···(附相关材料下载)
大数据·人工智能·数据挖掘·数据分析
硅谷秋水18 小时前
ClawVM:有状态工具LLM智体的Harness管理型虚拟内存
人工智能·深度学习·语言模型
春风有信19 小时前
【DM】DDPM与DDIM的数学原理
人工智能·深度学习·机器学习
刘大猫.19 小时前
宝马发布全新AI智能座舱助手 能理解用户复杂出行需求
人工智能·算法·机器学习·ai·大模型·算力·ai智能座舱助手
WHS-_-202220 小时前
Rank-Revealing Bayesian Block-Term Tensor Completion With Graph Information
人工智能·python·机器学习
T.i.s20 小时前
总变差正则化(TV Loss)的思考
人工智能·pytorch·深度学习
zh路西法20 小时前
【RDKX5多摄像头模型推理】USB带宽限制与ROS2话题零拷贝转发
linux·c++·python·深度学习
AI医影跨模态组学21 小时前
如何将多模态CT深度学习特征与肿瘤微环境中的免疫相关生物学过程建立关联,并进一步解释其与非小细胞肺癌新辅助免疫化疗后的pCR机制联系
人工智能·深度学习·论文·医学·医学影像·影像组学