kaggle 如何利用API下载数据集

首先 上传kaggle官网生成得 API 密钥: kaggle.json 文件。放到该代码同目录下,再运行一下代码。

注:

只需要修改'''下载竞赛数据集''',就可以选择你的指定数据集。

jupyter文件运行

python 复制代码
#首先 上传 kaggle.json 文件并设置 API 密钥
#再运行此代码

!pip install kaggle

import os
import shutil

if not os.path.exists(os.path.expanduser('~/.kaggle')):
    os.makedirs(os.path.expanduser('~/.kaggle'))

if os.path.exists(os.path.expanduser('kaggle.json')):
    # 将 kaggle.json 文件移到正确的位置
    shutil.move('kaggle.json', os.path.expanduser('~/.kaggle/kaggle.json'))
else:
    print("你没有将kaggle.json文件放置该代码同目录下")

# 确保文件权限正确
os.chmod(os.path.expanduser('~/.kaggle/kaggle.json'), 0o600)

# 下载竞赛数据
!kaggle competitions download -c child-mind-institute-problematic-internet-use -p ./data

# 检查下载的文件
import os
print(os.listdir('./data'))

# 解压下载的 ZIP 文件
import zipfile

with zipfile.ZipFile('./data/child-mind-institute-problematic-internet-use.zip', 'r') as zip_ref:
    zip_ref.extractall('./data')

# 加载数据
import pandas as pd

# 假设下载的是 train.csv 文件
data = pd.read_csv('./data/train.csv')

# 查看数据的前几行
data.head()
相关推荐
a程序小傲20 小时前
字节跳动Java面试被问:Fork/Join框架的使用场景
开发语言·python
Java后端的Ai之路20 小时前
【神经网络基础】-一个完整的神经网络学习过程是怎样的?
人工智能·深度学习·神经网络·学习·激活函数
Lauren_Blueblue20 小时前
【OPEN MLSYS】机器学习系统:设计和实现-基础篇
神经网络·机器学习·框架·机器学习原理
whitelbwwww20 小时前
图像处理--pytorch
图像处理·人工智能·pytorch
快降重20 小时前
超越“查重”:在AI协作时代构建无法被算法复制的学术价值
人工智能·深度学习·aigc·降ai·学术工具
renhongxia120 小时前
大型视觉语言模型下的异常链思维
人工智能·语言模型·自然语言处理
生成论实验室20 小时前
即事成象:频率生成论——应对AI范式转型的生成存在论及其中国经典基础
人工智能·科技·神经网络·信息与通信·几何学
阿正的梦工坊20 小时前
ARE:Meta 发布的代理研究平台,如何构建动态环境并实现大规模扩展
人工智能·深度学习·机器学习·大模型
老歌老听老掉牙20 小时前
基于参数化模型的砂轮轮廓建模与可视化
python·数学建模
weisian15120 小时前
入门篇--知名企业-8-Amazon:从在线书商到万物帝国——一部重塑现代商业与生活的传奇
人工智能·生活