kaggle 如何利用API下载数据集

首先 上传kaggle官网生成得 API 密钥: kaggle.json 文件。放到该代码同目录下,再运行一下代码。

注:

只需要修改'''下载竞赛数据集''',就可以选择你的指定数据集。

jupyter文件运行

python 复制代码
#首先 上传 kaggle.json 文件并设置 API 密钥
#再运行此代码

!pip install kaggle

import os
import shutil

if not os.path.exists(os.path.expanduser('~/.kaggle')):
    os.makedirs(os.path.expanduser('~/.kaggle'))

if os.path.exists(os.path.expanduser('kaggle.json')):
    # 将 kaggle.json 文件移到正确的位置
    shutil.move('kaggle.json', os.path.expanduser('~/.kaggle/kaggle.json'))
else:
    print("你没有将kaggle.json文件放置该代码同目录下")

# 确保文件权限正确
os.chmod(os.path.expanduser('~/.kaggle/kaggle.json'), 0o600)

# 下载竞赛数据
!kaggle competitions download -c child-mind-institute-problematic-internet-use -p ./data

# 检查下载的文件
import os
print(os.listdir('./data'))

# 解压下载的 ZIP 文件
import zipfile

with zipfile.ZipFile('./data/child-mind-institute-problematic-internet-use.zip', 'r') as zip_ref:
    zip_ref.extractall('./data')

# 加载数据
import pandas as pd

# 假设下载的是 train.csv 文件
data = pd.read_csv('./data/train.csv')

# 查看数据的前几行
data.head()
相关推荐
yy.y--1 分钟前
Java线程实现浏览器实时时钟
java·linux·开发语言·前端·python
Dr.AE6 分钟前
深小i 产品分析报告
大数据·人工智能·政务
吾在学习路6 分钟前
AoP-SAM: Automation of Prompts for Efficient Segmentation
人工智能·深度学习·算法·计算机视觉
Dontla7 分钟前
Python Streamlit介绍(开源Python Web应用框架,快速将Python脚本转换成交互式Web应用,适合数据科学和机器学习项目快速展示)
前端·python·开源
新缸中之脑12 分钟前
顶级视频生成模型 (2026)
人工智能
技术宅学长17 分钟前
Router门控网络简单介绍
人工智能·深度学习
健康平安的活着19 分钟前
AI之Toolcalling的使用案例(langchain4j+springboot)
人工智能·spring boot·后端
2501_9269783323 分钟前
大模型“脱敏--加密”--“本地轻头尾运算--模型重运算”
人工智能·经验分享·架构
少云清26 分钟前
【UI自动化测试】12_web自动化测试 _验证码处理和cookie
前端·python·web自动化测试
冰西瓜60029 分钟前
深度学习的数学原理(十二)—— CNN的反向传播
人工智能·深度学习·cnn