kaggle 如何利用API下载数据集

首先 上传kaggle官网生成得 API 密钥: kaggle.json 文件。放到该代码同目录下,再运行一下代码。

注:

只需要修改'''下载竞赛数据集''',就可以选择你的指定数据集。

jupyter文件运行

python 复制代码
#首先 上传 kaggle.json 文件并设置 API 密钥
#再运行此代码

!pip install kaggle

import os
import shutil

if not os.path.exists(os.path.expanduser('~/.kaggle')):
    os.makedirs(os.path.expanduser('~/.kaggle'))

if os.path.exists(os.path.expanduser('kaggle.json')):
    # 将 kaggle.json 文件移到正确的位置
    shutil.move('kaggle.json', os.path.expanduser('~/.kaggle/kaggle.json'))
else:
    print("你没有将kaggle.json文件放置该代码同目录下")

# 确保文件权限正确
os.chmod(os.path.expanduser('~/.kaggle/kaggle.json'), 0o600)

# 下载竞赛数据
!kaggle competitions download -c child-mind-institute-problematic-internet-use -p ./data

# 检查下载的文件
import os
print(os.listdir('./data'))

# 解压下载的 ZIP 文件
import zipfile

with zipfile.ZipFile('./data/child-mind-institute-problematic-internet-use.zip', 'r') as zip_ref:
    zip_ref.extractall('./data')

# 加载数据
import pandas as pd

# 假设下载的是 train.csv 文件
data = pd.read_csv('./data/train.csv')

# 查看数据的前几行
data.head()
相关推荐
Python测试之道1 分钟前
Deepseek API+Python 测试用例一键生成与导出 V1.0.6(加入分块策略,返回更完整可靠)
开发语言·python·测试用例
SRC_BLUE_174 分钟前
Python GUI 编程 | QObject 控件基类详解 — 定时器
开发语言·数据库·python
Naomi5215 分钟前
Trustworthy Machine Learning
人工智能·机器学习
啊阿狸不会拉杆12 分钟前
第二十一章:Python-Plotly库实现数据动态可视化
开发语言·python·plotly
刘 怼怼18 分钟前
使用 Vue 重构 RAGFlow 实现聊天功能
前端·vue.js·人工智能·重构
程序员安仔19 分钟前
每天学新 AI 工具好累?我终于发现了“一键全能且免费不限量”的国产终极解决方案
人工智能
闭月之泪舞19 分钟前
OpenCv(五)——边缘检测
人工智能·计算机视觉
月走乂山19 分钟前
nocobase + Python爬虫实现数据可视化
爬虫·python·低代码·信息可视化
星霜旅人21 分钟前
K-均值聚类
人工智能·机器学习
滴答滴答嗒嗒滴23 分钟前
Python小练习系列 Vol.12:学生信息排序(sorted + key函数)
开发语言·python