kaggle 如何利用API下载数据集

首先 上传kaggle官网生成得 API 密钥: kaggle.json 文件。放到该代码同目录下,再运行一下代码。

注:

只需要修改'''下载竞赛数据集''',就可以选择你的指定数据集。

jupyter文件运行

python 复制代码
#首先 上传 kaggle.json 文件并设置 API 密钥
#再运行此代码

!pip install kaggle

import os
import shutil

if not os.path.exists(os.path.expanduser('~/.kaggle')):
    os.makedirs(os.path.expanduser('~/.kaggle'))

if os.path.exists(os.path.expanduser('kaggle.json')):
    # 将 kaggle.json 文件移到正确的位置
    shutil.move('kaggle.json', os.path.expanduser('~/.kaggle/kaggle.json'))
else:
    print("你没有将kaggle.json文件放置该代码同目录下")

# 确保文件权限正确
os.chmod(os.path.expanduser('~/.kaggle/kaggle.json'), 0o600)

# 下载竞赛数据
!kaggle competitions download -c child-mind-institute-problematic-internet-use -p ./data

# 检查下载的文件
import os
print(os.listdir('./data'))

# 解压下载的 ZIP 文件
import zipfile

with zipfile.ZipFile('./data/child-mind-institute-problematic-internet-use.zip', 'r') as zip_ref:
    zip_ref.extractall('./data')

# 加载数据
import pandas as pd

# 假设下载的是 train.csv 文件
data = pd.read_csv('./data/train.csv')

# 查看数据的前几行
data.head()
相关推荐
流浪猪头拯救地球6 小时前
利用 Python 解密 / 加密 PDF 文件
python·pdf·php
LO嘉嘉VE6 小时前
学习笔记十五:连续与缺失值
机器学习
阿十六6 小时前
OUC AI Lab 第七章:ViT & Swin Transformer
人工智能·深度学习·transformer
Mintopia6 小时前
🌳 Claude `code/worktree` 命令最佳实践指南
人工智能·claude·trae
阿里云大数据AI技术6 小时前
阿里云 Elasticsearch 的 AI 革新:高性能、低成本、智能化的搜索新纪元
人工智能·elasticsearch·阿里云
paperxie_xiexuo6 小时前
如何用自然语言生成科研图表?深度体验PaperXie AI科研绘图模块在流程图、机制图与结构图场景下的实际应用效果
大数据·人工智能·流程图·大学生
Mintopia6 小时前
🌌 AIGC模型的冷启动问题:Web应用的初期技术支撑策略
人工智能·trae
花开花富贵6 小时前
多语言的爱意告白
python
2501_941805316 小时前
边缘计算:引领智能化未来的新技术
人工智能
墨绿色的摆渡人6 小时前
零碎的知识点(二十):3D 高斯为什么是椭球
决策树·机器学习·3d