kaggle 如何利用API下载数据集

首先 上传kaggle官网生成得 API 密钥: kaggle.json 文件。放到该代码同目录下,再运行一下代码。

注:

只需要修改'''下载竞赛数据集''',就可以选择你的指定数据集。

jupyter文件运行

python 复制代码
#首先 上传 kaggle.json 文件并设置 API 密钥
#再运行此代码

!pip install kaggle

import os
import shutil

if not os.path.exists(os.path.expanduser('~/.kaggle')):
    os.makedirs(os.path.expanduser('~/.kaggle'))

if os.path.exists(os.path.expanduser('kaggle.json')):
    # 将 kaggle.json 文件移到正确的位置
    shutil.move('kaggle.json', os.path.expanduser('~/.kaggle/kaggle.json'))
else:
    print("你没有将kaggle.json文件放置该代码同目录下")

# 确保文件权限正确
os.chmod(os.path.expanduser('~/.kaggle/kaggle.json'), 0o600)

# 下载竞赛数据
!kaggle competitions download -c child-mind-institute-problematic-internet-use -p ./data

# 检查下载的文件
import os
print(os.listdir('./data'))

# 解压下载的 ZIP 文件
import zipfile

with zipfile.ZipFile('./data/child-mind-institute-problematic-internet-use.zip', 'r') as zip_ref:
    zip_ref.extractall('./data')

# 加载数据
import pandas as pd

# 假设下载的是 train.csv 文件
data = pd.read_csv('./data/train.csv')

# 查看数据的前几行
data.head()
相关推荐
金銀銅鐵25 分钟前
[Python] 扩展欧几里得算法
python·数学·算法
Duckdblab40 分钟前
DuckDB 性能调优终极指南:打造闪电般的分析体验
python
不加辣椒1 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户1693176172661 小时前
前端给AI消息做日期分组与时间线
人工智能
带派擂总1 小时前
Python全栈开发精华版最全合集(包含各种面试题) Day24_异常和错误
python
i晟1 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户252736278142 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩2 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent
金銀銅鐵4 小时前
n^5 和 n 的个位数是否总相等?
python·数学
用户018349301695 小时前
用Zustand管理AI多会话状态
人工智能