首先 上传kaggle官网生成得 API 密钥: kaggle.json 文件。放到该代码同目录下,再运行一下代码。
注:
只需要修改'''下载竞赛数据集''',就可以选择你的指定数据集。
jupyter文件运行
python
#首先 上传 kaggle.json 文件并设置 API 密钥
#再运行此代码
!pip install kaggle
import os
import shutil
if not os.path.exists(os.path.expanduser('~/.kaggle')):
os.makedirs(os.path.expanduser('~/.kaggle'))
if os.path.exists(os.path.expanduser('kaggle.json')):
# 将 kaggle.json 文件移到正确的位置
shutil.move('kaggle.json', os.path.expanduser('~/.kaggle/kaggle.json'))
else:
print("你没有将kaggle.json文件放置该代码同目录下")
# 确保文件权限正确
os.chmod(os.path.expanduser('~/.kaggle/kaggle.json'), 0o600)
# 下载竞赛数据
!kaggle competitions download -c child-mind-institute-problematic-internet-use -p ./data
# 检查下载的文件
import os
print(os.listdir('./data'))
# 解压下载的 ZIP 文件
import zipfile
with zipfile.ZipFile('./data/child-mind-institute-problematic-internet-use.zip', 'r') as zip_ref:
zip_ref.extractall('./data')
# 加载数据
import pandas as pd
# 假设下载的是 train.csv 文件
data = pd.read_csv('./data/train.csv')
# 查看数据的前几行
data.head()