【project】--数据挖掘

挑选数据集

使用python模块导入数据集

导入数据集

python 复制代码
from ucimlrepo import fetch_ucirepo 
  
# fetch dataset 
# 数据集--NATICUSdroid(Android 权限)
naticusdroid_android_permissions = fetch_ucirepo(id=722) 
  
# data (as pandas dataframes)

# 数据特征
X = naticusdroid_android_permissions.data.features 
# 目标数据
y = naticusdroid_android_permissions.data.targets 
  
# metadata
# 打印数据集的元数据信息
# 元数据包含了关于数据集的一些基本描述,例如数据集的名称、来源、创建时间、数据类型等
# 这些信息有助于我们更好地理解数据集的背景和特点
print(naticusdroid_android_permissions.metadata) 
  
# variable information
# 打印数据集中变量的信息
# 变量信息会详细描述数据集中每个特征和目标变量的含义、数据类型、取值范围等
# 这对于我们了解数据集的结构和特征非常有帮助
print(naticusdroid_android_permissions.variables) 

查看数据集

python 复制代码
#查看数据规模
print(f"样本数量:{X.shape[0]},特征数量:{X.shape[1]}")
#查看目标变量分布
print("\n目标变量分布:")
#检查y的列名
#y.columns
print (y['Result']. value_counts(normalize=True))
bash 复制代码
# 查看变量信息表的列名
print(naticusdroid_android_permissions.variables.columns.tolist())
相关推荐
2501_94531849几秒前
2025年数字化转型:AI技能+CAIE认证夯实进阶根基
人工智能
今夕资源网2 分钟前
[AI工具]Infinite Talk数字人对口型图像转视频AI工具 支持无限时长视频生成
人工智能·数字人·视频生成·ai工具·infinite talk·对口型图像转视频·无限时长
咚咚王者9 分钟前
人工智能之数学基础 概率论与统计:第二章 核心定理
人工智能·概率论
小徐Chao努力11 分钟前
Spring AI Alibaba A2A 使用指南
java·人工智能·spring boot·spring·spring cloud·agent·a2a
啊阿狸不会拉杆11 分钟前
《数字图像处理》第7章:小波变换和其他图像变换
图像处理·人工智能·python·算法·机器学习·计算机视觉·数字图像处理
yiersansiwu123d11 分钟前
生成式AI重构内容生态,人机协同定义创作新范式
大数据·人工智能·重构
老蒋新思维13 分钟前
创客匠人:从个人IP到知识变现,如何构建可持续的内容生态?
大数据·网络·人工智能·网络协议·tcp/ip·创客匠人·知识变现
HyperAI超神经19 分钟前
GPT-5全面领先,OpenAI发布FrontierScience,「推理+科研」双轨检验大模型能力
人工智能·gpt·ai·openai·benchmark·基准测试·gpt5.2
老蒋新思维24 分钟前
创客匠人洞察:从“个人品牌”到“系统物种”——知识IP的终极进化之路
网络·人工智能·网络协议·tcp/ip·重构·创客匠人·知识变现
阿杰学AI26 分钟前
AI核心知识57——大语言模型之MoE(简洁且通俗易懂版)
人工智能·ai·语言模型·aigc·ai-native·moe·混合专家模型