【project】--数据挖掘

挑选数据集

使用python模块导入数据集

导入数据集

python 复制代码
from ucimlrepo import fetch_ucirepo 
  
# fetch dataset 
# 数据集--NATICUSdroid(Android 权限)
naticusdroid_android_permissions = fetch_ucirepo(id=722) 
  
# data (as pandas dataframes)

# 数据特征
X = naticusdroid_android_permissions.data.features 
# 目标数据
y = naticusdroid_android_permissions.data.targets 
  
# metadata
# 打印数据集的元数据信息
# 元数据包含了关于数据集的一些基本描述,例如数据集的名称、来源、创建时间、数据类型等
# 这些信息有助于我们更好地理解数据集的背景和特点
print(naticusdroid_android_permissions.metadata) 
  
# variable information
# 打印数据集中变量的信息
# 变量信息会详细描述数据集中每个特征和目标变量的含义、数据类型、取值范围等
# 这对于我们了解数据集的结构和特征非常有帮助
print(naticusdroid_android_permissions.variables) 

查看数据集

python 复制代码
#查看数据规模
print(f"样本数量:{X.shape[0]},特征数量:{X.shape[1]}")
#查看目标变量分布
print("\n目标变量分布:")
#检查y的列名
#y.columns
print (y['Result']. value_counts(normalize=True))
bash 复制代码
# 查看变量信息表的列名
print(naticusdroid_android_permissions.variables.columns.tolist())
相关推荐
Poseidon、4 分钟前
2025年5月AI科技领域周报(5.5-5.11):AGI研究进入关键验证期 具身智能开启物理世界交互新范式
人工智能·agi
lilye666 分钟前
精益数据分析(56/126):创业阶段的划分与精益数据分析实践
数据挖掘·数据分析
天机️灵韵34 分钟前
字节开源FlowGram与n8n 技术选型
人工智能·python·开源项目
jixunwulian40 分钟前
AI边缘网关_5G/4G边缘计算网关厂家_计讯物联
人工智能·5g·边缘计算
腾讯云音视频1 小时前
AI实时对话的通信基础,WebRTC技术综合指南
人工智能·webrtc
暴龙胡乱写博客1 小时前
机器学习 --- 模型选择与调优
人工智能·机器学习
白熊1881 小时前
【计算机视觉】OpenCV实战项目:基于OpenCV与face_recognition的实时人脸识别系统深度解析
人工智能·opencv·计算机视觉
闭月之泪舞1 小时前
OpenCv高阶(4.0)——案例:海报的透视变换
人工智能·opencv·计算机视觉
九亿AI算法优化工作室&2 小时前
乡村地区无人机医药配送路径规划与优化仿真
人工智能·算法·matlab·回归
jndingxin2 小时前
OpenCV CUDA模块中矩阵操作-----矩阵最大最小值查找函数
人工智能·opencv