python Pandas 开发

1,Pandas

基于Numpy,用c写,还是用了MapplotLib便于处理数据的可视化。

numpy对数据非常的严格

强大的结构化的分析,处理工具

数据分析三剑客

pandas 数据结构,主要做数据分析,非常重要

numpoy 一种数据结构,机械学习中常用,做数据计算的基础库

matplotlib 图像化展示

numpy 主要处理数组型的数据

pandas主要处理除了数值型数据以外的数据,比如字符串,时间序列

2, 两种基本的数据结构

Series 一维数据 ,一个列

有二部分组成

index 不指定,自动创建

values 数据

DataFrame 二维数据

3,numpy

3.1 numpy的创建

3.1.1 np.array()

数组和列表的区别

a, 数组中数据类型必须相同

b.如果数组中有不同的数据类型,则根据优先级来转换为相同的数据类型的数据

字符串 > 浮点型 > 整形

c. numpy的数组可以存储图片,三维的数组,

列表中可以存不同类型的数据

2 plt

3 routines函数

zero ones linespace arange random系列

3.2 reshape 变形前后的数组的容量不可以发生变化

3.3 级联 一个或多个数组进项横行或纵向的拼接

axis 是纵向还是横向拼接 0 纵裂 1 横列

3.4 图片再数组中就是一个三维的数组

行,列,颜色\] 可以进行图片的切割,翻转,颜色的变换 3.5 常用的聚合操作 arr.sum() 全部元素的和 arr.sum(axis = 0) 每一列的数组的和 arr.sum(axis = 1) 每一行的数组的和 ·np。around(arr,decimails) 对数组每一个元素四舍五入 > 4,pandas 4.1 常用的2个类 series 简单的类型 类似于一维的数组 values 一组数据 ndarrya类型 index 数据的索引标签 隐式索引 默认的索引 显示索引 自己定义的索引 创建 列表或者numpy 数据创建 字典 常用属性 shape size index values 常用方法 head()默认显示前5个数据 tail()默认显示最后5个数据 unique 返回不重复的值,是一个数组 nuique 返回曲重复后的值的个数 value_counts 统计每个元素出现的个数 isnull 判断serice是否有空值 > 5, dataframe 基于series而来,实际就是多个series组成一个dataframe,简单来说就是一个表格型的数据结构 5.1 创建 dataframe =DataFrame()      字典创建 dic = {   'name' :\['zhangjian ','lisi','wangwu'\], 'salary' :\['1000,'2000,3000

df = DataFrame(data = dict)

df

5.2 DataFrame 属性

index 行索引

columes 列索引

data是数据的值

相关推荐
zzb158021 分钟前
RAG from Scratch-优化-query
java·数据库·人工智能·后端·spring·mybatis
一只鹿鹿鹿32 分钟前
信息安全等级保护安全建设防护解决方案(总体资料)
运维·开发语言·数据库·面试·职场和发展
堕27434 分钟前
MySQL数据库《基础篇--数据库索引(2)》
数据库·mysql
wei_shuo35 分钟前
数据库优化器进化论:金仓如何用智能下推把查询时间从秒级打到毫秒级
数据库·kingbase·金仓
雷工笔记1 小时前
Navicat Premium 17 软件安装记录
数据库
wenlonglanying1 小时前
Ubuntu 系统下安装 Nginx
数据库·nginx·ubuntu
数据库小组2 小时前
10 分钟搞定!Docker 一键部署 NineData 社区版
数据库·docker·容器·database·数据库管理工具·ninedata·迁移工具
爬山算法2 小时前
MongoDB(38)如何使用聚合进行投影?
数据库·mongodb
l1t2 小时前
Deep Seek总结的APSW 和 SQLite 的关系
数据库·sqlite
Pocker_Spades_A3 小时前
基于代价模型的连接条件下推:复杂SQL查询的性能优化实践
数据库·sql·性能优化