数据分析中的统计学基础及Python具体实现【数据分析】

各位大佬好 ,这里是阿川的博客,祝您变得更强

个人主页在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力

阿川水平有限,如有错误,欢迎大佬指正

Python 初阶
Python--语言基础与由来介绍
Python--注意事项
Python--语句与众所周知
数据清洗前 基本技能
数据分析---技术栈和开发环境搭建
数据分析---Numpy和Pandas库基本用法及实例
统计学基础前 必看
数据分析---三前奏:获取/ 读取/ 评估数据
数据分析---数据清洗操作及众所周知
数据分析---数据整理操作及众所周知

目录

  • 统计学概述
  • 数值数据分析维度
    • 偏态解释

数据分析与统计学不可分割

统计学概述

统计学主要是 描述和推断

  • 描述

    • 分类数据
      • 有限数量的类别 的数据
        • 定序
          • 顺序
            • 例如金银铜三枚奖牌,金大于大于
        • 定类
          • 例如猫的种类,不能说有顺序
    • 数值数据
      • 可进行数学运算和统计分析计算有意义 的数据
        • 连续
          • 例如1~2之间区间有很多连续的数字
        • 离散
          • 只能以整数或自然数为单位的数据

数值数据分析维度

数值数据是数据分析的重点,分析维度主要从三个方面来分析

  • 集中趋势
    • 数据集中分布在哪里
  • mean平均数
  • median中位数
  • mode众数
  • 离散趋势
    • 数据偏离中心分布在哪里
  • max-min极差
  • var/std 方差/标准差
  • quantile(0.75)- quantile(0.25)四分位距

    • 四分位距是将 数据按顺序,按四等分分好并排序 ,处于三个分割点位置的数值 就是四分位数-
    • 表示中间一半数值的离散程度
      • 越大 说明数据越分散
      • 越小 说明数据越集中
  • 分布形状
  • 可以看出数据的偏态、峰度、异常值
  • 分布形状主要是指直方图
    plot 表示画图
    • kind参数 具体什么形状
      • hist表示直方图

偏态解释

直方图 一般为正态分布 (平均值、中位数、众数差不多都位于中央

偏态 (平均数、中位数、众数偏离中央

  • 正偏态即右偏态

  • 负偏态及左偏态

注意一下直方图

  • 数据量小 ,分布形状较不明显
  • 数据量大 ,分布形状较明显

好的,到此为止啦,祝您变得更强


想说的话

实不相瞒,写的每篇博客都要写三四个小时(加上自己学习和纸质笔记,共五六小时 吧),很累希望大佬支持

道阻且长 行则将至

个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力

相关推荐
兵慌码乱17 小时前
面向桌面端的资产管理系统分层架构设计与核心模块实现
python·系统架构·sqlite·pyqt5·数据库设计·桌面应用开发·mvc架构
hboot19 小时前
AI工程师第三课 - 机器学习基础
python·scikit-learn·kaggle
顾林海1 天前
Agent入门阶段-编程基础-Python:流程控制
python·agent·ai编程
呱呱复呱呱1 天前
Django CBV 源码解读:一个请求是怎么找到你的 get() 方法的
python·django
曲幽1 天前
刚部署的 LibreTranslate 频频翻车?我掏出了 20 年前的 StarDict 词典,用 FastAPI 搭了个本地词典翻译 API
python·fastapi·web·translate·goldendict·libretranslate·stardict·pystardict
荣码1 天前
用Streamlit给AI应用套个界面,10行代码出Web页面
java·python
兵慌码乱2 天前
基于Python+PyQt5+SQLite的药房管理系统实现:事务一致性与界面解耦全流程解析
python·sqlite·信号与槽·pyqt5·数据库设计·桌面应用开发·事务处理
金銀銅鐵2 天前
[Python] 体验用欧几里得算法计算最大公约数的过程
python·数学
FreakStudio2 天前
W55MH32L-EVB 上手测评:硬件 TCP/IP 加持的以太网单片机,MicroPython 零门槛开发
python·单片机·嵌入式·大学生·面向对象·并行计算·电子diy·电子计算机
用户0332126663672 天前
使用 Python 从零创建 Word 文档
python