技术栈
pandas
阿钱真强道
5 小时前
pandas
·
数据清洗
·
数据集成
·
merge
·
数据合并
·
重复数据处理
·
drop_duplicates
11 数据预处理-数据集成与重复数据处理
适合人群:Python 初学者 / 数据分析入门 / 数据预处理学习者 / 教学案例分享在真实的数据分析工作中,我们很少只面对一张“干净完整”的表。 更多时候,数据会来自多个系统、多个部门、多个文件。
阿钱真强道
7 小时前
python
·
机器学习
·
数据分析
·
pandas
·
推荐系统
·
相似度计算
·
文本分析
08 Python 数据分析:学生画像匹配与相似度计算
适合人群:Python 初学者 / 数据分析入门 / 推荐系统基础学习者 / 教学案例分享在数据分析和机器学习中,我们经常会遇到这样的问题:
阿钱真强道
8 小时前
python
·
数据挖掘
·
数据分析
·
pandas
·
可视化
·
python入门
·
统计学
06 Python 数据分析入门:集中趋势与离散程度
适合人群:Python 初学者 / 数据分析入门 / 统计学基础学习者 / 教学案例分享在做数据分析时,我们经常会遇到这样的问题:
XDHCOM
10 小时前
数据库
·
pandas
Pandas怎么连接外部数据库导入数据,步骤和注意点简单讲讲
Pandas连接外部数据库导入数据,是一个很实用的功能,能让你把数据库里的表直接变成DataFrame来分析,下面我直接讲讲步骤和需要注意的地方。
howard2005
11 小时前
excel
·
pandas
Pandas读取包含多个工作表的Excel文件
执行代码结果说明:该代码成功加载本地 Excel 文件,通过 pd.ExcelFile 获取文件信息并打印所有工作表名称。结果显示包含“总表”、“老师需提供资料汇总”等共7个工作表,说明数据结构清晰,适合后续多表读取与分析处理。
郝YH是人间理想
1 天前
数据结构
·
pandas
Pandas库DataFrame数据结构
上文已经简述过Series,本文开始讲述由多个Series复合而成的DataFrame,其实很多内容异曲同工。
郝YH是人间理想
2 天前
数据分析
·
pandas
Pandas库series数据结构
Pandas 是 Python 数据分析的核心库,基于 NumPy 构建,提供了快速、灵活的数据结构,主要用于处理表格型或异质性数据,类似于 Excel 表格或 SQL 数据库。
潘达斯奈基~
2 天前
大数据
·
spark
·
pandas
Spark踩坑:如何优化pandas_udf中的多维数组传输效率
目录一、问题背景二、遇到的问题1. 数据传输效率低下2. Python处理开销大3. 模型加载重复三、问题根因
rgb2gray
2 天前
网络
·
人工智能
·
python
·
pandas
·
交通安全
·
出租车
论文详解 | TWScan:基于收紧窗口的增强扫描统计,实现不规则形状空间热点精准检测
原文参考:Enhanced scan statistic with tightened window for detecting irregularly shaped hotspots
所谓伊人,在水一方333
2 天前
开发语言
·
python
·
信息可视化
·
数据分析
·
系统架构
·
pandas
【Python数据可视化精通】第11讲 | 可视化系统架构与工程实践
环境声明:架构选择对比:混合架构(推荐):核心思想:将大型可视化应用拆分为独立部署、独立运行的微应用。
所谓伊人,在水一方333
6 天前
开发语言
·
python
·
信息可视化
·
数据挖掘
·
数据分析
·
pandas
·
matplotlib
【Python数据科学实战之路】第9章 | 探索性数据分析(EDA):让数据说话的艺术
Python版本:Python 3.12+ 开发工具:PyCharm 或 VS Code 操作系统:Windows / macOS / Linux (通用)
小张贼嚣张
3 天前
python
·
数据分析
·
pandas
数据分析全流程实战:Python(Pandas/Matplotlib/Numpy)+ MySQL(附可下载数据源+多图形绘制)
本文聚焦数据分析领域的核心工具链,结合可公开下载的真实数据源,对比Python生态(Pandas/Matplotlib/Numpy)与MySQL在数据处理、分析、可视化环节的差异,通过完整代码示例实现从数据导入、清洗、分析到可视化的全流程,适配数据分析岗位面试/实战需求。
所谓伊人,在水一方333
3 天前
开发语言
·
python
·
信息可视化
·
数据分析
·
pandas
【Python数据可视化精通】第9讲 | 实时数据流可视化
环境声明:**发布-订阅(Pub/Sub)**是实时数据系统的核心架构模式,解耦了数据生产者与消费者。
shenzhenNBA
5 天前
pandas
·
excel拆分
·
python拆分excel
python实现Excel数据根据规则拆分为多个Excel
有时需要将一个excel文件数据按一定规则拆分为多个excel,比如有一个销售总表,里面含有各个销售员的销售数据,现在有需要把各个销售员的销售数据从总表中分离出来独立建立一个Excel文件,面对这个场景,
王夏奇
5 天前
python
·
excel
·
pandas
Python-对excel文件操作-pandas库
我们能使用pandas库来干什么?我查到的是,pandas库在数据计算和数据清洗上的优势,数据计算大家可能都明白,但是数据清洗又是怎么回事?
wayz11
5 天前
数据挖掘
·
数据分析
·
pandas
Pandas 从入门到精通:完整数据分析指南
Pandas 是 Python 的核心数据分析库,提供快速、灵活、易用的数据结构,特别适合处理表格数据和时间序列数据。
weixin_46863529
20 天前
笔记
·
pandas
Pandas 速查笔记
一、环境约定二、核心数据结构三、IO 一行代码四、快速观察五、列(Series)常用操作六、行/列 选取(核心 8 招)
Dxy1239310216
21 天前
python
·
pandas
·
dataframe
DataFrame缺失值处理:完整指南与实战技巧
在数据分析工作中,缺失值(Missing Values)是不可避免的挑战。无论是数据库导出错误、传感器故障还是用户输入遗漏,缺失值都会影响数据质量和分析结果。Pandas的DataFrame作为最常用的数据处理工具,提供了多种处理缺失值的方法。本文将系统介绍DataFrame缺失值的识别、处理策略和实战技巧。
kong7906928
22 天前
pandas
Python核心语法-Pandas读写csv和tsv文件
python跨平台,Windows,MacOS,Linux都可以运行。功能比Excel,PowerBI tableau等软件强大。Python在非结构化数据(文本,图像)和深度学习领域更有优势。 numpy(Numerical Python)是Python语言的一个扩展程序库。是一个运行速度非常快的数学库,主要用于数组计算。
Dxy1239310216
23 天前
pandas
DataFrame时间序列操作:从基础到高级的时间数据处理指南
时间序列数据是数据分析中最常见的类型之一,从股票价格到传感器读数,从网站流量到销售数据,几乎所有领域都会产生时间序列数据。Pandas的DataFrame提供了强大而灵活的时间序列处理能力,使得清洗、转换和分析时间数据变得高效而直观。本文将系统介绍DataFrame中时间序列操作的核心方法,帮助你掌握时间数据处理的全流程。