pandas

留白_15 小时前
开发语言·python·pandas
pandas文件读取与存储1. 读取csv文件,获取数据2. 把读取到的数据写到文件中3. 特殊的csv文件-->tsv文件区别:csv文件以 ',' 做分隔;tsv文件以 tab键 做分隔
SilentSamsara18 小时前
开发语言·人工智能·python·机器学习·青少年编程·信息可视化·pandas
特征工程系统方法论:编码、分箱、交互特征与特征选择在 Kaggle 的房价预测竞赛中,排名靠前的方案大多使用梯度提升树(XGBoost/LightGBM),算法本身并无显著差异。真正拉开差距的是特征工程——同样的数据,精心构造的特征能让 AUC 从 0.75 提升到 0.85,而换一个更复杂的模型只能从 0.75 提升到 0.76。特征工程的本质,是将原始数据中对预测目标有用的信号提取、放大并规范化,同时抑制噪声。
一晌小贪欢20 小时前
开发语言·python·数据分析·pandas·数据可视化
第22节:相关性分析——协方差、相关系数与热力图解读完成本节学习后,你将能够:在数据分析中,我们常常问这样的问题:这些问题本质上都在问同一个事情:两个变量之间的关系有多强?
糖果店的幽灵3 天前
pandas
Pandas 数据读取与写入(IO 操作)详细总结🎯 目标:掌握从各种数据源读取数据和保存数据的方法,打通数据流通的任督二脉。在现实工作中,数据分散在各个角落:
糖果店的幽灵4 天前
数据结构·pandas
Pandas DataFrame 数据结构详解🎯 本章目标:彻底掌握 Pandas 最核心的二维数据结构 DataFrame,它是数据分析的主战场。
SilentSamsara4 天前
开发语言·python·青少年编程·pandas
Pandas 工程化:多层索引、分组聚合与窗口函数的进阶用法Pandas 的 groupby 是数据分析中使用频率最高的操作之一——但绝大多数使用者只停留在 groupby().mean() 阶段。实际上,agg、transform 和 apply 三种函数面向不同的输出需求,MultiIndex 在处理分层维度时极为高效,窗口函数更是金融数据分析的标配。本文聚焦这三个"高频但易混淆"的进阶特性,结合股票技术指标计算实战,提供可量化的性能对比和选型决策依据。
牵牛花主人4 天前
python·pandas
【无标题】DataFrame 是 Pandas 中的另一个核心数据结构,类似于一个二维的表格或数据库中的数据表。
糖果店的幽灵4 天前
开发语言·python·pandas
时间序列处理🎯 目标:掌握 Pandas 处理时间序列数据的能力,这是金融、销售、IoT 等领域必备技能。时间序列数据
一晌小贪欢5 天前
开发语言·python·数据分析·pandas·数据可视化
第19节:地理空间分析——使用 Geopandas 绘制热力地图完成本节学习后,你将能够:想象你是某连锁零售品牌的数据分析师。老板问了一个问题:“我们的门店在全国的分布合理吗?哪些省份需要新开?哪些省份已经饱和?”
星越华夏5 天前
pandas
pandas字符串运算列在字母前后添加字符print(p_table['公式']) p_table['公式'] = p_table['公式'].str.replace(r"([a-zA-Z]+)", r"p_cell['\1']", regex=True) print(p_table['公式'])
wayz115 天前
pandas·pandas_ta
pandas_ta 库指标分类pandas_ta 库并没有采用传统技术分析教科书中“趋势、震荡、成交量”等基于交易逻辑的分类方式,而是采用了更贴近量化开发实践的功能性分类体系。这种分类直接映射到其 API 调用结构上,主要分为以下三大维度:
ranchor6666 天前
pandas
groupby.filter() 与 df.query()整表行筛选:按单行字段过滤,不分组 逐行判断条件,满足就保留本行,每行独立运算,看不到同组其他数据适用:基于自身行字段筛选数据。
程序大视界7 天前
python·excel·pandas
【Python系列课程】Pandas(六):数据读写——CSV与Excel文件操作📊 阅读时长:16分钟 | 关键词:Pandas、read_csv、to_csv、read_excel、to_excel、文件读写
程序大视界7 天前
开发语言·python·pandas
【Python系列课程】Pandas(四):数据统计与排序——describe、sort_values、sample📊 阅读时长:16分钟 | 关键词:Pandas、describe描述统计、sort_values排序、sample采样、info摘要
知识分享小能手8 天前
python·学习·pandas
数据预处理入门学习教程,从入门到精通,数据获取 — 知识点详解与案例代码(4)CSV(Comma-Separated Values)是一种以逗号分隔字段的纯文本文件格式,每行代表一条记录,每个字段之间用分隔符(通常为逗号)隔开。
乔江seven9 天前
数据分析·numpy·pandas
【python 数据分析】 Numpy、pandas、matplotlibnumpy是Python中科学计算的基础包。 它是一个Python库,提供多维数组对象、各种派生对象(例如掩码数组和矩阵)以及用于对数组进行快速操作的各种方法,包括数学、逻辑、形状操作、排序、选择、1O、离散傅里叶变换、基本线性代数、基本统讠运算、随机模拟等等。
石工记11 天前
人工智能·python·django·flask·numpy·pandas·pyqt
CTO如何落地AI?从0到1的实战路径20年数字化老兵,前CTO/技术总监,落地过RAG、AI Agent、多模态大模型企业级应用这两年AI很热,但作为技术管理者,你会发现一个尴尬的现实:
weixin_4684668511 天前
python·自动化·pandas·编程·数据处理
Data-Engineering-Zoomcamp 新手实战指南很多数据工程师在入门阶段最容易卡住的地方,往往不是复杂的算法或高深的架构理论,而是被繁琐的环境配置劝退。想象一下,你兴致勃勃地想要跑通一个完整的数据流水线,结果花了两三天时间还在解决 Python 版本冲突、数据库连接超时或者本地依赖包缺失的问题。这种“还没开始写业务代码,精力就耗尽一半”的困境,是许多初学者共同的痛点。实际上,现代数据工程的核心竞争力之一,就是能够快速构建一套可复现、可移植且自动化的开发环境。
威尔逊·柏斯科·希伯理14 天前
人工智能·python·机器学习·conda·numpy·pandas·matplotlib
机器学习第一天(共12天)AI:用计算机模拟人脑,让计算机能够像人类一样理性的思考和行动ML:基于经验找规律;先训练(根据训练集找规律,找公式),再预测,最后评估
星越华夏14 天前
python·pandas
Polars中导入excel文件Polars中导入excel文件1、直接导入def pddaoru_sheetname(filedir): #df1 = pd.read_excel(filedir,sheet_name=name) # polars导入excel文件命令 df = pl.read_excel(filedir) # polars导入excel文件命令 pf = df.to_pandas() # polars导入excel文件命令 #pf = df1.iloc[4:] # polars导入excel文件命令 kkk=pf.c