pandas

程序大视界9 小时前
开发语言·python·pandas
【Python系列课程】Pandas(四):数据统计与排序——describe、sort_values、sample📊 阅读时长:16分钟 | 关键词:Pandas、describe描述统计、sort_values排序、sample采样、info摘要
知识分享小能手18 小时前
python·学习·pandas
数据预处理入门学习教程,从入门到精通,数据获取 — 知识点详解与案例代码(4)CSV(Comma-Separated Values)是一种以逗号分隔字段的纯文本文件格式,每行代表一条记录,每个字段之间用分隔符(通常为逗号)隔开。
乔江seven2 天前
数据分析·numpy·pandas
【python 数据分析】 Numpy、pandas、matplotlibnumpy是Python中科学计算的基础包。 它是一个Python库,提供多维数组对象、各种派生对象(例如掩码数组和矩阵)以及用于对数组进行快速操作的各种方法,包括数学、逻辑、形状操作、排序、选择、1O、离散傅里叶变换、基本线性代数、基本统讠运算、随机模拟等等。
石工记4 天前
人工智能·python·django·flask·numpy·pandas·pyqt
CTO如何落地AI?从0到1的实战路径20年数字化老兵,前CTO/技术总监,落地过RAG、AI Agent、多模态大模型企业级应用这两年AI很热,但作为技术管理者,你会发现一个尴尬的现实:
weixin_468466854 天前
python·自动化·pandas·编程·数据处理
Data-Engineering-Zoomcamp 新手实战指南很多数据工程师在入门阶段最容易卡住的地方,往往不是复杂的算法或高深的架构理论,而是被繁琐的环境配置劝退。想象一下,你兴致勃勃地想要跑通一个完整的数据流水线,结果花了两三天时间还在解决 Python 版本冲突、数据库连接超时或者本地依赖包缺失的问题。这种“还没开始写业务代码,精力就耗尽一半”的困境,是许多初学者共同的痛点。实际上,现代数据工程的核心竞争力之一,就是能够快速构建一套可复现、可移植且自动化的开发环境。
威尔逊·柏斯科·希伯理7 天前
人工智能·python·机器学习·conda·numpy·pandas·matplotlib
机器学习第一天(共12天)AI:用计算机模拟人脑,让计算机能够像人类一样理性的思考和行动ML:基于经验找规律;先训练(根据训练集找规律,找公式),再预测,最后评估
星越华夏7 天前
python·pandas
Polars中导入excel文件Polars中导入excel文件1、直接导入def pddaoru_sheetname(filedir): #df1 = pd.read_excel(filedir,sheet_name=name) # polars导入excel文件命令 df = pl.read_excel(filedir) # polars导入excel文件命令 pf = df.to_pandas() # polars导入excel文件命令 #pf = df1.iloc[4:] # polars导入excel文件命令 kkk=pf.c
我材不敲代码9 天前
pandas
零基础快速上手 Pandas 数据处理Pandas 是 Python 里处理表格数据最强的库,不管是做数据分析、机器学习、毕设、竞赛、报表,都离不开它。
星越华夏9 天前
pandas
pandas中时间处理def titoday_1(): titoday = datetime.datetime.today() titoday = titoday.strftime('%Y-%m-%d %H:%M:%S') print(titoday) titoday1 = time.strptime(str(titoday), '%Y-%m-%d %H:%M:%S') titoday1= time.mktime(titoday1) print(titoday1) #print('c2,c2_time',c2,c2_time)
Cloud_Shy61810 天前
python·plotly·数据分析·excel·numpy·pandas
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十二章 用户定义函数 下篇)前面 3 章展示了如何使用 Python 脚本自动化 Excel,以及如何在 Excel 中一键执行这样的脚本。本章会介绍另一种利用 xlwings 在 Excel 中调用 Python 代码的方法,即用户定义函数(user-defined function,UDF)。 UDF 是可以用在 Excel 单元格中的 Python 函数,就像使用内置的 SUM 函数和 AVERAGE函数一样。和第 11 章一样,我们首先从 quickstart 命令开始,尝试创建第一个 UDF。然后进入案例研究,学习如何从
云和数据.ChenGuang10 天前
人工智能·数据分析·机器人·pandas·数据预处理·数据训练
基于鲲鹏 HPC 的 AI 对话机器人架构设计与技术实现随着大语言模型、多模态交互技术快速迭代,AI对话机器人对算力密度、并发处理能力、低时延推理的要求持续提升。传统通用服务器在大规模对话并发、大模型微调、长文本推理场景下存在算力瓶颈与功耗偏高问题。本文基于鲲鹏HPC高性能计算平台,结合昇腾AI加速算力、分布式并行框架、大模型轻量化适配技术,设计一套高可用、高性能、国产化自主可控的AI对话机器人系统。重点阐述鲲鹏HPC算力底座选型、分布式推理架构、对话服务优化、国产化适配落地实践,为行业级AI对话应用提供国产化算力解决方案参考。 关键词:鲲鹏HPC;昇腾AI;
Cloud_Shy61811 天前
python·数据分析·excel·pandas
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十二章 用户定义函数 中篇)前面 3 章展示了如何使用 Python 脚本自动化 Excel,以及如何在 Excel 中一键执行这样的脚本。本章会介绍另一种利用 xlwings 在 Excel 中调用 Python 代码的方法,即用户定义函数(user-defined function,UDF)。 UDF 是可以用在 Excel 单元格中的 Python 函数,就像使用内置的 SUM 函数和 AVERAGE函数一样。和第 11 章一样,我们首先从 quickstart 命令开始,尝试创建第一个 UDF。然后进入案例研究,学习如何从
沉下去,苦磨练!11 天前
python·数据分析·pandas
python的数据分析PandasPandas是没有行的概念Pandas的两个核心概念Series和DataFrameSeries一列数据,DataFrame多列数据
毋语天12 天前
python·数据分析·pandas·数据清洗·透视表
Pandas 数据处理进阶:缺失值、合并、分组聚合与透视表在完成 pandas 的基础操作(索引、筛选、赋值、函数应用)之后,下一步便是处理真实数据中常见的问题:缺失值、多表合并、分组统计以及数据透视。本文带你系统掌握这些核心技能,并提供可直接运行的代码示例。
hef28812 天前
pandas
探索Pandas groupby的各种技巧和应用实例groupby是Pandas中用于数据分析的重要工具,它允许我们根据特定列的不同值,对数据行进行灵活分组。分组后的数据可用于生成各类聚合值,从而帮助我们深入了解数据。在Pandas中,如果你想要分析数据的潜在模式或趋势,groupby是一个不可或缺的工具。
Cloud_Shy61813 天前
python·数据分析·excel·pandas
Python 数据分析基础入门:《Excel Python:飞速搞定数据分析与处理》学习笔记系列(第十二章 用户定义函数 上篇)前 3 章内容展示了如何使用 Python 脚本自动化 Excel,以及如何在 Excel 中一键执行这样的脚本。本章会介绍另一种利用 xlwings 在 Excel 中调用 Python 代码的方法,即用户定义函数(user-defined function,UDF)。 UDF 是可以用在 Excel 单元格中的 Python 函数,就像使用内置的 SUM 函数和 AVERAGE函数一样。和第 11 章一样,我们首先从 quickstart 命令开始,尝试创建第一个 UDF。然后进入案例研究,学习如何从
星越华夏13 天前
pandas
pandas日期类型差值timedelta大于等于7天pandas日期类型差值timedelta大于等于7天p_eci_cross['create_date']=pd.to_datetime(p_eci_cross['create_date']) p_eci_cross_viot=p_eci_cross.groupby(['cell_identification']).agg(日期最大值=('create_date','max'),日期最小值=('create_date','min')) p_eci_cross_viot=p_eci_cross_viot.r
Omics Pro14 天前
人工智能·python·深度学习·plotly·numpy·pandas·scikit-learn
填补蛋白质组深度学习预处理教学空白质谱蛋白质组学可生成表征生物样品中肽段/蛋白质组分的复杂数据,各类机器学习是串联质谱肽段鉴定及数据分析全流程的核心计算方法。随着深度学习成为数据建模与解析的强力机器学习手段,蛋白质组学计算研究者利用海量公开数据集训练机器学习模型,用于预测肽段碎裂谱与液相色谱保留时间。ProteomicsML等资源为这类学习任务提供了详尽的演示教程,缩小了蛋白质组学与机器学习领域的隔阂。但现有深度学习教学材料普遍缺失数据预处理嵌入这一关键步骤:肽段文本序列必须转换为数值格式(即嵌入)才能用于模型训练。肽段嵌入方法种类繁多,
星越华夏15 天前
excel·pandas
Pandas获取excel表sheet名称Pandas获取excel表sheet名称def printexcelsheets(filename): workbook = pd.ExcelFile(filename) # 获取所有工作表的名称 sheet_names = workbook.sheet_names # 打印工作表名称 #for name in sheet_names: # print(name) # if 'NRCellRelation' in name: # print(f'{name}包含 NRCellRelation') ret
星越华夏16 天前
python·pandas
PPTX判断包含图表id############################20250915判断是否包含图表################################################## i=0 for shape in prs.slides[1].shapes: if shape.HasChart: print(f'i:{i}包含图表') i=i+1 ############################20250915判断是否包含图表################################