机器学习-Pandas学习笔记

  1. Pandas Python的数据分析库,与Numpy配合使用,可以从常见的格式如CSV、JSON等中读取数据。可以进行数据清洗、数据加工工作。
  2. 数据结构Series,Pandas.Series(data,index,dtype,name,copy)
    data类型是Numpy的ndarray类型,index指定下标,如果不给默认从0开始,name给series名字
  3. 数据类型DataFrame,Pandas.DataFrame(data,index,columns,dtype,copy)
  4. 利用Pandas读取CSV,以逗号或其他字符分隔,可以用Excel打开
  • Pandas.read_csv("路径"),可以指定显示的行
  • Pandas.info获取读取文件的信息
  1. 利用Pandas读取JSON,\转义,,分隔,{}保存对象,[]保存数组
  • Pandas.read_json("路径")
  • 可以直接将Python的字典以Json格式读入,字典里放字典
  • 如果Json套Json,需要用Pandas.json_normalize(哪个Json,Json里的哪一类需要展平,需要将没展平的哪些列加以展示)进行展平
  1. 数据清洗,是数据预处理的一步
    Pandas文档
  • 不用背API,用到了去查文档
  • DataFrame.duplicated()查看数据是否重复
  1. 打一下老师博文里的内容
    Pandas博客资料

补充一点Pytorch基础

  1. cafe,keras(合并到tensorflow)古老,没人用。tensorflow(Google 工业),pytorch(facebook 学业)

  2. Pytorch的基本数据类型:张量,标量,向量,矩阵是特殊的张量。Pytorch可以在GPU上运行,Numpy不行。
    Pytorch官方文档

  3. Numpy和Pytorch。一个在CPU上运行,一个在GPU上运行,所以要互相转化。
    PyTorch博客资料

  4. 要在Jupyter中使用Pytorch,需要创建带有Pytorch的Conda环境,然后在该core下打开Jupyter创建文件

相关推荐
大龄程序员狗哥3 小时前
第25篇:Q-Learning算法解析——强化学习中的经典“价值”学习(原理解析)
人工智能·学习·算法
南境十里·墨染春水3 小时前
linux学习进展 线程同步——互斥锁
java·linux·学习
nashane4 小时前
HarmonyOS 6学习:旋转动画优化与长截图性能调优——打造丝滑交互体验的深度实践
学习·交互·harmonyos·harmonyos 5
华清远见IT开放实验室4 小时前
智能手表完整项目实现,比赛求职双向加分,基于嵌入式大赛推荐开发板(STM32U5)
stm32·单片机·嵌入式硬件·学习·智能手表·嵌入式大赛
炽烈小老头5 小时前
【 每天学习一点算法 2026/04/22】四数相加 II
学习·算法
uncle_ll5 小时前
LangChain基础学习笔记
笔记·学习·langchain·llm·rag
三品吉他手会点灯5 小时前
C语言学习笔记 - 14.C编程预备计算机专业知识 - 本讲内容概述
c语言·笔记·学习
Thanwind5 小时前
从0开始的机器学习之旅(二):监督学习,从线性回归说起
学习·机器学习·线性回归
2501_942326445 小时前
易速乐考,轻松备考
学习·教育电商
菜鸟‍5 小时前
【CVPR 2026】LitePT:更轻、更强的点云 Transformer【论文学习】
深度学习·学习·transformer