机器学习-Pandas学习笔记

  1. Pandas Python的数据分析库,与Numpy配合使用,可以从常见的格式如CSV、JSON等中读取数据。可以进行数据清洗、数据加工工作。
  2. 数据结构Series,Pandas.Series(data,index,dtype,name,copy)
    data类型是Numpy的ndarray类型,index指定下标,如果不给默认从0开始,name给series名字
  3. 数据类型DataFrame,Pandas.DataFrame(data,index,columns,dtype,copy)
  4. 利用Pandas读取CSV,以逗号或其他字符分隔,可以用Excel打开
  • Pandas.read_csv("路径"),可以指定显示的行
  • Pandas.info获取读取文件的信息
  1. 利用Pandas读取JSON,\转义,,分隔,{}保存对象,[]保存数组
  • Pandas.read_json("路径")
  • 可以直接将Python的字典以Json格式读入,字典里放字典
  • 如果Json套Json,需要用Pandas.json_normalize(哪个Json,Json里的哪一类需要展平,需要将没展平的哪些列加以展示)进行展平
  1. 数据清洗,是数据预处理的一步
    Pandas文档
  • 不用背API,用到了去查文档
  • DataFrame.duplicated()查看数据是否重复
  1. 打一下老师博文里的内容
    Pandas博客资料

补充一点Pytorch基础

  1. cafe,keras(合并到tensorflow)古老,没人用。tensorflow(Google 工业),pytorch(facebook 学业)

  2. Pytorch的基本数据类型:张量,标量,向量,矩阵是特殊的张量。Pytorch可以在GPU上运行,Numpy不行。
    Pytorch官方文档

  3. Numpy和Pytorch。一个在CPU上运行,一个在GPU上运行,所以要互相转化。
    PyTorch博客资料

  4. 要在Jupyter中使用Pytorch,需要创建带有Pytorch的Conda环境,然后在该core下打开Jupyter创建文件

相关推荐
真的想上岸啊21 分钟前
学习C++、QT---18(C++ 记事本项目的stylesheet)
开发语言·c++·学习
摸爬滚打李上进31 分钟前
重生学AI第十六集:线性层nn.Linear
人工智能·pytorch·python·神经网络·机器学习
asyxchenchong8881 小时前
ChatGPT、DeepSeek等大语言模型助力高效办公、论文与项目撰写、数据分析、机器学习与深度学习建模
机器学习·语言模型·chatgpt
rui锐rui1 小时前
大数据学习2:HIve
大数据·hive·学习
凛铄linshuo2 小时前
爬虫简单实操2——以贴吧为例爬取“某吧”前10页的网页代码
爬虫·python·学习
大春儿的试验田3 小时前
高并发收藏功能设计:Redis异步同步与定时补偿机制详解
java·数据库·redis·学习·缓存
BFT白芙堂3 小时前
睿尔曼系列机器人——以创新驱动未来,重塑智能协作新生态(上)
人工智能·机器学习·机器人·协作机器人·复合机器人·睿尔曼机器人
金色光环4 小时前
【Modbus学习笔记】stm32实现Modbus
笔记·stm32·学习
羊小猪~~4 小时前
【NLP入门系列五】中文文本分类案例
人工智能·深度学习·考研·机器学习·自然语言处理·分类·数据挖掘
李师兄说大模型4 小时前
KDD 2025 | 地理定位中的群体智能:一个多智能体大型视觉语言模型协同框架
人工智能·深度学习·机器学习·语言模型·自然语言处理·大模型·deepseek