机器学习-Pandas学习笔记

小蒋的技术栈记录2023-10-06 8:51

Pandas Python的数据分析库，与Numpy配合使用，可以从常见的格式如CSV、JSON等中读取数据。可以进行数据清洗、数据加工工作。
数据结构Series，Pandas.Series(data,index,dtype,name,copy)
data类型是Numpy的ndarray类型，index指定下标，如果不给默认从0开始，name给series名字
数据类型DataFrame，Pandas.DataFrame(data,index,columns,dtype,copy)
利用Pandas读取CSV，以逗号或其他字符分隔，可以用Excel打开

Pandas.read_csv("路径")，可以指定显示的行
Pandas.info获取读取文件的信息

利用Pandas读取JSON，\转义，,分隔，{}保存对象，\[\]保存数组

Pandas.read_json("路径")
可以直接将Python的字典以Json格式读入，字典里放字典
如果Json套Json，需要用Pandas.json_normalize(哪个Json，Json里的哪一类需要展平，需要将没展平的哪些列加以展示)进行展平

数据清洗，是数据预处理的一步
Pandas文档

不用背API，用到了去查文档
DataFrame.duplicated()查看数据是否重复

打一下老师博文里的内容
Pandas博客资料

补充一点Pytorch基础

cafe,keras(合并到tensorflow)古老，没人用。tensorflow(Google 工业),pytorch(facebook 学业)
Pytorch的基本数据类型：张量，标量，向量，矩阵是特殊的张量。Pytorch可以在GPU上运行，Numpy不行。
Pytorch官方文档
Numpy和Pytorch。一个在CPU上运行，一个在GPU上运行，所以要互相转化。
PyTorch博客资料
要在Jupyter中使用Pytorch，需要创建带有Pytorch的Conda环境，然后在该core下打开Jupyter创建文件

上一篇：mysql 逻辑备份恢复数据

下一篇：sqlite 操作记录。

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 03国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）042026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 05微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 092026 年 AI 大模型 & AI 编程工具实战全总结 102026开年大模型最新对比解析及场景落地指南