Pandas 学习笔记(四)--CSV文件

CSV文件

CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。

读取与写入

读取csv文件

python 复制代码
import pandas as pd
​
df = pd.read_csv('nba.csv')
# 输出结果为数据的前面 5 行和末尾 5 行,中间部分以 ... 代替
print(df)
# to_string() 用于返回 DataFrame 类型的数据,展示全部信息
print(df.to_string())

保存到csv文件

python 复制代码
# 三个字段 name, site, age
name = ["Google", "Runoob", "Taobao", "Wiki"]
site = ["www.google.com", "www.runoob.com", "www.taobao.com", "www.wikipedia.org"]
age = [90, 40, 80, 98]
# 字典
dict = {'name': name, 'site': site, 'age': age}
df = pd.DataFrame(dict)
# 保存 dataframe
df.to_csv('site.csv')
数据处理

head( n ) 方法用于读取前面的 n 行,如果不填参数 n ,默认返回 5 行。

tail( n ) 方法用于读取尾部的 n 行,如果不填参数 n ,

默认返回 5 行,空行各个字段的值返回 NaN

info() 方法返回表格的一些基本信息

python 复制代码
import pandas as pd
​
df = pd.read_csv('nba.csv')
​
print(df.head())   # 默认读取前 5 行
print(df.head(10)) # 读取前 10 行
​
print(df.tail())   # 读取末尾 5 行
print(df.tail(10)) # 读取末尾 10 行
print(df.info())
复制代码

non-null 为非空数据,我们可以看到上面的信息中,总共 458 行,College 字段的空值最多。

相关推荐
Duang1 天前
从零推导指数估值模型 —— 一个三因子打分系统的设计思路
数据分析·领域驱动设计
西岸行者5 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
starlaky5 天前
Django入门笔记
笔记·django
勇气要爆发5 天前
吴恩达《LangChain LLM 应用开发精读笔记》1-Introduction_介绍
笔记·langchain·吴恩达
悠哉悠哉愿意5 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
Sylvia33.5 天前
火星数据:解构斯诺克每一杆进攻背后的数字语言
java·前端·python·数据挖掘·数据分析
勇气要爆发5 天前
吴恩达《LangChain LLM 应用开发精读笔记》2-Models, Prompts and Parsers 模型、提示和解析器
android·笔记·langchain
Flying pigs~~5 天前
机器学习之逻辑回归
人工智能·机器学习·数据挖掘·数据分析·逻辑回归
别催小唐敲代码5 天前
嵌入式学习路线
学习
qianshanxue115 天前
计算机操作的一些笔记标题
笔记