一周学会Pandas2 Python数据处理与分析-编写Pandas2 HelloWord项目

锋哥原创的Pandas2 Python数据处理与分析 视频教程:

2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili

我们首先准备一个excel文件,用来演示pandas操作数据集(数据的集合)。excel文件属于数据集的一种,其他的csv,网页,sql,剪贴板也算数据集。student_scores.xlsx文件。一共100条数据。包含姓名,学号,出生日期,性别,语文分数,数学分数,英语分数列信息。

当然这个excel数据集也是锋哥通过pandas生成的,先给下代码,等后面学到数据输出再细讲代码,暂时不要求掌握。( 需要额外安装openpyxl库 )

复制代码
import pandas as pd
import random
import string
from datetime import datetime, timedelta


def random_name():
    first_names = ['赵', '钱', '孙', '李', '周', '吴', '郑', '王']
    last_names = [''.join(random.choices(string.ascii_letters, k=2))]
    return random.choice(first_names) + random.choice(last_names)


def random_date():
    start_date = datetime.strptime('2005-01-01', '%Y-%m-%d')
    end_date = datetime.strptime('2008-12-31', '%Y-%m-%d')
    random_days = random.randint(0, (end_date - start_date).days)
    return (start_date + timedelta(days=random_days)).strftime('%Y-%m-%d')


data = {
    '姓名': [random_name() for _ in range(100)],
    '学号': [f'S{random.randint(10000, 99999)}' for _ in range(100)],
    '出生日期': [random_date() for _ in range(100)],
    '性别': [random.choice(['男', '女']) for _ in range(100)],
    '语文分数': [random.randint(0, 100) for _ in range(100)],
    '数学分数': [random.randint(0, 100) for _ in range(100)],
    '英语分数': [random.randint(0, 100) for _ in range(100)]
}

df = pd.DataFrame(data)
df.to_excel('student_scores.xlsx', index=False)    

新建helloWorld.py

复制代码
# 导入pandas库,去别名pd
import pandas as pd

df = pd.read_excel('student_scores.xlsx')  # 读取excel,返回DataFrame数据集对象
print(df)

运行输出:

格式不太好看,我们可以学习下一节,用Jupyter,返回效果会好看很多。

相关推荐
清水白石0081 分钟前
《用 Python 单例模式打造稳定高效的数据库连接管理器》
数据库·python·单例模式
啊阿狸不会拉杆3 分钟前
《数字图像处理》第7章:小波变换和其他图像变换
图像处理·人工智能·python·算法·机器学习·计算机视觉·数字图像处理
梅孔立10 分钟前
【实用教程】python 批量解析 EML 邮件文件 存成txt ,可以利用 AI 辅助快速生成年终总结
开发语言·python
BoBoZz1931 分钟前
ExtractSelectionUsingCells选择和提取三维模型中的特定单元(Cell)
python·vtk·图形渲染·图形处理
韩立学长35 分钟前
【开题答辩实录分享】以《跳蚤市场二手物品交易推荐平台》为例进行选题答辩实录分享
python·django
yaoxin52112338 分钟前
273. Java Stream API - Stream 中的中间操作:Mapping 操作详解
java·开发语言·python
java1234_小锋38 分钟前
[免费]基于Python的Flask+Vue物业管理系统【论文+源码+SQL脚本】
后端·python·flask·物业管理
free-elcmacom38 分钟前
机器学习高阶教程<5>当机器学习遇上运筹学:破解商业决策的“终极难题”
人工智能·python·机器学习
技术小甜甜38 分钟前
[Python实战] 告别浏览器驱动烦恼:用 Playwright 优雅实现网页自动化
开发语言·python·自动化
道19931 小时前
PyTorch 高级进阶教程之深度实战实例(四)
人工智能·pytorch·python