记一次练习(内容待完善)

记录最近一次爬虫和数据可视化练习

0、数据获取

python 复制代码
import pandas as pd

year = [2018,2019,2020,2021,2022]
header = {
    "User-Agent":"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Mobile Safari/537.36 Edg/111.0.1661.44"
}
for i in year:
    url = ""
    df = pd.read_html(url, header=None)[13]
    # 删除空行
    df = df.drop(index=[1])
    # 删除最后一列
    df = df.drop(columns=["久其软件(002279) 利润表单位:万元.5"])
    # 如果不是2018年,则删除第一列
    if i != 2018:
        df = df.drop(columns=["久其软件(002279) 利润表单位:万元"])
    df1 = df.T
    # 写入csv文件
    df1.to_csv('2019.csv', header=None, mode="a", index=None)

1、数据可视化

1.1从文件中读取数据

python 复制代码
# 读取写入的文件
all_data = pd.read_csv("2019.csv")
# all_data.duplicated().sum() # 查看重复值
# all_data.drop_duplicates(inplace=True)
# all_data.isnull().sum() #  查看空值
# all_data.fillna(0, inplace=True)
# all_data.reset_index(drop=True, inplace=True) # 重置索引

1.2绘图

这里使用pyecharts来进行绘制,官方文档官方demo

绘制折柱混合图

python 复制代码
import pyecharts
from pyecharts.charts import Line, Bar, Grid, WordCloud
import pyecharts.options as opts

# 省略数据处理部分

bar1 = (
    Bar()
    .add_xaxis(year)
    .add_yaxis("营业收入", year_income, bar_width=50)
    .set_global_opts(title_opts=opts.TitleOpts(title="营业收入", subtitle="单位(元)"), 
                        yaxis_opts=opts.AxisOpts(min_=200000, max_=400000),
                        legend_opts=opts.LegendOpts(is_show=False))
)
line1 = (
    Line()
    .add_xaxis(year)
    .add_yaxis("营业收入", year_income, linestyle_opts=opts.LineStyleOpts(color="red", width=4))
)

bar2 = (
    Bar()
    .add_xaxis(year)
    .add_yaxis("营业费用", year_fee, bar_width=50)
    .set_global_opts(title_opts=opts.TitleOpts(title="营业费用", subtitle="单位(元)", pos_left="48%"), 
                        yaxis_opts=opts.AxisOpts(min_=250000, max_=400000),
                        legend_opts=opts.LegendOpts(is_show=False))
)
line2 = (
    Line()
    .add_xaxis(year)
    .add_yaxis("营业费用", year_fee, linestyle_opts=opts.LineStyleOpts(color="red", width=4))
)
overlap1 = bar1.overlap(line1)
overlap2 = bar2.overlap(line2)

grid = (
    Grid(init_opts=opts.InitOpts(width="1200px", height="800px", page_title="营收与利润"))
    .add(overlap1, grid_opts=opts.GridOpts(pos_right="58%"))
    .add(overlap2, grid_opts=opts.GridOpts(pos_left="58%"))
    .render('1.html')
)

绘制标签切换图

python 复制代码
# 绘图
def create_line(profit):
    season = []
    accu_money = [] # 累积利润
    money = [] # 每季度利润
    for key in profit:
        season.append(key)
        accu_money.append(profit[key])
    accu_money = accu_money[::-1]
    money.append(accu_money[0])
    money.append(accu_money[1] - accu_money[0])
    money.append(accu_money[2] - accu_money[1])
    money.append(accu_money[3] - accu_money[2])

    line = (
        Line()
        .add_xaxis(season[::-1])
        .add_yaxis("", money)
        .set_global_opts(title_opts=opts.TitleOpts(title="季度利润", subtitle="单位(元)"))
    )
    return line

tab = Tab(page_title="季度利润") # 设置网页标签的标题
tab.add(create_line(profit_2018), "2018")
tab.add(create_line(profit_2019), "2019")
tab.add(create_line(profit_2020), "2020")
tab.add(create_line(profit_2021), "2021")
tab.add(create_line(profit_2022), "2022")
tab.render("2.html")

绘制大屏

首先绘制要展示的各种图表,通过page对象进行整合

python 复制代码
# 创建page对象整合布局
from pyecharts.charts import Page

# 实例化page对象,指定布局方式
page = Page(layout=Page.DraggablePageLayout, page_title="基于Pyecharts的数据大屏")
page.add(
    bar1,
    line1,
    bar2,
    line2,
    create_line(profit_2018),
    create_line(profit_2019),
    create_line(profit_2020),
    create_line(profit_2021),
    create_line(profit_2022),
)
page.render("4.html")

接着在浏览器中调整各图表的大小和位置,保存json文件后,重新进行渲染

python 复制代码
Page.save_resize_html(source="4.html", cfg_file="./chart_config.json", dest="5.html")
相关推荐
kaka.liulin -study2 分钟前
LLM 构建Data Multi-Agents 赋能数据分析平台的实践之⑥:NL2SQL技术探讨
数据挖掘·数据分析
chusheng18401 小时前
Python 如何使用 multiprocessing 模块创建进程池
python·信息可视化·matplotlib
小艳加油3 小时前
ChatGPT+R语言助力生态环境数据统计分析!回归与混合效应模型、多元统计分析、结构方程模型(SEM)(lavaan)、Meta分析、贝叶斯回归等
chatgpt·数据分析·r语言·数据处理·生态环境
人工智障调包侠4 小时前
基于深度学习多层感知机进行手机价格预测
人工智能·python·深度学习·机器学习·数据分析
唐Sun_数智人7 小时前
IIOT工业物联网的数据分析与预测维护_SunIOT
物联网·数据挖掘·数据分析
羊小猪~~19 小时前
深度学习项目----用LSTM模型预测股价(包含LSTM网络简介,代码数据均可下载)
pytorch·python·rnn·深度学习·机器学习·数据分析·lstm
安冬的码畜日常20 小时前
【D3.js in Action 3 精译_029】3.5 给 D3 条形图加注图表标签(上)
开发语言·前端·javascript·信息可视化·数据可视化·d3.js
大神薯条老师21 小时前
Python从入门到高手5.1节-Python简单数据类型
爬虫·python·深度学习·机器学习·数据分析
安冬的码畜日常1 天前
【D3.js in Action 3 精译_027】3.4 让 D3 数据适应屏幕(下)—— D3 分段比例尺的用法
前端·javascript·信息可视化·数据可视化·d3.js·d3比例尺·分段比例尺
卡卡_R-Python1 天前
Tableau数据可视化入门
信息可视化·tableau