🧑 博主简介:曾任某智慧城市类企业算法总监,CSDN / 稀土掘金 等平台人工智能领域优质创作者。
目前在美国市场的物流公司从事高级算法工程师一职,深耕人工智能领域,精通python数据挖掘、可视化、机器学习等,发表过AI相关的专利并多次在AI类比赛中获奖。
一、引言
在当今社会,城市的幸福指数不仅是居民生活质量的重要体现,也是衡量城市竞争力的关键指标。本文将通过 Python 和 Pyecharts 对中国城市幸福指数及其影响因素进行深度可视化分析。我们将从多个维度出发,结合多种炫酷的图表,展示数据背后的深刻洞察,并最终生成一个可移动的可视化大屏,为数据分析和决策提供有力支持。
二、数据准备与预处理
首先,我们需要加载数据,在进行可视化之前,需要对数据进行清洗,去除异常值和缺失值。:
python
import pandas as pd
import numpy as np
from pyecharts import options as opts
from pyecharts.charts import *
from pyecharts.globals import ThemeType
# 读取数据
df = pd.read_csv("updated_city_happiness.csv")
# 清理数据
df = df[~df['省份'].str.contains('ce1')] # 删除异常行
numeric_cols = df.columns[4:-1] # 从第5列开始是数值列
df[numeric_cols] = df[numeric_cols].apply(pd.to_numeric, errors='coerce')
df = df.drop(['status'], axis=1)
三、多维度可视化分析
3.1 各区域幸福指数占比玫瑰图
ini
# 计算各区域幸福指数占比
region_happiness_percentage = df.groupby('区域')['幸福指数'].mean().reset_index()
region_happiness_percentage.columns = ['区域', '平均幸福指数']
# 创建玫瑰图
pie = (
Pie(init_opts=opts.InitOpts(theme=ThemeType.DARK, width="100%", height="400px"))
.add("", [list(z) for z in zip(region_happiness_percentage['区域'], region_happiness_percentage['平均幸福指数'])])
.set_global_opts(
title_opts=opts.TitleOpts(title="各区域幸福指数占比玫瑰图", pos_left="center"),
legend_opts=opts.LegendOpts(orient="vertical", pos_left="left"),
tooltip_opts=opts.TooltipOpts(trigger="item", formatter="{a} <br/>{b}: {c} ({d}%)")
)
.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c} ({d}%)"))
)

3.2 各区域教育满意度与幸福指数关系
less
# 计算各区域教育满意度与幸福指数的关系
region_education_happiness = df.groupby('区域')[['教育满意度(10分制)', '幸福指数']].mean().reset_index()
# 创建柱状图
bar = (
Bar(init_opts=opts.InitOpts(theme=ThemeType.DARK, width="100%", height="400px"))
.add_xaxis(region_education_happiness['区域'].tolist())
.add_yaxis("教育满意度(10分制)", region_education_happiness['教育满意度(10分制)'].tolist(), yaxis_index=0, color="#67E0E3")
.add_yaxis("幸福指数", region_education_happiness['幸福指数'].tolist(), yaxis_index=1, color="#FFD700")
)

3.3 人均可支配收入区间与平均幸福指数
ini
# 将人均可支配收入分组
bins = [0, 2, 4, 6, 8, 10]
labels = ['0-2万', '2-4万', '4-6万', '6-8万', '8-10万']
df['收入区间'] = pd.cut(df['人均可支配收入(万元)'], bins=bins, labels=labels, right=False)
# 计算每个收入区间的平均幸福指数
grouped_data = df.groupby('收入区间')['幸福指数'].mean().reset_index()
# 创建柱状图
bar1 = (
Bar(init_opts=opts.InitOpts(theme=ThemeType.DARK, width="100%", height="400px"))
.add_xaxis(grouped_data['收入区间'].tolist())
.add_yaxis("平均幸福指数", grouped_data['幸福指数'].round(2).tolist(), color="#FF6B6B")
)

3.4 省份平均幸福指数地图
less
# 计算各省份的平均幸福指数
province_happiness = df.groupby('省份')['幸福指数'].mean().reset_index()
province_happiness.columns = ['省份', '平均幸福指数']
# 创建地图
province_map = (
Map(init_opts=opts.InitOpts(theme=ThemeType.DARK, width="100%", height="600px"))
.add("平均幸福指数", [list(z) for z in zip(province_happiness['省份'], province_happiness['平均幸福指数'])], "china")
)

3.5 创建城市平均幸福指数
ini
geo = (
Geo(init_opts=opts.InitOpts(theme=ThemeType.DARK))
.add_schema(maptype="china")
.add(
"平均幸福指数",
[(row['城市'], row['幸福指数']) for index, row in df.iterrows()],
# type_=GeoType.HEATMAP,
)
)
geo.render("城市平均幸福指数地图.html")

3.6 区域平均幸福指数地图(增强版)
ini
# 模拟区域数据
region_happiness = pd.DataFrame({
"区域": ["东北", "华东", "华中", "华北", "华南", "西北", "西南"],
"平均幸福指数": [80.87, 82.35, 78.60, 74.69, 89.81, 76.89, 87.32]
})
# 区域与省份映射
region_to_provinces = {
"东北": ["辽宁省", "吉林省", "黑龙江省"],
# ... 其他区域映射
}
# 准备地图数据
map_data = []
for _, row in region_happiness.iterrows():
region = row["区域"]
happiness = row["平均幸福指数"]
for province in region_to_provinces[region]:
map_data.append([province, happiness])
# 创建地图
region_map_chart = (
Map(init_opts=opts.InitOpts(theme=ThemeType.DARK, width="100%", height="600px"))
.add(
series_name="平均幸福指数",
data_pair=map_data,
maptype="china",
is_map_symbol_show=False
)
)

3.7不同区域多维表现雷达图
ini
# 计算各区域多维指标均值
dimensions = [
'人均可支配收入(万元)', '房价收入比', '教育满意度(10分制)',
'医疗资源指数', 'PM2.5年均值', '公园绿地面积(㎡/人)',
'养老保险覆盖率(%)', '每万人警力数', '通勤时间(分钟)'
]
region_data = df.groupby('区域')[dimensions].mean().reset_index()
# 准备雷达图数据
radar_data = [
{
"value": [round(x, 1) for x in region_data.iloc[i][1:].values.tolist()],
"name": region_data.iloc[i]["区域"]
} for i in range(len(region_data))
]
# 创建雷达图
radar = (
Radar(init_opts=opts.InitOpts(theme=ThemeType.DARK))
.add_schema(
schema=[
opts.RadarIndicatorItem(name=str('人均可支配收入(万元)'), max_=5,min_=1),...
],
splitarea_opt=opts.SplitAreaOpts(is_show=False, areastyle_opts=opts.AreaStyleOpts(opacity=1))
)
)

3.8 幸福指数相关因素热力图
ini
# 计算相关系数矩阵
corr_matrix = df[['幸福指数', '人均可支配收入(万元)', '教育满意度(10分制)',
'医疗资源指数', '公园绿地面积(㎡/人)', 'PM2.5年均值']].corr()
# 准备热力图数据
columns = corr_matrix.index.tolist()
heatmap_data = [[i, j, round(corr_matrix.iloc[i, j], 2)] for i in range(len(columns)) for j in range(len(columns))]
# 创建热力图
heatmap = (
HeatMap(init_opts=opts.InitOpts(theme=ThemeType.DARK, width="100%", height="500px"))
.add_xaxis(columns)
.add_yaxis(
"相关性系数",
columns,
heatmap_data,
label_opts=opts.LabelOpts(color="#fff"),
)
)

四、构建可视化大屏
csharp
from pyecharts.charts import Page
# 创建页面
page = Page(layout=Page.DraggablePageLayout, page_title="中国城市幸福指数可视化大屏")
# 添加所有图表
page.add(
pie,
bar,
bar1,
province_map,
geo,
region_map_chart,
radar,
heatmap
)
# 保存为HTML文件
page.render("中国城市幸福指数可视化大屏.html")

五、分析与结论
通过以上多维度可视化分析,我们可以得出以下结论:
区域差异显著: 华南地区幸福指数最高,可能与经济发展水平、气候条件等因素相关。
经济与幸福指数: 人均可支配收入在4-6万区间时,幸福指数达到峰值,说明收入与幸福感并非线性关系。
多维表现: 各区域在医疗、教育、环境等维度表现各异,雷达图清晰展示了区域发展的不平衡性。
关键影响因素: 热力图显示,PM2.5年均值与幸福指数呈强负相关,说明环境质量对幸福感有重要影响。
六、总结
本文通过PyEcharts构建了一个炫酷的交互式可视化大屏,从多个角度分析了中国城市的幸福指数。这种可视化方式不仅直观展示了数据特征,还通过交互功能增强了用户体验。对于数据分析和可视化从业者来说,这种多图表组合的大屏展示方式值得借鉴。
最终生成的可视化大屏文件"中国城市幸福指数可视化大屏.html"可以直接在浏览器中打开,支持拖拽、缩放等交互操作。
如果您在人工智能领域遇到技术难题,或是需要专业支持,无论是技术咨询、项目开发还是个性化解决方案,我都可以为您提供专业服务,如有需要可站内私信或添加下方VX名片(ID:xf982831907)
期待与您一起交流,共同探索AI的更多可能!