使用Python及R语言绘制简易数据分析报告

Pytohn实现

在python中有很多包可以实现绘制数据分析报告的功能,推荐两个较为方便的包:pandas-profiling 和 sweetviz 。

使用 pandas-profiling 包(功能全面)

这个包的个别依赖包与机器学习的 sklearn包的依赖包存在版本冲突,如已安装sklearn包的话可以在Anaconda中创建虚拟环境使用。

在Anaconda中创建python虚拟环境(创建了一个3.6版本,名为GGBoy的python虚拟环境):

bash 复制代码
conda create -n GGBoy python=3.6

Proceed([y]/n)? 中选择 y

创建虚拟环境成功后激活虚拟环境:

bash 复制代码
conda activate GGBoy

环境激活成功:

bash 复制代码
(GGBoy) C:\Users\114514>

在虚拟环境中安装pandas 包和pandas-profiling包:

bash 复制代码
conda install pandas
pip install pandas-profiling

绘制titandick数据集的数据报告,数据集下载地址:taitanic | Kaggle

在VSCode中建立一个拓展名.ipynb的jupyter notebook文件,内核选择刚才新建的虚拟环境:

使用pandas-profiling 包:

python 复制代码
from pandas_profiling import ProfileReport
import pandas as pd

# 使用pandas读取titandick的csv数据集
data = pd.read_csv('C:\\Users\\114514\\Desktop\\titandick.csv')
df = pd.DataFrame(data)

# 绘制数据分析报告
report = ProfileReport(df)  
report.to_file(output_file='report.html')

生成报告:

使用 sweetviz 包(最方便操作):

python 复制代码
import sweetviz as sv
import pandas as pd

# 使用pandas读取titandick的csv数据集
data = pd.read_csv('C:\\Users\\114514\\Desktop\\titandick.csv')
df = pd.DataFrame(data)

# 使用sweetviz包绘制数据分析报告
report = sv.analyze(df) 
report.show_html('report.html')

生成报告:

R语言实现

需要先下载R包 summarytools

R 复制代码
install.packages("summarytools")
R 复制代码
library(summarytools)

df <- read.csv("C:/Users/114514/Desktop/titandick.csv")
report <- dfSummary(df)  

html_report <- print(report, method = "render", include.row.numbers = FALSE, style = "grid")  

html_output <- paste(html_report, collapse = "\n")  

# 将合并后的HTML字符串写入文件  
cat(html_output, file = "report_GGBoy.html")

生成的数据分析报告:

相关推荐
执笔论英雄2 分钟前
【RL】Slime异步 routout 过程7 AsyncLoopThread
开发语言·python
o***74172 分钟前
QoS质量配置
开发语言·智能路由器·php
Tony Bai3 分钟前
Go 2026 路线图曝光:SIMD、泛型方法与无 C 工具链 CGO —— 性能与表达力的双重飞跃?
开发语言·后端·golang
fj_changing4 分钟前
Ubuntu 22.04部署CosyVoice
人工智能·python·深度学习·ubuntu·ai
小二·4 分钟前
DevUI 和 MateChat:2025 年,我们是怎么把前端开发变轻松的
开发语言·javascript·vue.js
z***02604 分钟前
Python大数据可视化:基于大数据技术的共享单车数据分析与辅助管理系统_flask+hadoop+spider
大数据·python·信息可视化
i***68325 分钟前
PHP操作redis
开发语言·redis·php
CC数学建模5 分钟前
被问爆的 “高颜值 + 强功能” 学生管理系统!Flask+MySQL 全栈开发,自带数据分析 + 幸福指标,毕设 / 竞赛直接
mysql·数据分析·flask
kesifan5 分钟前
JAVA异常处理的基本概念
java·开发语言
雪域迷影7 分钟前
Python中通过get请求获取api.open-meteo.com网站的天气数据
开发语言·python·php