【DWJ_1703225514】基于Sklearn航空公司服务质量分析

【Talk is cheap】

复制代码
# 导入库
import warnings
warnings.filterwarnings('ignore')

import pandas as pd 

import seaborn as sns
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False 
%matplotlib inline

from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

1 加载数据

数据集中缺失数据占的百分比为:
Unnamed: 0 0.000000
id 0.000000
Gender 0.000000
Customer Type 0.000000
Age 0.000000
Type of Travel 0.000000
Class 0.000000
Flight Distance 0.000000
Inflight wifi service 0.000000
Departure/Arrival time convenient 0.000000
Ease of Online booking 0.000000
Gate location 0.000000
Food and drink 0.000000
Online boarding 0.000000
Seat comfort 0.000000
Inflight entertainment 0.000000
On-board service 0.000000
Leg room service 0.000000
Baggage handling 0.000000
Checkin service 0.000000
Inflight service 0.000000
Cleanliness 0.000000
Departure Delay in Minutes 0.000000
Arrival Delay in Minutes 0.298352
satisfaction 0.000000

2 探索性分析

3 机器学习

3.1 分割数据

3.2 标签编码

3-3 随机森林

3-4 分类报告

相关推荐
wwj20246 分钟前
2026年招聘管理系统TOP6榜单发布
人工智能
心勤则明7 分钟前
使用SpringAIAlibaba给上下文“瘦身”
java·人工智能·spring
gCode Teacher 格码致知10 分钟前
Javascript及Python提高:将对象的键值对转换为数组元素的方式以及两种语言的对比-由Deepseek产生
javascript·python
浔川python社14 分钟前
《C++ 小程序编写系列》(合集)
python
阿钱真强道18 分钟前
37 Python 时序和文本:词袋模型 BoW 和 TF-IDF 到底怎么理解?
python·nlp·tf-idf·文本向量化·词袋模型·bow
2401_8735449235 分钟前
使用Fabric自动化你的部署流程
jvm·数据库·python
数字时代全景窗41 分钟前
Palantir:两个不确定的问题(1)大模型以上,世界模型未满?
人工智能·软件工程
和沐阳学逆向42 分钟前
断层碾压 Opus!Anthropic 最强模型泄露,代号「卡皮巴拉」
人工智能
Swift社区43 分钟前
鸿蒙游戏里的 AI Agent 设计
人工智能·游戏·harmonyos
剑穗挂着新流苏3121 小时前
202_深度学习的动力源泉:矩阵微积分与自动求导 (Autograd)
人工智能·pytorch·python·深度学习·神经网络