国际旅游网络的大数据分析(数学建模练习题)

题目:国际旅游网络的大数据分析

伴随着大数据时代的到来,数据分析已经深入到现代社会生活中的各个方面。

无论是国家政府部门、企事业单位还是个人,数据分析工作都是进行决策之前的

重要环节。

山东省应用统计学会是在省民政厅注册的学术类社会组织,于 1989 年成立。

学会是全省目前从事统计调查和绩效评估机构中唯一的 4A 级学会,是省科协的

组成单位和省社科联的直属学会,拥有统计调查、绩效评估、综合评价、社会组

织评估、科技评价、旅游信息调查、区域发展规划、区域经济等方面的人才优势,

尤其在统计调查、第三方评估、决策咨询研究等方面优势突出,拥有多个专业的

评估专家库和专家服务团。

目前,旅游业之所以重要,是因为它可以通过创造就业机会、创造收入以及

促进基础设施和服务的发展,为一个国家的经济做出重大贡献。它还可以促进世

界各地人民之间的文化交流和理解,并有助于保护自然和文化遗产。

附件中的数据集包含各国的国际旅游人数的信息。这些数据可以帮助研究人

员、政策制定者和企业深入了解旅游业及其对世界各地的影响。该数据集包括

1995 年至 2020 年 100 多个国家的国际旅游人数信息,数据来源于世界银行。

请你们进行数据统计与调查分析,使用附件中的数据,回答下列问题:

⚫ 问题 1: 请进行分类汇总统计,计算不同国家 1995 年至 2020 年累计旅游总

人数,从哪个国家旅游出发的人数最多,哪个国家旅游到达的人数最多?

⚫ 问题 2: 请任选一个国家,建立国家旅游出发人数的预测模型,基于该国家

1995 年至 2020 年的旅游出发人数,预测 2030 和 2050 年的旅游出发人数。

⚫ 问题 3: 请进行数据统计,建立不同国家旅游的网络模型,分析哪两个国家

之间的旅游最为频繁?并分析这种频繁关系随时间的变化。

⚫ 问题 4: 请分析附件中的数据,基于时间、旅游人数、旅游出发地和目的地,

你们还可以分析得出哪些结论,并进行数据的挖掘和可视化分析

我负责的是第一和四问题

问题一

python 复制代码
import pandas as pd
import openpyxl
# 读取CSV文件数据
data = pd.read_csv(r'C:\Users\Desktop\1\A题附件:国际旅游人数.csv', encoding='gbk')

# 计算不同国家1995年至2020年的累计旅游总人数
country_departure = data.groupby('旅游出发国家')['国际旅游人数'].sum().reset_index()
country_arrival = data.groupby('旅游到达国家')['国际旅游人数'].sum().reset_index()

# 找到出发国家和到达国家的人数最多的国家
max_departure_country = country_departure.loc[country_departure['国际旅游人数'].idxmax()]
max_arrival_country = country_arrival.loc[country_arrival['国际旅游人数'].idxmax()]

# 输出结果
print("不同国家1995年至2020年的累计旅游总人数:")
print(country_departure)
print("\n从哪个国家旅游出发的人数最多:")
print(max_departure_country)
print("\n哪个国家旅游到达的人数最多:")
print(max_arrival_country)
# 将结果输出为Excel文件
with pd.ExcelWriter('统计结果.xlsx') as writer:
    country_departure.to_excel(writer, sheet_name='出发国家统计', index=False)
    country_arrival.to_excel(writer, sheet_name='到达国家统计', index=False)
    max_departure_country.to_excel(writer, sheet_name='出发国家最多人数', index=False)
    max_arrival_country.to_excel(writer, sheet_name='到达国家最多人数', index=False)

题目四

python 复制代码
import pandas as pd
import matplotlib.pyplot as plt

# 读取数据集
data = pd.read_csv(r'C:\Users\Desktop\1\A题附件:国际旅游人数.csv', encoding='gbk')

# 查看数据前几行
print(data.head())

# 统计每个年份的国际旅游人数总和
yearly_total = data.groupby('年份')['国际旅游人数'].sum()
print(yearly_total)

# 统计每个旅游出发国家的总旅游人数
departure_total = data.groupby('旅游出发国家')['国际旅游人数'].sum()
print(departure_total)

# 统计每个旅游到达国家的总旅游人数
arrival_total = data.groupby('旅游到达国家')['国际旅游人数'].sum()
print(arrival_total)

# 可视化分析:绘制每年国际旅游人数总和的折线图
yearly_total.plot(kind='line')
plt.xlabel('Year')
plt.ylabel('Total International Tourists')
plt.title('Yearly Total International Tourists')
plt.show()



结论:从年度国际旅游人数总和分析:通过统计每个年份的国际旅游人数总和,我们可以了解到每年国际旅游的整体趋势。通过绘制折线图,我们可以观察到旅游人数是先曲线增长,然后直线下降的。

相关推荐
汤姆yu2 分钟前
2026版基于python大数据的旅游可视化及推荐系统
python·旅游·大数据旅游
angleoldhen25 分钟前
简单的智能数据分析程序
python·信息可视化·数据分析
小白跃升坊3 小时前
数据分析报表如何选?详解 DataEase 四大表格:明细表、汇总表、透视表与热力图的适用场景与选择策略
数据挖掘·数据分析·开源软件·数据可视化·dataease
wudl55665 小时前
Pandas-之数据可视化
信息可视化·数据分析·pandas
Q26433650237 小时前
【有源码】基于Hadoop+Spark的起点小说网大数据可视化分析系统-基于Python大数据生态的网络文学数据挖掘与可视化系统
大数据·hadoop·python·信息可视化·数据分析·spark·毕业设计
中杯可乐多加冰8 小时前
基于网易CodeWave智能开发平台构建宝可梦图鉴
深度学习·低代码·ai·数据分析·数据采集·无代码·网易codewave征文
qq_4369621811 小时前
奥威BI:打破数据分析的桎梏,让决策更自由
人工智能·数据挖掘·数据分析
B站计算机毕业设计之家12 小时前
大数据python招聘数据分析预测系统 招聘数据平台 +爬虫+可视化 +django框架+vue框架 大数据技术✅
大数据·爬虫·python·机器学习·数据挖掘·数据分析
极客学术工坊17 小时前
2023年第二十届五一数学建模竞赛-A题 无人机定点投放问题-基于抛体运动的无人机定点投放问题研究
人工智能·机器学习·数学建模·启发式算法
极客学术工坊1 天前
2022年第十二届MathorCup高校数学建模挑战赛-D题 移动通信网络站址规划和区域聚类问题
机器学习·数学建模·启发式算法·聚类