2025美赛数学建模常用数据库网站大全

优秀模板+写作红宝书+数学模型获取------更多资料请点击下方名片进群获取。

一、可以查询美国各个领域经济指标的网站:

二、各国统计数据网站大全:

中国国家统计局:

联合国统计处:

国际货币基金组织:

各国统计机构:

三、国内外灾害数据库汇总

与灾害相关的各类数据是进行灾害预测、灾情评估、灾后救援等工作的基础,国内外相关组织机构和部门对灾害数据库的建设非常重视,纷纷启动数据库建设项目,组织专门机构和人员开展灾害数据库建设工作。据统计,网上可检索到的灾害数据库就有40个,国外组织机构建设和维护的灾害数据库有26个,中国有14个 (刘耀龙等,2008)。

国外尤其是发达国家特别重视灾害数据库建设及灾害数据信息共享,已建成的灾害数据库一般都可通过互联网进行访问。表1列出了15个国外主要的灾害数据库,包括联合国开发计划署 (UNDP)、欧盟 (EU)、世界卫生组织 (WHO)、美国、日本、加拿大、澳大利亚和比利时等国际组织和国家组织建设的各类灾害数据库 (含全球性的或本国内的)。美国对灾害数据库的建设贡献甚大,不仅建成了全球性的综合灾害数据库,还建成了包括海啸、地震等在内的各类专题灾害数据库。国外尤其是发达国家的灾害数据库在建设时就考虑到了数据共享的需要,在数量、可访问性到记录灾害种类 (复合灾害群)、检索条件及查询结果等的设计上均有利于灾害信息在本国及国际范围的流通与共享,灾害数据库建设较为规范,灾害数据信息共享程度高。

名称 性质/内容 维护机构 网址
全球性的综合 灾害数据库 属于灾害数据库建设项目,记录包括世界各国发生的自然灾害、重大事故和社会事件的时间、地点等信息。 美国加州里齐蒙得大学继续教育学院 http://learning.richmond.edu/disaster/index.cfm
Technological Disasters: UNEP/APEL 联合国环境规划署 APELL计划 http://www.unepie.org/pc/apell/disasters/lists/disastercat.htm
自然灾害参考 数据库 全球性的自然灾害数据库 中国台北淡江大学资讯与图书馆学系 http://ndrd.gsfc.nasa.gov
CE-DA 全球性的人为灾害数据库 比利时流行病学灾害研究中心 (CRED) http://www.cedat.be
NGDC海啸历 史数据库 公元前2000年至今大西洋、印度洋和太平洋地区、地中海和加勒比海发生海啸的时间、位置、等级、伤亡人数、财产损失等信息。 美国国家海洋与大气管理局-国家地球物理数据中心 (NGDC) http://www.ngdc.noaa.gov/hazard/tsu_db.shtml
USGS地震数据 库 全球性的地震灾害数据 美国地质调查局 (USGS) http://earthquake.usgs.gov
空难数据库 全球性的空难灾害数据 AirDisaster.com(空难网) http://www.airdisaster.com/cgi-bin/database.cgi
EM-DAT 全球性的人为灾害数据库 世界卫生组织 (WHO)和比利时政府 http://www.emdat.be/
名称 性质/内容 维护机构 网址
EMA 灾害数据 库 澳大利亚国内的综合灾害数据库,包括 1662 年至今澳大利亚所有的自然和人为灾害数据 澳大利亚政府 http://www.ema.gov.au/ema/emaDisasters.nsf
加拿大灾害数 据库 加拿大国内地震、洪灾、交通事故等自然灾害和重大事故的位置、时间、影响范围、损失估计等数据。 加拿大重要基础设施保护及应急管理局(OCIPEP) http://ww5.ps-sp.gc.ca/res/em/cdd/search-en.asp
美国暴风雨雪 灾害数据库 (NCDC) 美国1950年以来干旱、洪涝、暴风雨雪等自然灾害数据 美国国家气候资料中心 http://www4.ncdc.noaa.gov/cgi-win/wwcgi.dll?wwEvent\~Storms
美国气候统计 资料数据库 美国1995年以来由气候灾害造成人员、财产等损失信息的统计资料。 美国国家海洋和大氣局(NOAA) http://www.nws.noaa.gov/om/hazstats.shtml
UNDP 自然灾 害数据库 包括:伊朗、印度尼西亚等7个国家/地区自然灾害数据的亚洲数据库;圭亚那、牙买加等5个国家/地区自然灾害数据的北美和加勒比数据库;印度尼西亚海啸灾害数据等专门数据库 联合国开发计划署 (UNDP) http://undp.desinventar.net/DesInventar/index.jsp
SHELDUS 美国1995年自然灾害发生的 时间、地点、损失、伤亡等信息,收集了包括飓风、洪水等在内的18个自然灾害类型,不包括波多黎各等地区。 美国国家科学基金会和南卡罗莱纳州大学 http://webra.cas.sc.edu/hvri/products/sheldus.aspx
台风数据 库 日本实时台风信息 日本北本朝展国立情报学研究所 http://agora.ex.nii.ac.jp/digital-typon_index.html

从互联网上可以查到,我国已建成一批灾害数据库,但是这些数据库中灾害数据的标准不统一,数据来源的可靠性与广泛性有待商榷,数据管理范式,包括灾害特征类、字段名称、对应数据类型等规范的确定、典型的关系数据库结构应用与国际同类数据库不一致,互访与接轨中存在明显的不协调,难以实现有效共享。

并且,已建成并在网上发布的这些灾害数据库一般是依托某个项目进行,数据的后续更新和维护不及时,甚至某些数据库中的数据截止某个时间后就再也没有更新,表2列出了国内8个主要灾害数据库的基本情况,其中大部分在线发布的数据已不再更新。

名称 性质/内容 维护机构 网址
农作物灾害数据库 国内公元前205年以来水灾、旱灾、风雹、台风、病虫灾害、低温霜雪冻害、农作物等与农作物相关灾害的分阶段统计资料,如受灾面积、成灾面积等 中国农业部种植业管理司 http://zzys.agri.gov.cn/zaihai/chaxun.asp
中国自然资源数据库--灾害分库 全国受灾和成灾面积、分省农作物受灾和成灾面积、分省历年水旱灾害面积等统计数据 中国科学院地理科学与资源研究所 http://www.naturalresources.csdb.cn/newzrzy/gxx.asp
中国可持续发展信息网--灾害信息 全国洪涝灾害、气象灾害、地震灾害、地质灾害、海洋灾害、农业生物灾害、森林灾害、环境灾害等数据。 中国21世纪议程管理中心 http://www.bonsoft.cn/sdinfo/xgwzjs.htm
农业灾害数据库 农区病虫害、疫病灾害、森林病虫害、草原虫害、草原鼠害、雹灾、洪灾、风沙、霜冻、干旱、雪灾等信息。 柴达木农业信息网&海西州农业信息网 http://www.qhhxzny.gov.cn/db
中国灾害性天气数据库 中国气象局国家气象信息中心 http://www.cams.cma.gov.cn/htdocs/21*zhsjcx*t.htm
中国海洋灾害公报 (2001-2005) 中国国家海洋信息中心 http://nsii.coi.gov.cn/webgis/index.htm
气象灾害数据库 中国干旱灾害数据集中国暴雨洪涝灾害数据集中国热带气旋灾害数据集湖北省山洪灾害数据集 中国气象科学研究院 http://cdc.cma.gov.cn/s_huju/index.jsp
中国及邻区地应力 和地质灾害数据库 我国各类重大地质灾害的发育、分布状况、危害程度等 中国地质力学研究院 http://www.geomech.ac.cn/geo-3/

汶川地震发生后,中国水利水电科学研究院水环境研究所所长周怀东曾建议,我国应建立一个地震灾害的数据库,对灾后环境安全进行综合评估,并采取有效应对措施,称"数据库的建立对今后发生类似灾害时的预警预报很有帮助"。事实上,不仅灾害数据库自身的建立非常重要,与灾害相关的人口、经济等其它信息的建设,以及这些信息与灾害数据的有效集成与共享也非常重要。但是,与国外相比,国内灾害数据库建设和数据共享的标准化、规范化水平还比较低 (刘耀龙等,2008),有必要尽快深入研究国际较通用的灾害数据库建设规范与标准,探讨灾害相关数据的共享方法。

四、欧美相关统计数据 (一般美赛这里比较多)

五、国外统计学网址

2.国内统计学网址

统计相关杂志

4 软件

六、全球及各国重要数据网站集锦

七、常见数据收集网站:

一.由简单和通用的数据集开始

  1. data.gov( https://www.data.gov/) 这是美国政府公开数据的所在地,该站点包含了超过19万的数据点。这些数据 集不同于气候、教育、能源、金融和更多领域的数据。
  2. data.gov.in(https://data.gov.in/) 这是印度政府公开数据的所在地,通过各种行业、气候、医疗保健等来寻找数据, 你可以在这里找到一些灵感。根据你居住的国家的不同,你也可以从其他一些网 站上浏览类似的网站。
  3. WorldBank( http://data.worldbank.org/) 世界银行的开放数据。该平台提供 Open Data Catalog,世界发展指数,教育指 数等几个工具。
  4. RBI( https://rbi.org.in/Scripts/Statistics.aspx ) 印度储备银行提供的数据。这包括了货币市场操作、收支平衡、银行使用和一些 产品的几个指标。
  5. Five ThirtyEight Datasets ( https://github.com/fivethirtyeight/data) Five Thirty Eight,亦称作 538,专注与民意调查分析,政治,经济与体育的博客。 该数据集为 Five ThirtyEight Datasets 使用的数据集。每个数据集包括数据,解释 数据的字典和 Five ThirtyEight 文章的链接。如果你想学习如何创建数据故事,没 有比这个更好。

二.大型数据集

  1. Amazon WebServices (AWS) datasets (https://aws.amazon.com/cn/datasets/ ) Amazon 提供了一些大数据集,可以在他们的平台上使用,也可以在本地计算机 上使用。您还可以通过 EMR 使用 EC2 和 Hadoop 来分析云中的数据。在亚马逊 上流行的数据集包括完整的安然电子邮件数据集,Google Booksn-gram,NASA NEX 数据集,百万歌曲数据集等。
  2. Googledatasets (https://cloud.google.com/bigquery/public-data/) Google 提供了一些数据集作为其 Big Query 工具的一部分。包括 GitHub 公共 资料库的数据,Hacker News 的所有故事和评论。
  3. Youtubelabeled Video Dataset (https://research.google.com/youtube8m/) 几个月前,谷歌研究小组发布了 YouTube 上的"数据集",它由800万个 YouTube 视频 id 和 4800个视觉实体的相关标签组成。它来自数十亿帧的预先计算的,最 先进的视觉特征。

四.预测建模与机器学习数据集

  1. UCI MachineLearning Repository (https://archive.ics.uci.edu/ml/datasets.html) UCI 机器学习库显然是最著名的数据存储库。如果您正在寻找与机器学习存储库 相关的数据集,通常是首选的地方。这些数据集包括了各种各样的数据集,从像 Iris 和泰坦尼克这样的流行数据集到最近的贡献,比如空气质量和 GPS 轨迹。存 储库包含超过 350 个与域名类似的数据集(分类/回归)。您可以使用这些过滤器来 确定您需要的数据集。
  2. Kaggle (https://www.kaggle.com/datasets ) Kaggle 提出了一个平台,人们可以贡献数据集,其他社区成员可以投票并运行内 核/脚本。他们总共有超过 350个数据集------有超过200个特征数据集。虽然一 些最初的数据集通常出现在其他地方,但我在平台上看到了一些有趣的数据集, 而不是在其他地方出现。与新的数据集一起,界面的另一个好处是,您可以在相 同的界面上看到来自社区成员的脚本和问题。
  3. AnalyticsVidhya (https://datahack.analyticsvidhya.com/contest/all/) 您可以从我们的实践问题和黑客马拉松问题中参与和下载数据集。问题数据集基 于真实的行业问题,并且相对较小,因为它们意味着2-7天的黑客马拉松。
  4. Quandl (https://www.quandl.com/) Quandl 通过起网站、API或一些工具的直接集成提供了不同来源的财务、经济 和替代数据。他们的数据集分为开放和付费。所有开放数据集为免费,但高级数 据集需要付费。通过搜索仍然可以在平台上找到优质数据集。例如,来自印度的 证券交易所数据是免费的。
  5. Past KDDCups (http://www.kdd.org/kdd-cup) KDD Cup 是 ACM Special Interest Group 组织的年度数据挖掘和知识发现竞赛。
  6. DrivenData (https://www.drivendata.org/) Driven Data 发现运用数据科学带来积极社会影响的现实问题。然后,他们为数 据科学家组织在线模拟竞赛,从而开发出最好的模型来解决这些问题。

三.图像分类数据集

  1. The MNISTDatabase (http://yann.lecun.com/exdb/mnist/) 最流行的图像识别数据集,使用手写数字。它包括6万个示例和1万个示例的测 试集。这通常是第一个进行图像识别的数据集。
  2. Chars74K (http://www.ee.surrey.ac.uk/CVSSP/demos/chars74k/) 这里是下一阶段的进化,如果你已经通过了手写的数字。该数据集包括自然图像 中的字符识别。数据集包含 74,000 个图像,因此数据集的名称。
  3. Frontal Facelmages (http://vasc.ri.cmu.edu//idb/html/face/frontal_images/index.html) 如果你已经完成了前两个项目,并且能够识别数字和字符,这是图像识别中的下 一个挑战级别------正面人脸图像。这些图像是由 CMU & MIT 收集的,排列在四个 文件夹中。
  4. ImageNet (http://image-net.org/) 现在是时候构建一些通用的东西了。根据 WordNet 层次结构组织的图像数据库 (目前仅为名词)。层次结构的每个节点都由数百个图像描述。目前,该集合平均 每个节点有超过500个图像(而且还在增加)。

四.文本分类数据集

  1. Spam - NonSpam (http://www.esp.uem.es/jmgomez/smsspamcorpus/) 区分短信是否为垃圾邮件是一个有趣的问题。你需要构建一个分类器将短信进行 分类。
  2. TwitterSentiment Analysis (http://thinknook.com/twitter-sentiment-analysis-training-corpus-dataset-2012-09-2 2/) 该数据集包含 1578627 个分类推文,每行被标记为1的积极情绪,0位负面情 绪。数据依次基于 Kaggle 比赛和 Nick Sanders 的分析。
  3. Movie ReviewData (http://www.cs.cornell.edu/People/pabo/movie-review-data/) 这个网站提供了一系列的电影评论文件,这些文件标注了他们的总体情绪极性 (正面或负面)或主观评价(例如,"两个半明星")和对其主观性地位(主观或客观)或 极性的标签。

五.推荐引擎数据集

  1. MovieLens (https://grouplens.org/) MovieLens 是一个帮助人们查找电影的网站。它有成千上万的注册用户。他们进 行自动内容推荐,推荐界面,基于标签的推荐页面等在线实验。这些数据集可供 下载,可用于创建自己的推荐系统。
  2. Jester (http://www.ieor.berkeley.edu/\~goldberg/jester-data/) 在线笑话推荐系统。

六.各种来源的数据集网站

  1. KDNuggets (http://www.kdnuggets.com/datasets/index.html) KDNuggets 的数据集页面一直是人们搜索数据集的参考。列表全面,但是某些来 源不再提供数据集。因此,需要谨慎选择数据集和来源。
  2. Awesome PublicDatasets (https://github.com/caesar0301/awesome-public-datasets) 一个 GitHub 存储库,它包含一个由域分类的完整的数据集列表。数据集被整齐 地分类在不同的领域,这是非常有用的。但是,对于存储库本身的数据集没有描 述,这可能使它非常有用。
  3. RedditDatasets Subreddit (https://www.reddit.com/r/datasets/) 由于这是一个社区驱动的论坛,它可能会遇到一些麻烦(与之前的两个来源相比)。 但是,您可以通过流行/投票来对数据集进行排序,以查看最流行的数据集。另 外,它还有一些有趣的数据集和讨论。

重磅:2025年美国大学生数学建模竞赛报名正在进行中

更多资料获取,请点击下方名片

相关推荐
C灿灿数模1 天前
备战美赛!2025美赛数学建模C题模拟预测!用于大家练手模拟!
数学建模
数模竞赛Paid answer3 天前
2023年西南大学数学建模C题天气预报解题全过程文档及程序
算法·数学建模·数据分析
AI Dog3 天前
数学建模问题中的整数规划
算法·数学建模·整数规划·运筹学·malab
C灿灿数模分号13 天前
备战美赛!2025美赛数学建模C题模拟预测!用于大家练手模拟!
数学建模
从以前3 天前
python练习:“互联网 +” 时代的出租车资源配置的数学建模(二)
开发语言·python·数学建模
从以前4 天前
python练习:“互联网 +” 时代的出租车资源配置的数学建模(一)
开发语言·javascript·人工智能·python·算法·数学建模
Yaooooo85 天前
【数学建模】利用Matlab绘图(2)
开发语言·数学建模·matlab
Yangtze206 天前
紊流理论基础(三)——紊流半经验理论
线性代数·算法·数学建模·矩阵
最好Tony6 天前
优化算法之遗传算法思想和应用实例
算法·数学建模
AI Dog6 天前
数学建模中随机森林分类
人工智能·随机森林·机器学习·数学建模·malab