【生态经济学】利用R语言进行经济学研究技术——从数据的收集与清洗、综合建模评价、数据的分析与可视化、因果推断等方面入手

查看原文>>> 如何快速掌握利用R语言进行经济学研究技术------从数据的收集与清洗、综合建模评价、数据的分析与可视化、因果推断等方面入手

近年来，人工智能领域已经取得突破性进展，对经济社会各个领域都产生了重大影响，结合了统计学、数据科学和计算机科学的机器学习是人工智能的主流方向之一，目前也在飞快的融入计量经济学研究。表面上机器学习通常使用大数据，而计量经济学则通常使用较小样本，但这种区别日渐模糊，机器学习在经济学领域、特别是经济学与其它学科的交叉领域表现日益突出。R语言是用于统计建模的主流计算机语言，用于机器学习十分方便，且学习曲线相比于Python更加平滑，因此是进行机器学习的首选之一。本内容从论文写作的实际需求出发，首先简单的介绍经济学的基本理论与研究方法，让您了解论文的选题方法与写作框架。随后重点从数据的收集与清洗、综合建模评价、数据的分析与可视化、数据的空间效应、因果推断等方面入手，让您用最快的速度掌握利用R语言进行经济学研究的技术。同时也会对论文写作中经常用到的辅助软件进行介绍，尽量降低论文写作的难度。

【内容简述】：

专题一、理论基础与软件介绍

1.1 经济学基础原理

主要内容：

经济学思考范式，资源配置，效率与公平（古典经济学领域）。

格里高利·曼昆，通俗的讲述了十大经济学原理

例如，大卫·李嘉图的比较优势的原理。

例如，机会与成本。正U型定价曲线，MC（边际成本）ACT（平均总成本）

理性人假设，市场调节可能是最优解。

丹·艾瑞里《怪诞行为学》锚定效应

1.2 概率统计的基本思想

1.2.1 概率统计的常见概念

概率的诞生，奶茶问题。

正态分布。

P值

1.2.2 评价（单指标评价与复合指标评价）

单指标评价:例如GDP

复合指数评价

指标体系评价

1.2.3 因果推断

概念产生：因果推断(Causal Inference)是根据某一结果发生的条件对因果关系作出刻画的过程，推断因果关系的最有效方法是进行随机对照试验，但这种方式耗时且昂贵、也无法解释和刻画个体差异；因此考虑从观察数据中进行因果推断，这类框架包括潜在结果框架和结构因果模型，下文对结构因果模型的因果推理方法进行综述。

证据等级，单个案例，多个案例，随机对照实验，循证，机理机制分析

1.3 机器学习用于评价和因果推断（算法介绍）

1.3.1KNN和Kmeans

KNN（K- Nearest Neighbor）法即K最邻近法，最初由 Cover和Hart于1968年提出，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路非常简单直观：如果一个样本在特征空间中的K个最相似（即特征空间中最邻近）的样本中的大多数属于某一个类别，则该样本也属于这个类别。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

Kmeans

1.3.2德尔菲和AHP

德尔菲是Delphi的中文译名。美国兰德公司在20世纪50年代与道格拉斯公司合作研究出有效、可靠地收集专家意见的方法，以"Delphi"命名，之后，该方法广泛地应用于商业、军事、教育、卫生保健等领域。德尔菲法在医学中的应用，最早开始于对护理工作的研究，并且在使用过程中显示了它的优越性和适用性，受到了越来越多研究者的青睐。

AHP（Analytic Hierarchy Process）层次分析法是美国运筹学家T. L. Saaty教授于二十世纪70年代提出的一种实用的多方案或多目标的决策方法，是一种定性与定量相结合的决策分析方法。常被运用于多目标、多准则、多要素、多层次的非结构化的复杂决策问题，特别是战略决策问题，具有十分广泛的实用性。