一、项目(统计建模大赛)前提
(一)创建CLAUDE.md文件
最好事先单独创建一个项目文件夹,CLADE.md文件一方面是为了记忆你使用Claude code的过程,另一方面是为了给Claude code提要求,例如:
1.你输出的所有代码必须为Python语言
2.必须以大赛的风格输出,要具有严谨性、专业性等

(二)Claude code 记忆系统
这里涉及到Claude code自带的memory记忆系统,我们在Claude终端输入指令/memory后会出现以下这三个选项:第一个为用户级最高级别全局记忆,你所有的内容输出都会参考这个文件,第二个为项目级,只有在你做这个项目时才会读取,第三个点击后会直接打开自动记忆文件所在的目录,方便你手动查看、编辑或备份记忆内容。

优先规则:如果两个文件有冲突,项目级可以覆盖用户级,因为项目规范通常更具体、更重要。
User memory: "我用单引号"
Project memory: "本项目用双引号(团队规范)"
结果 → 用双引号(项目级优先)
(三)分类文件夹
创建分类文件夹也是能极大的提高我们的工作效率,例如:项目数据、项目实行代码、项目中间结果、项目最终结果等。

二、数据收集与预处理
(一)了解大赛背景
首先告诉他这次我们大赛的主题,然后给出我们的选题,让他评估一下选题的可行性难易程度,我们要给他输入选题的核心思想。
(二)数据收集
在数据收集之前,明确告诉他,大体的数据都要来自公开网站,有需要部分精确的数据依靠网络爬虫,可以让他生成代码。
三、合成控制法
(一)模型的选择
大体的研究思路方向要给Claude code讲清楚,根据你收集到的所有数据,输入给Claude code让他根据现有的数据可以用什么方法去解决这个问题,例如我的项目主题是《"数字红利"还是"数字陷阱"?------探究"东数西算"工程对西部四大算力枢纽的影响》,因为我的项目是政策评估方面的,所以先让他输出所有有关政策评估方面的模型。
他给我输出以下模型:①传统双重差分法(DID)② 合成控制法(SCM),因为当你的研究场景是**"处理组数量极少(甚至只有一个),但拥有较长的时间序列数据"**时,合成控制法往往比传统的双重差分法(DID)更具优势。
(二)变量定义
1.实验省份选择
我们以四省(贵州、甘肃、宁夏和内蒙古)为处理组,又选择了其他17省(剔除了东部算力枢纽和西藏等一些不太符合实验标准的省份避免污染实验)为对照组。
2.指标确定
为了构建多维政策效应评估体系,我让Claude code为我们构建这个体系,他给我们推出了以下指标维度:
|------|---------------|-----------------------|
| 维度 | 指标 | 经济含义 |
| 经济总量 | GDP(地区生产总值) | 衡量地区经济规模与综合实力的核心指标 |
| 产业结构 | 第二产业占比、第三产业占比 | 反映工业化水平及经济结构的高级化程度 |
| 数字基建 | 互联网宽带接入用户 | 表征区域信息化普及度与数字经济发展基础 |
| 创新投入 | 地方R&D经费 | 体现区域科技创新投入强度与技术发展潜力 |
| 财政支出 | 地方财政支出 | 反映政府对经济活动的干预力度与资源配置能力 |
| 城镇化 | 城市化率 | 衡量人口集聚程度及区域现代化发展水平 |
[多维指标表]
(三)合成控制实验
由于我接触Python比较多,所以这次实验全程用Python代码实现(前面CLAUDE.md文件可以加入这一条件),Claude code会生成具体的代码,这一步要严格把关,你要知道代码整体怎么运行的,不断调试直到实验结果达标。
可以先让他生成一个方案,一个大概的怎么做这个实验的计划,一般我都生成为markdown文件。等自己审核完成以后,让他直接开始运行,最后再审核实验结果。
四、合成控制估计结果
在完成所有代码和产出审核之后,你可以让他帮你,用不同的方式输出结果例如:图、表等,还可以让他帮忙优化结果图或者是文字结果描述。eg:
|---|----------------------------------------------------------------------------|
| |
|
五、稳健性检验:安慰剂检验
同样的我们可以向Claude code提问,怎么做安慰剂检验,例如:合成控制法的结果已经全部产出,我要怎么验证这个结果有说服力或者怎么做安慰剂检验。下面是Claude code的回答结果:
"为了验证上述合成控制法估计结果的稳健性,本文采用了两种互补的检验方法:
安慰剂检验:旨在排除随机因素干扰。通过将政策干预时间或对象随机分配给未受政策影响的地区,构建'虚假'的处理效应分布,以验证真实处理组的效应是否显著异于随机噪声。
留一法(Leave-one-out)检验:旨在验证结果对控制池样本的敏感性。通过依次剔除控制池中的每一个潜在捐赠单元并重新进行合成,检验基准结果是否由某个特定的高权重地区所主导,从而确保结论的普适性与可靠性。"
通过深入了解,第一个方法是在合成控制法的基础上,把政策效应放在对照组省份观察结果显著性,第二种方法是依次剔除高权重省份,检验结果的普适性和准确性。
提示:因为不可能有一个方法是为我们做的实验量身定做的,所Claude code选择的方法不一定会产出最好的结果。
六、预测模型与政策模拟
这里的内容是我自己突发奇想,我的目的是:可以做一个预测模型如果某个省份做出某种变革后,他的经济高质量发展趋势比现状要好很多。prompt:我想做一个政策模拟,假设某省份做出某种变革,预测其高质量发展趋势。这个想法可行性高吗?有哪些模型可以实现?
七、研究结论与政策建议
可以让Claude code总结你前面得出的所有结论,把这些结论变换为政策建议即可。