大家好,我是带我去滑雪!
本文基于88家企业的面板数据,采用固定效应模型深入分析了实数融合(即企业在数字化转型中各要素的整合程度)对企业价值的影响。通过对实数融合程度(ln1_fusion)、托宾Q值、企业年龄、成长性、盈利能力、负债率等变量的描述统计与相关性分析,初步勾勒了企业特征与价值之间的关系。在线性回归(OLS)基础上,进一步构建固定效应(FE)与随机效应(RE)模型,并通过Hausman检验验证固定效应模型更为稳健,表明企业间存在显著的异质性。实证结果显示,控制个体效应后,企业融合程度对企业价值具有稳定且显著的正向影响,且边际效应图也印证了这种线性关系,说明随着融合水平的提升,企业的市场价值同步增加。这一发现为理解数字化融合在企业价值创造中的作用提供了实证支持,也为企业在数字化转型过程中优化战略决策提供了重要参考。
下面开始代码实战,全流程stata建模。
目录
[(7) Hausman 检验:比较 FE 和 RE](#(7) Hausman 检验:比较 FE 和 RE)
(8)研究固定效应回归并绘制模型相关图像,包括残差诊断图、边际效应图
(1)安装相关包,并导入数据
ssc install heatplot, replace
ssc install palettes, replace
ssc install colrspace, replace
import excel "E:\工作\硕士\博客\data.xlsx", sheet("Sheet1") firstrow clear
rename 省份 province
rename 行业代码 industry_code
rename 行业id industry_id
rename 数实融合次数 fusion_times
rename ln1次数 ln1_fusion
rename 托宾值 Q
rename 企业规模年末资产自然对数 enterprise_value
rename 企业年龄 firm_age
rename 企业成长性 growth
rename 净利润率 profit_margin
rename 负债比资产 liabilities_assets
(2)描述统计
summarize ln1_fusion Q firm_age growth profit_margin liabilities_assets enterprise_value
histogram ln1_fusion, percent
输出结果:


结果解读:变量描述统计,展示了 88 个观测值中变量实数融合的对数、托宾Q值、企业年龄、企业成长性、净利润率、企业规模年末资产自然对数的均值、标准差、最小值和最大值,有助于了解数据的基本分布和潜在异常值。
从结果看,ln1_fusion(实数融合的对数)均值为 1.55,标准差为 0.64,表明大多数企业的融合水平在 0.7 到 2.8 之间波动,整体分布较集中;Q(托宾Q值)均值为 1.35,最小值和最大值分别为 0.91 和 3.72,说明大多数企业的市场价值略高于资产账面价值,但部分企业可能存在明显高估。firm_age 的平均值为 20 年,说明样本中多为成熟企业,但最大年龄达 39 年,也存在部分老牌企业。growth(企业成长性)平均为 0.08,标准差较大,最小值甚至为负,说明部分企业在样本期内增长为负,存在经营困境的可能;profit_margin(净利润率)均值为 0.039,即约为 3.9%,但最低为 -0.75,表明有企业出现亏损,利润差异明显。liabilities_assets(负债占资产比例)平均值为 51.59%,但标准差很大(78.34),甚至最小值为负数(-22.34)表明可能存在异常或录入错误,最大值超过 513%,这通常意味着某些企业存在巨额负债或资产估算问题。最后,enterprise_value(企业价值的代理指标,可能是资产对数或估值)平均为 24.13,标准差为 1.13,表明在数值层面企业价值整体较集中,但也存在一定波动,最大值为 26.08。
(3)相关系数
correlate fusion_times ln1_fusion tobinq enterprise_value firm_age growth profit_margin liabilities_assets
matrix C = r(C)
输出结果:

结果分析:通过变量之间的皮尔逊相关系数矩阵,用于衡量每一对变量之间的线性关系,数值范围从 -1(完全负相关)到 +1(完全正相关)。首先,fusion_times 与 ln1_fusion 的相关系数为 0.9534,非常接近 1,表明这两个变量高度相关(几乎线性同变),这是预期内的结果,因为 ln1_fusion 是对 fusion_times 的对数变换。这说明这两个变量在回归模型中只能选择其一,否则会出现多重共线性问题。
ln1_fusion 与 enterprise_value 的相关性为 0.1015,fusion_times 与 enterprise_value 的相关性为 0.1175,两者都为弱正相关,说明融合程度与企业价值之间在样本中可能存在正向关系,但强度较弱,有待回归进一步验证。有趣的是,ln1_fusion 与 Q 的相关性为 -0.0197(几乎无关),但 firm_age 与 Q 之间的相关性为 -0.3131,表明企业越老,其市场价值相对资产可能越低,或投资者对老企业估值偏保守。此外,enterprise_value 与 liabilities_assets 的相关系数为 0.3423,为中等正相关,意味着负债率越高,企业规模或价值也可能更大,可能是因为大型企业更容易使用债务融资。其他变量之间的相关性都不高(大多小于 ±0.3),如 growth 与 profit_margin 为 0.2918,说明盈利能力与成长性之间也存在一定正向关系。
(4)构建基准回归模型(OLS)
regress enterprise_value ln1_fusion Q firm_age growth profit_margin liabilities_assets
输出结果:

结果分析:运行的回归模型整体表现:F 值 = 11.07,p = 0.0000:说明整体模型是显著的,即至少有一个解释变量显著影响企业价值。
实数融合程度对企业价值的影响为正,但不显著,说明无法确认其统计上的有效性。市场价值与企业账面价值比越高,反而与企业价值负相关,可能代表高估企业反而资产实际较小,或模型存在解释混淆。负债比资产比率越高,企业价值越高,且显著,说明负债可能在一定程度上用于扩大企业资产或杠杆有效。
(5)构建固定效应回归模型
xtreg enterprise_value ln1_fusion Q firm_age growth profit_margin liabilities_assets, fe
must specify panelvar; use xtset
xtset panel_id
#固定效应回归(个体效应)
xtreg enterprise_value ln1_fusion Q firm_age growth profit_margin liabilities_assets, fe
输出结果:

结果分析:观测值总数:88,分布在 7 个企业(panel groups)中,每组平均 12.6 个观测。F(6, 75) = 4.03,p = 0.0015:模型整体显著,说明解释变量联合对企业价值有统计意义。R-squared(within)= 0.2437:企业内部变异解释力为 24.4%,相比随机效应模型要低,说明在控制了个体固定效应后,模型主要解释的是个体内部变动。rho = 0.9487:约 94.9% 的总方差归因于个体固定效应,说明固定效应模型是合适的。
结论:固定效应模型控制了企业间的不可观测差异,更适合用于评估企业自身特征变化对企业价值的影响。在该模型下,ln1_fusion(实数融合)首次表现出显著正向影响,p=0.001,表明企业融合水平提升会显著增加企业价值。同时,firm_age 也成为一个显著解释变量,说明企业的成熟程度对其价值有积极作用。其余变量如 Q、growth、profit_margin 等在控制个体效应后均不显著,说明其影响可能更多体现在企业间,而非企业内部变化。
(6)随机效应模型(RE)
xtreg enterprise_value ln1_fusion Q firm_age growth profit_margin liabilities_assets, re
输出结果:

(7) Hausman 检验:比较 FE 和 RE
xtreg enterprise_value ln1_fusion Q firm_age growth profit_margin liabilities_assets, fe
estimates store fe_model
xtreg enterprise_value ln1_fusion Q firm_age growth profit_margin liabilities_assets, re
estimates store re_model
suest fe_model re_model
hausman fe_model re_model, sigmamore
输出结果:

Hausman 检验(固定效应 vs 随机效应模型) 的输出,目的是判断你在分析中应该使用固定效应(FE)还是随机效应(RE)模型。Hausman 检验核心解释:假设(H₀):RE 是一致且有效的,FE 与 RE 无显著差异。备择假设(H₁):RE 不一致,FE 更合适,说明个体效应与解释变量相关,应该用 FE。
结果分析:chi²(6) = 73.32,p = 0.0000,拒绝原假设 H₀,说明 FE 和 RE 模型的系数存在系统性差异,应选择固定效应模型(FE)。固定效应模型是你当前研究中最稳健的选择,特别是当你关注企业自身特征(如融合程度)变化对企业价值的影响。此结果也佐证了你在 FE 模型中发现的:ln1_fusion 对企业价值具有显著正向影响 是可信且稳健的。
(8)研究固定效应回归并绘制模型相关图像,包括残差诊断图、边际效应图
predict fitted_fe, xb
predict residual_fe, resid
twoway (scatter residual_fe fitted_fe),
yline(0, lpattern(dash))
title("残差 vs 拟合值图(固定效应模型)")
xtitle("预测值") ytitle("残差")
#绘制边际效应图
margins, at(ln1_fusion=(0.5(0.2)3))
marginsplot,
title("ln1_fusion 对企业价值的边际效应(FE 模型)")
ytitle("企业价值预测")
xtitle("ln1_fusion")
noci
输出结果:

结果分析:残差整体分布在 0 上下,较为对称,表明模型在整体上没有系统性低估或高估企业价值。残差在拟合值较低区域(如 < 24)较集中,拟合值较高区域(> 24)则更分散,模型在高价值企业上拟合效果变差,误差波动更大。无明显抛物线或系统曲线趋势,表明 线性关系假设基本成立,即解释变量与企业价值之间没有强非线性模式被遗漏。

结果分析:横轴(X 轴):ln1_fusion 的值,表示企业实数融合程度的对数值,从 0.5 到约 2.9 不等。纵轴(Y 轴):模型预测的企业价值(enterprise_value)线性拟合值。点 + 竖线:点表示给定 ln1_fusion 值时的预测企业价值。竖线表示该预测值的 95% 置信区间(CI),反映不确定性。
随着 ln1_fusion 增加,预测的 enterprise_value 也稳步上升,显示出较强的正向影响。与固定效应模型中 ln1_fusion 显著正系数的结论一致。置信区间未交叉水平线,虽然 CI 有一定宽度,但大部分点的区间不重叠,说明该趋势具有统计意义和稳健性。边际效应稳定,没有出现边际递减或非线性迹象,支持使用线性形式建模 ln1_fusion 的合理性。说明实数融合对企业价值具有稳定、显著、正向的边际效应,并且其经济意义清晰。
需要数据集的家人们可以去百度网盘(永久有效)获取:
链接:https://pan.baidu.com/s/16Pp57kAbC3xAqPylyfQziA?pwd=2138
提取码:2138
更多优质内容持续发布中,请移步主页查看。
若有问题可邮箱联系:1736732074@qq.com
博主的WeChat:TCB1736732074
点赞+关注,下次不迷路!