企业数字化转型的测度难题:基于大语言模型的新方法与新发现

《经济研究》新文章《企业数字化转型的测度难题:基于大语言模型的新方法与新发现》运用机器学习和大语言模型构造一套新的企业数字化转型指标。理论分析和数据交叉验证均表明,构建的指标相对已有方法更准确:

1.第一步:选择"管理层讨论与分析"和"目录、释义及重大风险提示"这两个章节作为文本数据

2.第二步:构建待预测句库和待标记句库。先将全部文本按照句号和分号分割,得到待预测句库。使用关键词抽取具有不同代表性的年报句子,并与随机抽取的句子一起构成待标记句库。其次,定义数字技术,并构建数字技术词典。综合政策口径、企业界的定义,将数字技术分为六种类型:大数据、人工智能、移动互联、云计算、物联网和区块链

3.第三步:对待标记句库的句子进行人工标注。先判断企业使用了哪种/哪几种数字技术,进而判断企业是否进行了数字化转型。

4.第四步:采用有监督的机器学习方法训练模型。使用百度开源的、内嵌ERNIE的PaddleHub框架来开展模型训练,用其内置的tokenizer函数快速将句子转为ERNIE模型训练所需要的格式。将全部被标记的句子按照8∶1∶1的比例分为训练集、测试集和验证集。同时为了比较不同模型之间的分类性能,基于PaddleHub框架训练了BERT_base_Chinese,同时基于sklearn框架训练了SVM(支持向量机)、NeuralNetworks(神经网络)、SVM与NeuralNetworks结合的Voting算法、KNN(K近邻)以及GaussianNB(朴素贝叶斯)共七类常见模型。

5.第五步:采用ERNIE模型构造数字化转型指标基于ERNIE大语言模型,对2006---2020年待预测句库中的每一句文本进行预测,判断企业是否以及使用何种数字技术,构造了企业数字化转型哑变量。

在此基础上,文章实证检验企业数字化转型对财务绩效的影响。研究发现:第一,企业数字化转型能够显著提高财务绩效,其中,大数据、人工智能、移动互联、云计算和物联网均有明显作用,但区块链并没有明显的作用;第二,只有在财务绩效较差的企业中,数字化转型才能够显著提高财务绩效;第三,企业数字化转型提高财务绩效的主要渠道包括改善效率和降低成本。

相关推荐
万事可爱^36 分钟前
HDBSCAN:密度自适应的层次聚类算法解析与实践
算法·机器学习·数据挖掘·聚类·hdbscan
牧歌悠悠2 小时前
【深度学习】Unet的基础介绍
人工智能·深度学习·u-net
坚毅不拔的柠檬柠檬2 小时前
AI革命下的多元生态:DeepSeek、ChatGPT、XAI、文心一言与通义千问的行业渗透与场景重构
人工智能·chatgpt·文心一言
坚毅不拔的柠檬柠檬2 小时前
2025:人工智能重构人类文明的新纪元
人工智能·重构
jixunwulian2 小时前
DeepSeek赋能AI边缘计算网关,开启智能新时代!
人工智能·边缘计算
Archie_IT2 小时前
DeepSeek R1/V3满血版——在线体验与API调用
人工智能·深度学习·ai·自然语言处理
失败尽常态5232 小时前
用Python实现Excel数据同步到飞书文档
python·excel·飞书
2501_904447742 小时前
OPPO发布新型折叠屏手机 起售价8999
python·智能手机·django·virtualenv·pygame
青龙小码农2 小时前
yum报错:bash: /usr/bin/yum: /usr/bin/python: 坏的解释器:没有那个文件或目录
开发语言·python·bash·liunx
大数据追光猿3 小时前
Python应用算法之贪心算法理解和实践
大数据·开发语言·人工智能·python·深度学习·算法·贪心算法