2007-2024年 上市公司-投资者情绪数据(xlsx)

01、数据简介 2007-2024年上市公司-投资者情绪数据(xlsx)资源-CSDN下载https://download.csdn.net/download/2401_84585615/92636898

依据任晓松、孙莎、马茜(2024)所提出的方法体系,投资者情绪指标构建遵循系统化流程:

其一,数据获取。定向采集 2007 至 2024 年财经网络社区(涵盖股票主题贴吧及行业论坛)发布的所有股票相关帖子,提取发帖人标识、发布时间、标题文本、阅读量等结构化信息。

其二,文本预处理。对采集的原始文本开展净化操作:先过滤无效与重复内容,接着用 jieba 分词工具进行中文分词,剔除通用及领域特定停用词,最后借助 TF - IDF 算法把文本数据转化为机器可识别的数值向量。

其三,情感分类与日度情绪计算。运用朴素贝叶斯分类模型将帖子划分为乐观、中性、悲观三类情感倾向。针对上市企业 i,依据第 n 日乐观帖子数(posi,n​)与悲观帖子数(negi,n​),通过公式 smi,n​​=ln(1+negi,n​1+posi,n​​)构建情绪因子,加 1 平滑保障数值稳定,对数变换实现数据分布规范。

其四,年度情绪指标构建。以自然年为观测周期,对周期内所有交易日的情绪因子 smi,n​​进行算术平均,得到衡量企业 i 在第 t 年投资者情绪水平的综合指标 senti,t​,有效捕捉市场参与者中长期情感特征。该指标体系整合网络文本大数据与机器学习技术,为量化分析投资者心理偏差对资本市场影响提供可操作测量工具。

02、相关数据

包含股票代码、年份、s_in、sent_(i,t) 。

相关推荐
AI英德西牛仔14 小时前
Claude 导出 pdf 颜色不一样怎么办,选用 AI 导出鸭优化格式转换,多维度落地修正 PDF 色彩失真问题
javascript·人工智能·ai·chatgpt·pdf·deepseek·ai导出鸭
2301_8185277814 小时前
冲锋衣达人营销——AI精准匹配高效转化
人工智能
TFHoney14 小时前
当 AI 真正走进你的终端:Claude Code 使用指南
java·人工智能·ai编程
zhangfeng113314 小时前
光驱动的 AI 算力卡,也就是光子计算(Photonic Computing)芯片,用光子(光)代替电子来做矩阵乘法和数据传输
人工智能·语言模型·矩阵·架构·transformer·芯片
扫地僧98515 小时前
Tyche :医学图像分割中的随机上下文学习
人工智能·机器学习·计算机视觉
查拉图斯特拉面条15 小时前
Git操作指南:克隆、提交、推送与避坑大全
大数据·git·elasticsearch
Marst Code15 小时前
[特殊字符] 五大 Workflow 模式详解
人工智能·python
searchforAI15 小时前
长视频和播客怎么变成结构化读书笔记?一套 AI 时代的知识管理方法
人工智能·笔记·gpt·音视频·语音识别
互联网科技看点15 小时前
亿达科创深圳新址启用 锚定湾区打造数字服务新标杆
人工智能
ZFSS15 小时前
VS Code + Serp MCP:让 Copilot 实时上网查询
人工智能·ai·ai作画·copilot·ai编程·ai写作