上市公司股票名称相似度(1990-2025)

1822

上市公司股票名称相似度(1990-2025)

数据简介

股票名称相似度是指通过量化分析不同股票名称之间的文本相似性,评估它们在名称结构、语义、行业关联等方面的接近程度。这种相似性不仅体现在字面拼写(如"腾讯控股"与"腾讯音乐"),还可能涉及行业关键词(如"新能源""科技"等)、地域特征(如"上海""深圳")或企业属性(如"集团""股份")的关联。股票名称相似度具有丰富的科研价值:一、可以对市场异常行为进行监控,通过分析股票名称相似度和股价波动的关系识别市场操纵或非理性投资(2015年匹凸匹改名事件);二、可以判断投资者行为是否存在认知偏差,通过构建名称相似度因子,量化名称对投资者决策的影响;三、可以判断股价是否合理,通过股票名称相似度,可以判断投资者是否因为相似名称而误判了企业的发展趋势。本数据通过使用Levenshtein距离和Jaccard距离来构建上、京、深交易所A股非ST的上市公司股票名称相似度,在计算得到企业与其他所有早于该企业上市且不在同一行业和同一地区的企业之间的Levenshtein和Jaccard距离均值后,通过将均值映射到[0-100]范围内得到每一个企业的股票名称相似系数。

数据来源

数据来源于国泰安金融数据库(CSMAR),由数据皮皮侠团队人工整理,全部内容真实有效。

数据范围

上、京、深交易所A股非ST的上市公司

时间跨度

1990-2025

数据格式

数据格式为Excel形式

数据指标

|------|------|-------------------|---------------|
| 证券代码 | 证券简称 | Levenshtein距离相关系数 | Jaccard距离相关系数 |

数据展示

参考文献

1\]王意德,张兵,于琴.股票名称相似度与股价信息损失效应\[J\].证券市场导报,2025,(02):58-67+79.

相关推荐
那个村的李富贵19 小时前
光影魔术师:CANN加速实时图像风格迁移,让每张照片秒变大师画作
人工智能·aigc·cann
Coder个人博客20 小时前
Linux6.19-ARM64 mm mmu子模块深入分析
大数据·linux·车载系统·系统架构·系统安全·鸿蒙系统
腾讯云开发者21 小时前
“痛点”到“通点”!一份让 AI 真正落地产生真金白银的实战指南
人工智能
CareyWYR21 小时前
每周AI论文速递(260202-260206)
人工智能
hopsky1 天前
大模型生成PPT的技术原理
人工智能
羊群智妍1 天前
2026 AI搜索流量密码:免费GEO监测工具,优化效果看得见
笔记·百度·微信·facebook·新浪微博
禁默1 天前
打通 AI 与信号处理的“任督二脉”:Ascend SIP Boost 加速库深度实战
人工智能·信号处理·cann
心疼你的一切1 天前
昇腾CANN实战落地:从智慧城市到AIGC,解锁五大行业AI应用的算力密码
数据仓库·人工智能·深度学习·aigc·智慧城市·cann
AI绘画哇哒哒1 天前
【干货收藏】深度解析AI Agent框架:设计原理+主流选型+项目实操,一站式学习指南
人工智能·学习·ai·程序员·大模型·产品经理·转行
数据分析能量站1 天前
Clawdbot(现名Moltbot)-现状分析
人工智能