数据挖掘

人大博士的交易之路3 小时前
大数据·数学建模·数据挖掘·数据分析·缠论·道琼斯结构·涨停板
今日行情明日机会——20251201上证指数今天放量收阳线,收盘价站上10日均线,回补了部分缺口位,5日线已拐头向上,总体走势相对较强,12月降息的预期是利好。板块上贵金属、旅游、酒店、消费电子等涨幅居前。
GIS数据转换器7 小时前
人工智能·信息可视化·数据挖掘·数据分析·无人机·旅游
基于GIS的智慧招商引资数据可视化系统在各地争相优化营商环境的今天,招商引资已不再是简单的“政策优惠大比拼”,而是升级为一场数据驱动、精准匹配、可视化决策的智慧竞赛。基于GIS(地理信息系统)的智慧招商引资数据可视化系统,正成为这场竞赛中的“秘密武器”。
Python极客之家7 小时前
python·数据挖掘·毕业设计·课程设计·情感分析
基于数据挖掘的微博情感分析及话题追踪系统摘要:随着社交媒体的普及,微博等平台成为了公众表达意见、宣泄情感的重要场所。海量的用户评论数据中蕴含着极具价值的舆情信息。本文介绍了一个基于Python数据挖掘技术的微博情感分析及话题追踪系统。该系统利用机器学习(XGBoost、随机森林等)和深度学习(MLP)算法对微博评论进行情感倾向判断,并结合Flask Web框架开发了可视化的舆情监控平台,实现了单条文本分析、批量历史记录管理、特定话题的舆情追踪及可视化展示功能。 关键词:情感分析;数据挖掘;NLP;Flask;XGBoost;LSTM;话题追踪
~~李木子~~8 小时前
信息可视化·数据挖掘·数据分析
数据可视化:App Store数据分析:价格、类别与用户评分的深度洞察在移动应用经济蓬勃发展的今天,了解应用市场的价格分布、类别特征以及用户评分模式对于开发者、投资者和市场分析师都具有重要意义。本文基于App Store的6,660个应用数据,通过Python的数据分析工具,深入探索了应用市场的多个维度特征。
ccLianLian8 小时前
人工智能·数据挖掘
数据挖掘·IDC-Reduction即使生成器生成的数据是公平,但这往往是通过移除中介变量来实现的,具体来说: 真实的因果图如下:注意:因果图语言是抽象的,描述上好像是移除了某些边,实际上是生成器之间隐式移除某些边的建模。 例如:性别与教育资源相关,性别生成器和教育资源生成器始终在因果图中,但性别生成器的变化与否已经对教育资源生成器的影响变为0.
Amctwd9 小时前
人工智能·数据挖掘
【数据挖掘】用户行为分析中的应用与模型构建数据挖掘是从大量数据中提取隐含的、先前未知的、有价值的信息和知识的过程。在用户行为分析领域,数据挖掘技术可以帮助企业:
L***一9 小时前
数据挖掘·数据分析
数字化时代中专生职业能力提升路径探析:聚焦数据分析类认证随着产业数字化转型加速推进,编程能力与数据分析素养正成为职场核心竞争力的重要组成部分。对于中等职业教育群体而言,通过系统性技能认证弥补学历差异、拓展职业发展空间具有现实意义。本文基于行业调研与人才需求分析,梳理八项具有较高市场认可度的专业技术认证,重点探讨数据分析领域资质认证体系的价值与应用前景。
修一呀21 小时前
机器学习·数据挖掘·聚类
【企业级对话处理】自动估计说话人数 + 声纹聚类 + ASR 转写(FunASR + ModelScope + ClearVoice)企业语音处理场景中,对话识别是非常关键的能力,尤其是在会议场景、客服通话、机器人交互中:话中断不断 → VAD 句子切分
Christo31 天前
人工智能·算法·机器学习·数据挖掘
ICML-2019《Optimal Transport for structured data with application on graphs》该论文提出了一种新型的最优传输(Optimal Transport, OT)距离,称为 Fused Gromov-Wasserstein(FGW)距离,旨在同时利用图结构信息与节点特征信息,对结构化数据(尤其是图)进行度量学习。
IT·小灰灰1 天前
java·大数据·javascript·人工智能·python·数据挖掘·php
深度解析重排序AI模型:基于硅基流动API调用多语言重排序AI实战指南欢迎来到小灰灰的博客空间!Weclome you!博客主页:IT·小灰灰筑梦官网:筑梦官网爱发电官网:小灰灰的爱发电
Christo31 天前
人工智能·算法·机器学习·数据挖掘·kmeans
AAAI-2013《Spectral Rotation versus K-Means in Spectral Clustering》论文的核心思想是针对谱聚类(spectral clustering)算法中从松弛连续谱向量到离散簇标签的转换过程提出改进。传统谱聚类(如Normalized Cut或Ratio Cut)通常使用K-Means算法对谱向量进行聚类,以获得最终簇分配。然而,这种方法可能导致连续解偏离真实的离散解,从而影响图割目标函数的值和聚类准确率。论文引入“谱旋转”(spectral rotation)技术,通过在谱向量上施加正交旋转矩阵,使旋转后的向量更接近离散簇指示矩阵,从而更好地优化图割目标函数,并提升聚类性能。核心
a***59261 天前
爬虫·数据挖掘·数据分析
爬虫基础之爬取某基金网站+数据分析声明: 本案例仅供学习参考使用,任何不法的活动均与本作者无关网站:天天基金网(1234567.com.cn) --首批独立基金销售机构-- 东方财富网旗下基金平台!
笨蛋少年派2 天前
hive·数据挖掘·数据分析
跨境电商大数据分析系统案例:③建模、分析与暂时收尾目录实现步骤:1、Hive数仓建模2、执行Hive建表脚本3、业务分析①基础验证脚本②业务分析脚本4、提交到git仓库(对应自己的文件)
用户41429296072392 天前
爬虫·数据挖掘·数据分析
批量商品信息采集工具获取商品详情的完整方案注册淘宝开放平台账号:访问open.taobao.com,完成个人 / 企业认证(企业需营业执照)创建应用:控制台→应用管理→创建应用(选择 "网站应用" 或 "服务器应用"),获取App Key和App Secret(核心凭证)
用户41429296072392 天前
数据挖掘·数据分析·数据可视化
淘宝实时商品API接口:采集竞品商品详情页的价格、SKU 规格、库存数量、卖点文案、图文内容、售后政策(运费、退换货规则)、评价核心标签淘宝商品详情API接口是用来获取淘宝商品详情信息的接口,可以获取到商品的价格、sku规格、商品主图、详情图片、商品视频等。还可以通过评论接口获取商品评论信息。
懒麻蛇2 天前
人工智能·线性代数·矩阵·数据挖掘·回归
从矩阵相关到矩阵回归:曼特尔检验与 MRQAP在表征相似性分析中,我们关心的不是单个被试的数值,而是成对个体之间的相似性:谁更像谁、这种相似性能否由行为或协变量解释,以及这种关系在统计上是否稳健。曼特尔检验(Mantel test)与其进阶版 MRQAP 提供了两条互补路径:前者用节点标签同步置换做矩阵相关的显著性检验,后者把问题放进回归框架,在控制协变量的同时检验独立效应;而二元组混合线性模型(dyadic LME)则进一步用显式层级建模刻画“同一被试出现在多条边上”的依赖结构,提供可解释的效应量与置信区间。本文聚焦前两者的介绍。
一水鉴天2 天前
大数据·分类·数据挖掘
整体设计 定稿 之15 chat分类的专题讨论(codebuddy)本文系统阐述了基于Chat工具的三层问题处理框架(理解/消化/转化)及其分类机制。核心观点包括:文中详细说明了问题处理流程、架构对应关系和表述系统的运作机制,体现了认知处理与系统设计的统一性。
江上月5133 天前
数据挖掘·数据分析·pandas
Pandas 高级教程:解锁数据分析的强大潜能在数据科学和分析领域,Pandas 是一个不可或缺的强大工具库。它提供了易于使用的数据结构(如 Series 和 DataFrame)和数据分析工具,使得处理和分析结构化数据变得高效而简单。对于已经掌握了 Pandas 基础知识的用户来说,深入学习其高级功能可以极大地提升数据处理的效率和深度。
wasp5203 天前
数据挖掘·apache·hudi·数据湖仓
Apache Hudi 项目总体分析请关注微信公众号:阿呆-botApache Hudi 采用多模块 Maven 架构,主要模块如下:入口类:
deng12043 天前
人工智能·分类·数据挖掘
基于LeNet-5的图像分类小结进行数据预处理:以下是我自己的理解:这段代码将FashionMINIST数据集的训练集的中图像转化为Pytorch之中的张量,然后按照8:2的比例划分出训练集和验证集,最后分别定义训练集和验证集的数据加载器,一个迭代为32张图片,打乱顺序,由两个进程同时处理数据。