数据分析

sensen_kiss5 小时前
大数据·数据挖掘·数据分析
INT303 Big Data Analysis 大数据分析 Pt.12 推荐系统(Recommendation Systems)推荐系统是在大量 items(商品/内容) 中,给用户推荐可能感兴趣的东西。 互联网的出现让信息传播成本几乎为0,这解决了过去资源稀缺的问题,但是带来了信息过剩,导致Long Tail(长尾效应)。 长尾效应指的是少数热门内容(头部)大量冷门内容(长尾),而长尾加起来的价值非常大。而Amazon、Netflix 能靠卖“冷门但很多”的东西赚钱 因此选择越多,因此就越需要推荐引擎来做过滤。 或者说推荐系统是在用户没有明确搜索时,主动从海量内容中筛选并推送“可能感兴趣的东西”。
wang_yb5 小时前
数据分析·databook
当条形图遇上极坐标:径向与圆形条形图的视觉革命想象一下,你正站在一个圆形广场的中心,周围均匀排列着12根高度不同的灯柱,这就是径向条形图带给我们的视觉体验。
databook6 小时前
python·数据分析·数据可视化
当条形图遇上极坐标:径向与圆形条形图的视觉革命想象一下,你正站在一个圆形广场的中心,周围均匀排列着12根高度不同的灯柱,这就是径向条形图带给我们的视觉体验。
电商API_1800790524710 小时前
大数据·数据库·人工智能·数据分析·网络爬虫
批量获取电商商品数据的主流技术方法全解析在电商行业数字化转型的浪潮中,商品数据是驱动选品决策、价格监控、竞品分析和供应链优化的核心资产。批量获取电商商品数据的能力,直接决定了企业运营决策的效率与精准度。本文将系统梳理当前主流的批量数据获取技术方法,从实现原理、操作要点出发,深入分析各方法的优缺点与适用场景,为技术选型提供全面参考。
tracy_an15 小时前
数据分析
2026/1/13 类 参数引用问题针对昨天的疑惑,做一下以下学习笔记==原问题:====这两种写法在功能上是不同的,详细区别:==特点:允许用户在创建实例时传入自定义的权限列表
数据大魔方17 小时前
python·算法·数据挖掘·数据分析·github·程序员创富·期货程序化
【期货量化进阶】期货Tick数据分析与应用:高频数据入门(TqSdk完整教程)Tick数据是期货市场最精细的数据,记录了每一笔成交的价格、数量和时间。相比K线数据,Tick数据能够揭示更多市场微观结构信息,是高频交易和精细化分析的基础。
YangYang9YangYan17 小时前
数据挖掘·数据分析
2026中专财务专业学数据分析指南数据分析在财务领域的应用已从大型企业下沉至中小型企业,财务决策逐渐依赖数据驱动。自动化报表、风险预测、成本优化等场景均需数据分析支持。2026年财务行业可能进一步融合AI技术,如智能审计、实时预算分析,企业对具备基础数据分析能力的财务人员需求将显著增长。
叫我:松哥18 小时前
人工智能·python·信息可视化·数据分析·flask·bootstrap·echarts
基于Flask+ECharts+Bootstrap构建的微博智能数据分析大屏微博数据洞察可视化平台是基于Flask+ECharts+Bootstrap构建的智能数据分析大屏,旨在为运营人员、市场分析师和决策者提供微博博文数据的全方位可视化洞察。平台采用暗色科技风设计,融合渐变色彩与动态交互效果,通过情感分析、趋势分析、时空分布、内容洞察和KOL分析五大核心模块,实现对微博数据的深度挖掘与价值提取。平台支持实时数据更新、多维数据联动展示,帮助用户快速把握舆情动态、用户行为特征和热点话题趋势,为内容运营、用户增长和商业决策提供数据支撑。
青春不败 177-3266-052019 小时前
人工智能·数据挖掘·数据分析·医学
AI支持下的临床医学日常工作、论文撰写、数据分析与可视化、机器学习建模中的实践应用为了帮助广大临床医学相关的医院管理人员、医生、学生、科研人员更加熟练地掌握ChatGPT-4o在临床医学日常生活、工作与学习、课题申报、论文选题、实验方案设计、实验数据统计分析与可视化等方面的强大功能,同时更加系统地学习人工智能(包括传统机器学习、深度学习等)的基础理论知识,以及具体的代码实现方法。
小湘西19 小时前
数据仓库·数据分析
数仓分层架构详解:ODS、DWD、DWS核心定位:核心功能:数据缓冲:数据标准化:数据保留:技术实现:核心定位:核心功能:数据清洗:维度退化:
Watermelo61719 小时前
数据结构·人工智能·语言模型·自然语言处理·数据挖掘·数据分析·json
探究TOON的价值边界:比JSON更优的大模型友好数据格式?目录探究TOON的价值边界:比JSON更优的大模型友好数据格式?一、TOON 的适用边界1、哪些情况不适用 TOON?
德彪稳坐倒骑驴20 小时前
hive·hadoop·数据分析
Hive电商数据分析项目 过程记录mysql_to_hdfs.sh注意:这里sqoop数据迁移 连接的MySQL地址 要仔细比照,不要用老师原有的那个ip,否则就会出现连接被拒绝访问,出现同步半天hdfs那边什么都没有的情况。要用集群主机的那个ip
红队it20 小时前
大数据·hadoop·分布式·算法·游戏·数据分析·spark
【Spark+Hadoop】基于spark+hadoop游戏评论数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅目录一、项目背景细化二、研究目的细化三、创新点技术实现四、技术介绍SparkHadoopHiveMySQL
大闲在人20 小时前
数据分析
3. 需求随机变量的聚合与分解及变异系数在供应链管理中,需求是一个随机变量,会对应某一特定时间尺度,例如月度或周度。但在实际应用时,需要将其转换为其他时间尺度,比如日度或季度。这就需要对需求这个随机变量进行聚合或分解操作。
CryptoPP20 小时前
金融·数据挖掘·数据分析·区块链
对接API库 获取印度股票历史数据印度作为全球增长最快的主要经济体之一,其金融市场吸引了众多国际投资者的目光。印度股市采用双交易所体系,包括国家证券交易所(NSE)和孟买证券交易所(BSE),其中NSE占全国交易量的90%以上,Nifty 50指数是其核心基准,而BSE是亚洲最古老的交易所,Sensex 30指数代表传统企业。
rgb2gray21 小时前
大数据·人工智能·机器学习·语言模型·自然语言处理·数据分析·可解释
论文深度解析:基于大语言模型的城市公园多维度感知解码与公平性提升原文:Beyond sentiment: Using large language models to decode multidimensional urban park perceptions for enhanced equality
少林码僧1 天前
人工智能·ai·数据分析·大模型
2.9 字段分箱技术详解:连续变量离散化,提升模型效果的关键步骤分箱是将连续变量离散化的过程,是特征工程中的关键步骤。好的分箱可以提升模型效果,增强模型稳定性。本文将详细介绍各种分箱方法,并提供完整的实现代码。
SelectDB1 天前
数据库·数据分析·apache
从 Greenplum 到 Doris:集群缩减 2/3、年省数百万,度小满构建超大规模数据分析平台经验本文整理自度小满 Doris 数据库负责人汤斯在 Doris Summit 2025 中的演讲,并以演讲者第一视角进行叙述。
沐墨染2 天前
前端·javascript·vue.js·ui·数据挖掘·数据分析
敏感词智能检索前端组件设计:树形组织过滤与多维数据分析在内容安全监管、情报分析等专业领域,敏感词的智能检索与可视化分析是核心需求。本文详细解析一个集成了树形组织架构过滤、多维度智能检索和实时数据交互的敏感词分析系统前端实现,展示如何构建高效、直观的数据分析界面。
YangYang9YangYan2 天前
数据挖掘·数据分析
2026大专计算机专业学数据分析的实用性与前景分析全球数据量持续增长,企业对数据分析人才的需求旺盛。金融、电商、医疗、智能制造等行业依赖数据分析优化决策。国内政策支持大数据产业发展,如“十四五”数字经济发展规划明确数据要素价值。