big data

半部论语3 天前
数据仓库·big data
StarRocks vs Doris:深度剖析与选型分析在大数据技术蓬勃发展的当下,企业对于高效的数据分析工具的需求日益增长。StarRocks 和 Doris 作为两款优秀的 MPP(大规模并行处理)数据库,在数据仓库和数据分析领域备受关注。本文将从多个维度对 StarRocks 和 Doris 进行深度剖析,旨在为企业技术选型提供全面、客观的参考依据。
晴天彩虹雨6 天前
数据仓库·hive·hadoop·sql·big data
Hive & Presto SQL 查询优化指南在大数据处理领域,Hive 和 Presto 是两种常见的 SQL 查询引擎,分别适用于批量处理(Hive)和交互式查询(Presto)。然而,在使用它们时,SQL 查询可能会遇到性能瓶颈,例如查询慢、资源消耗高等问题。本文将介绍 Hive 和 Presto 查询的常见问题,并提供优化方案。
不羁的fang少年20 天前
大数据·elasticsearch·big data
elasticsearch学习Elasticsearch:分布式,RESTful风格的搜索和分析。REST:资源状态转换,路径是对资源的定位,方法是对资源的操作。GET,POST,PUT,DELETE,HEAD,get和head无论对资源操作多少次都不会改变资源的状态(都是对资源的获取,不同在于head返回体没有内容)。 get,put,delete,head都是幂等性的。
Ray.19981 个月前
hive·flink·spark·kafka·big data
Flink 中的滚动策略(Rolling Policy)在 Apache Flink 中,滚动策略(Rolling Policy)是针对日志(或数据流)文件输出的一种管理策略,它决定了在日志文件的大小、时间或其他条件满足特定标准时,如何“滚动”生成新的日志文件。滚动策略常用于处理较大的数据流文件,避免单个文件过大导致存储和处理困难。
伊克罗德信息科技1 个月前
big data
以 Serverless 低成本的⽅式 快速在亚马逊云科技上部署 DeepSeek2025年春节,最令人瞩目的无疑是DeepSeek的惊艳亮相,它以颠覆性的创新迅速席卷全球,成为街谈巷议的热点。无论是在地铁车厢里,还是公司茶水间,DeepSeek都成了人们津津乐道的话题。社交平台上,网友们争相分享与DeepSeek的“互动瞬间”,从探讨未来科技趋势到交流生活小窍门,仿佛一切问题都能通过DeepSeek找到答案。
胡耀超1 个月前
大数据·数据治理·big data·数据中台
数据中台是什么?:架构演进、业务整合、方向演进在数字化转型的大背景下,企业面临数据孤岛、信息冗余与决策滞后的问题。数据中台作为整合企业数据资产、支持业务协同与敏捷决策的全新架构理念,逐渐受到业内广泛关注。本文旨在系统性地探讨数据中台的来龙去脉,从概念定义、架构要素到业务场景,全面剖析其价值与挑战,并提供企业实践中的前瞻性建议。
灰灰老师2 个月前
机器学习·ai·数据分析·big data·rapidminer
数据分析系列--④RapidMiner进行关联分析(案例)一、核心概念1.1项集(Itemset)1.2规则(Rule)1.3支持度(Support)1.3.1 支持度的定义
牛十二2 个月前
中间件·金融·big data·etl·devops
在 Ubuntu22.04 上安装 SplunkELK感觉太麻烦了,换个日志收集工具Splunk 是一种 IT 工具,可帮助在任何设备上收集日志、分析、可视化、审计和创建报告。简单来说,它将“机器生成的数据转换为人类可读的数据”。它支持从虚拟机、网络设备、防火墙、基于 Unix 和基于 Windows 的设备读取大部分输出格式。
wumingxiaoyao2 个月前
大数据·flink·big data·分布式流处理·实时流处理
Flink 应用《Big Data 流处理框架 Flink》有介绍开源的分布式流处理框架 Apache Flink 基本特点。Flink 应用是指使用 Apache Flink 编写并运行的数据处理程序,Flink 应用主要用于处理大规模的数据流,执行复杂的数据转换、聚合和分析任务。
杨超越luckly2 个月前
前端·数据挖掘·数据分析·html·big data
HTML应用指南:利用GET请求获取星巴克门店数据本篇文章,我们将探究GET请求的实际应用,我们使用Python的requests库通过GET请求抓取星巴克门店信息。星巴克作为全球知名的咖啡连锁品牌,其门店分布广泛,获取这些门店的信息对于数据分析、市场研究以及商业决策都具有重要意义。我们将以获取全国的星巴克门店为例,详细讲解请求的构建、数据的提取和保存。
光谷梁朝伟2 个月前
大数据·windows·big data
海豚调度DolphinScheduler-3.1.9配置windows本地开发环境源代码下载地址https://dolphinscheduler.apache.org/zh-cn/docs/3.1.9
studying_mmr3 个月前
人工智能·机器学习·big data·data·統計學
Estimator (Statistic for Machine Learning)免費完整版:linkAn estimator is a mathematical rule, function, or formula used to approximate an unknown population parameter (such as the mean, variance, or proportion) based on sample data. In statistical analysis, estimators are essential because they provid
明明跟你说过3 个月前
数据库·mysql·database·big data
MySQL 数据表与索引设计艺术:打造高效数据存取架构🐇明明跟你说过:个人主页🏅个人专栏:《MySQL技术精粹》🏅🔖行路有良友,便是天堂🔖目录一、引言
Data-Miner3 个月前
大数据·big data
经典案例PPT | 大型水果连锁集团新零售数字化建设方案这份PPT文件是一份详尽的大型水果连锁集团新零售数字化建设方案,它涵盖了从总体蓝图规划到一期建设方案,再到实施规划方案的全方位内容。该方案旨在通过构建一个数字化中台,实现集团总部、子公司、业务单元以及零售终端的数字化转型,以提升业务效率和顾客体验。
2301_793139333 个月前
leetcode·microsoft·zookeeper·big data·memcached
光控资本:新能源汽车持续渗透 充电需求将保持快速增长12月10日,据天津港天集团官微音讯,近来,全球首座港口720KW全液冷“超级快充站”在太平洋国际公司试运行。全液冷“超级快充站”为720kW超级快充,具有充电快、智慧化、轻量化的特色,最大可完结1200A的充电电流。
2301_793139333 个月前
microsoft·zookeeper·tensorflow·big data·memcached
光控资本:锂电排产上行 AI手机有望快速渗透AI手机有望快速渗透据赛迪参谋猜想,2024年AI手机的出货量估量将会抵达1.5亿部,占全球智能手机总出货量13%,到2027年,全球AI手机销售量有望跨过5.9亿部,占全球智能手机总出货量的比重跨过50%。
云表平台4 个月前
big data
2024年大热,Access平替升级方案,也适合Excel用户欢迎各位看官,您来了,就对了!您多半是Access忠实粉丝,至少是excel用户,亦或是WPS用户吧。那就对了,今天的分享肯定对您有用。
Yz98764 个月前
大数据·数据仓库·hive·hadoop·数据库开发·big data
Hive的基础函数1)nvl 判断一个数值是否为null,如果为null,给一个默认值2) 函数case when then ....when ...then.. else... end
Yz98764 个月前
大数据·数据仓库·hive·hadoop·sql·数据库架构·big data
Hive的基础函数-日期函数日期转时间戳函数:unix_timestamp()时间戳转日期函数:from_unixtime总而言之