数据分析 学习笔记 索引

随着互联网应用的广泛发展和数据规模的不断增长,传统的数据处理方法已经无法满足对海量数据的存储、处理和分析需求,因此出现了大数据技术栈。大数据技术栈是指用于存储、处理和分析大规模数据的一系列工具、框架和平台。它可以帮助我们从海量的数据中提取有价值的信息,支持业务决策和创新发展。

Google的三篇论文 GFS(2003),MapReduce(2004),Bigtable(2006)为大数据技术奠定了理论基础。随后,基于这三篇论文的开源实现Hadoop被各个互联网公司广泛使用。在此过程中,无数互联网工程师基于自己的实践,不断完善和丰富Hadoop技术生态。经过十几年的发展,如今的大数据技术生态已相对成熟,围绕大数据应用搭建的平台架构和技术选型也逐渐趋向统一。

下图是大致的技术栈结构图

数据分析技术栈和架构设计

Hadoop 学习笔记

相关推荐
鸿乃江边鸟1 小时前
Starrocks的主键表涉及到的MOR Delete+Insert更新策略
大数据·starrocks·sql
maozexijr2 小时前
Flink 的任务槽和槽共享
大数据·flink
问道飞鱼3 小时前
【大数据知识】今天聊聊Clickhouse部署方案
大数据·clickhouse·部署
金融小师妹6 小时前
应用BERT-GCN跨模态情绪分析:贸易缓和与金价波动的AI归因
大数据·人工智能·算法
武子康6 小时前
大语言模型 10 - 从0开始训练GPT 0.25B参数量 补充知识之模型架构 MoE、ReLU、FFN、MixFFN
大数据·人工智能·gpt·ai·语言模型·自然语言处理
睎zyl10 小时前
Spark自定义分区器-基础
大数据·分布式·spark
巨龙之路10 小时前
【TDengine源码阅读】DLL_EXPORT
大数据·时序数据库·tdengine
元63311 小时前
搭建spark-local模式
大数据·spark
巨龙之路11 小时前
TDengine编译成功后的bin目录下的文件的作用
大数据·时序数据库·tdengine
莫叫石榴姐12 小时前
大模型在数据分析领域的研究综述
大数据·数据挖掘·数据分析