技术栈
ddia
言之。
17 天前
ddia
【DDIA】最后一章:数据系统的未来
本章聚焦数据系统的未来发展方向,探讨如何通过组合工具、分拆功能、优化数据流等方式,构建更可靠、可扩展、可维护的系统。核心主旨包括:分析数据集成的挑战与解决方案,提出分拆数据库的架构思想,讨论正确性保障的新方法,以及反思技术发展的伦理影响。通过融合批处理与流处理、松散耦合组件等思路,为复杂应用场景提供灵活高效的设计范式。
言之。
19 天前
ddia
【DDIA】第十章:解析Reduce端连接与分组技术
在批处理中,连接操作的核心目标是将分散在不同数据集中的关联记录高效聚合到一起。以用户活动日志(含用户ID)和用户档案数据库(含用户详细信息)为例,需要通过用户ID将两者关联,从而支持按用户属性(如年龄)分析行为数据。
言之。
25 天前
ddia
【DDIA】第三部分:衍生数据
本章节是《设计数据密集型应用》的第三部分,聚焦于多数据系统集成问题。前两部分探讨了分布式数据库的基础内容,但假设应用仅用一种数据库,而现实中大型应用常需组合多种数据组件。本部分旨在研究不同数据系统集成时的问题,帮助理解复杂架构中的数据流和系统依赖。
gongyuandaye
1 年前
笔记
·
分布式
·
ddia
《数据密集型应用系统设计》笔记——第二部分 分布式数据系统(ch5-9)
todo
我是有底线的