数据密集型应用系统设计--其一

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录


前言

作者水平有限,一切以作者的理解为主


一、twitter经典例子

峰值是12K QPS,作者讲述了两种方式,第一种是关系型数据库,我们叫他web模式;第二种是数据流,我们叫他大数据模式。web模式的好处是在用户刷新时才加载新的帖子,如果用户不访问就可以省下一次资源,大数据模式是实时推送缓存,不管用户刷新不刷新都是一次或多次缓存写入,也不太能保证顺序性。作者引出,如果粉丝量大或者只是达到平均75,写入压力都会比较大,不能解决大量粉丝的问题,对于这个twitter的办法是退回方法一,可能是加载一个窗口的排序好的数据。我其实有一个疑问,作者感觉一直在介绍大数据系统的好处,我不太了解其用意,后来我猜测,猜错了,想了一些没用的。

示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。

二、使用步骤


总结

相关推荐
风吹夏回13 天前
RabbitMQ 核心术语 + Python pika 方法完整讲解
分布式·python·rabbitmq
风吹夏回13 天前
RabbitMQ 三种模式入门:HelloWorld、WorkQueue、PubSub
分布式·rabbitmq·ruby
霸道流氓气质13 天前
分布式追踪与 RequestId 传播完全指南
分布式
cheems952714 天前
[RabbitMQ高级特性] 消息确认机制:从 Ready / Unacked 到 basicAck、basicReject、basicNack 的底层拆解
分布式·rabbitmq·ruby
枫华落尽14 天前
【Hadoop01-完全分布式运行模式】
分布式
隔壁阿布都14 天前
ShedLock 分布式定时任务锁框架介绍
spring boot·分布式
文艺倾年14 天前
【强化学习】数学推导专题,20W字总结(十五)
人工智能·分布式·大模型·强化学习·vibecoding
ACP广源盛1392462567314 天前
GSV9001S@ACP#1080P 级视频处理芯片,物理 AI 普及终端的高性价比选择
大数据·人工智能·分布式·嵌入式硬件·spark
guslegend14 天前
第1章:初始Kafka
分布式·kafka
ACP广源盛1392462567314 天前
GSV5600@ACP#多接口协议转换芯片,物理 AI 便携终端的互联核心
大数据·人工智能·分布式·嵌入式硬件·spark