【算法分析与设计】第48篇:流算法与数据概要技术想象你负责监控一个国家骨干网络的路由器流量。每秒有数百万个数据包经过,你想知道哪些源IP地址占据了超过1%的总流量,以便检测DDoS攻击。存储每个IP地址的精确计数需要为每个出现过的IP维护一个计数器——在IPv6地址空间下,这需要天文数字的内存。更困难的是,数据以线速率到达,你无法暂停流量来整理数据结构。这就是流模型面对的场景:输入是一个序列 a1,a2,…,ama1,a2,…,am,来自一个大小为 nn 的全集,nn 可能极大(如 21282128),而算法只能使用远小于 nn 甚至远小于 mm 的空