数据不是越多越难管?一招“区间合并”竟让数据流处理效率暴涨 数据不是越多越难管?一招“区间合并”竟让数据流处理效率暴涨作者:Echo_Wish很多程序员第一次看到「Data Stream as Disjoint Intervals(将数据流变为多个不相交间隔)」这道题的时候,都会有一种感觉:这不就是维护几个区间吗?结果真正动手写的时候发现:没那么简单。因为它考察的根本不是区间。而是:如何在动态数据流中维护有序结构。如果说数组题是在考你存数据。那么这道题是在考你:如何管理不断变化的数据。而现实世界里,这种需求比我们想象得多得多。比如:实时用户在线编号统计实时订单编号管理实时IP地址分配Redis Bitmap统计日志连续ID压缩存储本质上都是同一个问题:数据不断到来 1 3 7 2 6 ...最终希望得到:[1,3] [6,7]而不是:1 2 3 6