千万数据分组累加排序 _累加

【千万数据分组累加排序】

文章插图
千万级数据包的累积排序千万级数据包的累积排序介绍:有一个有1000万的集合，分组后进行累积，每组有100万个数据，然后进行排序。有没有可以实现的框架？需要秒回，希望用分布式计算框架。有什么办法可以实现吗？解决方案:1000万不算大。也可以用fork/join并行框架实现。如果