千万数据分组累加排序

【千万数据分组累加排序】

千万数据分组累加排序

文章插图
千万级数据包的累积排序千万级数据包的累积排序介绍:有一个有1000万的集合,分组后进行累积,每组有100万个数据,然后进行排序 。有没有可以实现的框架?需要秒回,希望用分布式计算框架 。有什么办法可以实现吗?解决方案:1000万不算大 。也可以用fork/join并行框架实现 。如果