问题描述
求各位大神帮忙,现在有个程序,大概思想是:我现在有一串数,每个数都有各自影响生成一串新数,然后对这些新数分别计算出一串数据,最后对第二次生成的所有数排序,根据这些排序把第三次生成的数写到文件中,我现在spark流程就是上面说的,请问有什么好的想法可以大大提升速度吗?示例:比如,一开始只有一个数:1(可以有多个数),然后这个数生成一串新数:5,2,6,对5,2,6分别进行计算,比如2,生成数组1.3,4.5;5生成数组5.5,3.7;6生成数组2.3,6.7;然后对5,2,6进行排序,把生成的数写入文件,结果是:1.3,4.5,5.5,3.7,2.3,6.7求大神帮忙~~~
解决方案
时间: 2024-11-01 18:03:10