分享Fork/Join经典案例

shigen坚持更新文章的博客写手,擅长Java、python、vue、shell等编程语言和各种应用程序、脚本的开发。记录成长,分享认知,留住感动。 个人IP:shigen

在上一篇的文章java 多线程+分治求和,太牛了的文章中,提到了forkjoin,在一番了解之后,发现这个forkjoin基本上和线程池差不多

Fork/Join框架的核心思想是将大任务拆分成若干个小任务(Fork),然后并行执行这些小任务,最后将它们的结果合并(Join)。这样可以充分利用多核处理器的性能,提高任务的执行效率。

在一些论坛上网友也回复:大数据的认识这个。也是啊,没准吊打我的面试官就是搞大数据的呢。正常的Java开发,哪来的这么多需要运算的任务,大部分都是IO型的任务,参考文章Excel导入导出百万级数据优化

写了一点代码测试了一下效果,选用的还是经典的大序列求和案例:

java 复制代码
 public class SumCalculator extends RecursiveTask<Long> {
 ​
     private static final long serialVersionUID = 1L;
     // 阈值,超过这个值则拆分任务
     private static final long THRESHOLD = 10000;
     private final long start;
     private final long end;
 ​
     public SumCalculator(long start, long end) {
         this.start = start;
         this.end = end;
     }
 ​
     @Override
     protected Long compute() {
         long length = end - start;
         if (length <= THRESHOLD) {
             return computeSequentially();
         }
         long middle = (start + end) >>> 1;
         SumCalculator leftTask = new SumCalculator(start, middle);
         SumCalculator rightTask = new SumCalculator(middle + 1, end);
         // 拆分左边任务
         leftTask.fork();
         // 拆分右边任务
         rightTask.fork();
         // 合并并返回结果
         return leftTask.join() + rightTask.join();
     }
 ​
     private long computeSequentially() {
         long sum = 0;
         for (long i = start; i <= end; i++) {
             sum += i;
         }
         return sum;
     }
 ​
     public static void main(String[] args) {
         long start = 1;
         long end = 1_0000_0000;
         StopWatch stopWatch = new StopWatch();
         stopWatch.start();
         ForkJoinPool forkJoinPool = new ForkJoinPool();
         long result = forkJoinPool.invoke(new SumCalculator(start, end));
         stopWatch.stop();
         System.out.println("Sum of " + start + " to " + end + " = " + result);
         System.out.println("Elapsed time: " + stopWatch.getTotalTimeMillis() + " ms");
     }
 }

运行时间我们来对比一下:

普通线程池:

多次运行后发现:时间在100ms-300ms之间波动。

总的来说,fork/join的效率至少要比普通线程池提交任务运行耗时减少50%左右。

最后,借助魔法和个人理解,来一波总结:

Fork/Join适用场景:

  1. 递归任务:Fork/Join框架特别适用于递归式的任务,例如归并排序、快速排序、求和等。
  2. 任务可以被拆分成独立子任务:任务之间不存在依赖关系,可以独立执行,这样才能充分发挥并行执行的优势。
  3. 任务执行时间较长:如果任务执行时间过短,切分和合并的开销可能会超过执行时间,得不偿失。

注意事项:

  1. 合适的任务粒度:需要根据具体情况确定合适的任务拆分粒度,避免任务过小导致拆分和合并的开销过大。
  2. 避免共享可变状态:并行执行的任务之间应避免共享可变状态,如果必须共享状态,需要采用线程安全的方式进行处理。
  3. 避免死锁和性能问题:在使用Fork/Join框架时,要注意避免死锁和性能问题,合理设计任务拆分和合并的逻辑。
  4. 使用合适的线程池 :Fork/Join框架底层使用了工作窃取(Work Stealing)算法,因此可以使用默认的ForkJoinPool,也可以根据需要创建自定义的线程池。

总的来说,Fork/Join框架适用于需要并行执行递归式任务且任务之间不存在太多依赖关系的情况,能够充分利用多核处理器的性能,提高任务的执行效率。

好了,底层原理还是比较复杂,推荐观看视频:6.8 并发编程之ForkJoin工作原理分析。搞不明白,在这里就不深入分析底层原理了。

*与shigen一起,每天不一样!

相关推荐
IT_陈寒12 分钟前
SpringBoot 3.x实战:5个高效开发技巧让我减少了40%重复代码
前端·人工智能·后端
悟空码字31 分钟前
三步搞定短信验证码!SpringBoot集成阿里云短信实战
java·spring boot·后端
嘉然今天吃粑粑柑34 分钟前
Kafka vs RabbitMQ:从消费模型到使用场景的一次讲清
后端
肥肥今天也好看35 分钟前
Java 日期格式化陷阱:YYYY vs yyyy 导致的生产事故分析
后端
用户9483570165136 分钟前
可观测性落地:如何在 Java 项目中统一埋点 Trace ID?(一)
后端
天天摸鱼的java工程师36 分钟前
volatile 关键字底层原理:为什么它不能保证原子性?
java·后端
leikooo37 分钟前
SpringAI 多轮对话报错 400 Bad Request
后端·ai编程
小杨同学4939 分钟前
C 语言实战:堆内存存储字符串 + 多种递归方案计算字符串长度
数据库·后端·算法
golang学习记39 分钟前
Go 中防止敏感数据意外泄露的几种姿势
后端
czlczl2002092541 分钟前
Spring Boot 构建 SaaS 多租户架构
spring boot·后端·架构