详解Java8特性之Stream API并行流

来源:互联网 发布:ipad防沉迷软件 编辑:程序博客网 时间:2024/06/11 22:53

在详解Java8特性之Stream API中,我用的例子使用的都是串行流,即单线程执行的,其实Stream API还提供了并行流,即多线程执行操作。

java.util.Collection<E>新添加了两个默认方法

  • default Stream stream() : 返回串行流
  • default Stream parallelStream() : 返回并行流

可以发现,stream()parallelStream()方法返回的都是java.util.stream.Stream<E>类型的对象,说明它们在功能的使用上是没差别的。唯一的差别就是单线程和多线程的执行,关于Stream API还不了解的可以去我开头给出的链接那文章看看。下面我就使用一下并行流,对比串行流看看性能上的差距。

下面是例子

import java.time.Duration;import java.time.LocalTime;import java.util.ArrayList;import java.util.List;import org.junit.Test;public class TestParallelStream {    @Test    public void testStream() {        // 起始时间        LocalTime start = LocalTime.now();        List<Integer> list = new ArrayList<>();        // 将10000-1存入list中        for (int i = 10000; i >= 1; i--) {            list.add(i);        }        list.stream()// 获取串行流                .sorted()// 按自然排序,即按数字从小到大排序                .count();// count()是终止操作,有终止操作才会执行中间操作sorted()        // 终止时间        LocalTime end = LocalTime.now();        // 时间间隔        Duration duration = Duration.between(start, end);        // 输出时间间隔毫秒值        System.out.println(duration.toMillis());    }    @Test    public void testParallelStream() {        // 起始时间        LocalTime start = LocalTime.now();        List<Integer> list = new ArrayList<>();        // 将10000-1存入list中        for (int i = 10000; i >= 1; i--) {            list.add(i);        }        list.parallelStream()// 获取并行流                .sorted()// 按自然排序,即按数字从小到大排序                .count();// count()是终止操作,有终止操作才会执行中间操作sorted()        // 终止时间        LocalTime end = LocalTime.now();        // 时间间隔        Duration duration = Duration.between(start, end);        // 输出时间间隔毫秒值        System.out.println(duration.toMillis());    }}

这个测试类呢有两个方法,一个是testStream(),另一个是testParallelStream(),很明显前者是测试串行流的,后者是测试并行流的,这个两个方法的唯一区别也就在于list调用的是stream()方法还是parallelStream()方法。它们都做同样的一件事,就是对10000-1进行自然排序。至于LocalTimeDuration类是Java 8提供新的操作日期时间的类,不了解的可以去这看看详解Java8特性之新的日期时间 API。其它的我注释已经写的很清楚了。

执行的结果呢是出乎意料的,在我的电脑上,testStream()方法的执行时间在16毫秒左右,而testParallelStream()方法的执行时间在23毫秒左右。

一般我们会认为多线程执行任务会比单线程执行快,其实也不一定,因为多线程的切换什么的也是需要消耗一定时间的,如果任务太小了,多线程的切换时间可能会占总的执行时间很大一个比例。还有就是如果CPU是单核的,多线程也是没单线程好的。关于这点我在Fork/Join框架及其性能介绍中有比较详细地说明了,Fork/Join框架也是利用多线程执行任务的,也会有上面的这个问题存在。

总之,串行流和并行流差别就是单线程和多线程的执行,至于具体选哪种,我的建议是如果任务太小或者运行程序的机器是单核的话,就用串行流,如果任务比较大且运行程序的机器是多核,就可以考虑用并行流。

0 0