JAVA8新特性–集合流操作Stream
Java 8 引入,位于java.util.stream 包中,与 java.io 包里的输入输出流 InputStream 和 OutputStream 是不同的概念。
Stream API 借助 Lambda 表达式,可以提高编程效率和程序可读性。
什么是 Stream?
- Stream(流)是一个来自数据源的元素队列并支持聚合操作
- 元素是特定类型的对象,形成一个队列。 Java中的Stream并不会存储元素,而是按需计算。
- 数据源 流的来源。 可以是集合,数组,I/O channel, 产生器generator 等。
- 聚合操作 类似SQL语句一样的操作, 比如filter, map, reduce, find, match, sorted等。
和以前的Collection操作不同, Stream操作还有两个基础的特征:
- Pipelining: 中间操作都会返回流对象本身。 这样多个操作可以串联成一个管道, 如同流式风格(fluent style)。 这样做可以对操作进行优化, 比如延迟执行(laziness)和短路( short-circuiting)。
- 内部迭代: 以前对集合遍历都是通过Iterator或者For-Each的方式, 显式的在集合外部进行迭代, 这叫做外部迭代。 Stream提供了内部迭代的方式, 通过访问者模式(Visitor)实现。
流的操作类型分为两种,组成一个流管道
- intermediate:流可以后面跟有零个或多个中间操作
- terminal:流只能有一个终结操作,位于最后,例如 Stream.forEach / IntStream.sum等,产生一个最终结果,或者一个副作用(side effect)
- Intermediate操作都是
lazy 的,多个操作只会在 terminal 操作的时候融合起来执行,一次循环完成
在 Java 8 中, 集合接口有两个方法来生成流: stream() ? 为集合创建串行流。 parallelStream() ? 为集合创建并行流。
forEach : Stream 提供了新的方法 ‘forEach’ 来迭代流中的每个数据。
Random random = new Random();
random.ints().limit(10).forEach(System.out::println);
map : map 方法用于映射每个元素到对应的结果
List<Integer> numbers = Arrays.asList(3, 2, 2, 3, 7, 3, 5);
List<Integer> squaresList = numbers.stream().map( i -> i*i).distinct().collect(Collectors.toList());
filter 方法用于通过设置的条件过滤出元素
limit 方法用于获取指定数量的流。
sorted 方法用于对流进行排序。
parallelStream 是流并行处理程序的代替方法。
Collectors 类实现了很多归约操作,例如将流转换成集合和聚合元素。Collectors 可用于返回列表或字符串:
toArray :将流转换为Object[]或者指定类型的数组
flatMap :如果流的元素为数组或者Collection,flatMap就是将每个Object[]元素或Collection元素都转换为Object元素。map就是将数组流直接返回,flatMap是将数组流中的每个元素都返回
中间操作与终端操作 中间操作(intermediate)主要有以下方法(此类型的方法返回的都是Stream对象):map (mapToInt, flatMap 等)、 filter、 distinct、 sorted、 peek、 limit、 skip、 parallel、 sequential、 unordered 终端操作(terminal)主要有以下方法:forEach、 forEachOrdered、 toArray、 reduce、 collect、 min、 max、 count、 anyMatch、 allMatch、 noneMatch、 findFirst、 findAny、 iterator
forEach与forEachOrdered:
- 相同:遍历Stream中的每个元素。
- 区别:在串行流(stream)中没有区别,在并行流(parallelStream)中如果数据源是有序集合,
forEachOrdered输出顺序与数据源中顺序一致,forEach则是乱序。
peek :生成一个包含原Stream的所有元素的新Stream,同时会提供一个消费函数即引用的方法A,当Stream每个元素被消费的时候都会先执行新Stream给定的方法A。peek是中间操作,如果pee后没有最终操作,则peek不会执行。 toArray :将流转换为Object[]或者指定类型的数组。
Stream还有几个静态方法,返回都是Stream对象。 静态方法如下:builder(返回Builder对象)、empty、of、iterate、generate、concat。
builder :返回一个Builder对象,Builder对象在调用build()返回Stream对象。empty :返回一个空的有序的Stream对象。of :返回包含单个元素的有序的Stream对象。iterate :返回一个无限元素的有序的Stream对象。需要两个参数,第一个参数为初始值,第二个参数为要引用的方法,然后会通过递归循环调用引用的方法。generate :返回一个无限元素的无序的的Stream对象。需要一个参数,参数为引用的方法,然后会通过循环调用引用的方法来生成元素,常用于生成常量Stream和随机元素Stream。concat :将两个Stream连接成一个Stream。需要两个Stream作为参数,如果两个Stream都是有序的并且无论参数Stream是否是并行Stream,得到的都是有序的Stream。输出元素顺序为先输出第一个Stream的元素,然后输出第二个Stream的元素。当结果Stream关闭时候,两个参数Stream同时关闭。
|