IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Stream API -> 正文阅读

[大数据]Stream API


Java8中有两大最为重要的改变。第一个是 Lambda 表达式;另外一个则是 StreamAPI(java.util.stream.*)。
Stream 是 Java8 中处理集合的关键抽象概念,它可以指定你希望对集合进行的操作,可以执行非常复杂的查找、过滤和映射数据等操作。使用Stream API 对集合数据进行操作,就类似于使用 SQL 执行的数据库查询。也可以使用 Stream API 来并行执行操作。简而言之,Stream API 提供了一种高效且易于使用的处理数据的方式。

== 注意 ==

  1. Stream 自己不会存储元素
  2. Stream 不会改变源对象。相反,他们会返回一个持有结果的新的Stream
  3. Stream 操作是延迟执行的。这意味着他们会等到需要结果的时候才执行

Stream 的操作三步骤:

  1. 创建 Stream

    ? 一个数据源(如:集合,数组),获取一个流

  2. 中间操作

    ? 一个中间操作,对数据源的数据进行处理

  3. 终止操作(终端操作)

    ? 一个终止操作,执行中间操作链,并产生结果
    在这里插入图片描述

Ⅰ创建Stream

  1. Java8 中的 Collection 接口被扩展,提供了两个获取流的方法:

    • default Stream stream() : 返回一个串行流

    • default Stream parallelStream() : 返回一个并行流

  2. 通过Arrays中的静态方法stream()获取一个数组流

    • static Stream stream(T[] array): 返回一个流

  3. 可以使用Stream类的静态方法 Stream.of(), 通过显示值创建一个流。它可以接收任意数量的参数

    • public static Stream of(T… values) : 返回一个流

  4. 可以使用静态方法 Stream.iterate() 和Stream.generate(), 创建无限流。

    • 迭代:public static Stream iterate(final T seed, final UnaryOperator f)

    • 生成:public static Stream generate(Supplier s)

①Collection创建Stream
//list集合
List<String> list=new ArrayList<>();
Stream<String> stream=list.stream();//获取一个顺序流/串行
Stream<String> parallelStream=list.parallelStream();//获取一个并行流

//Map集合
Map<String ,Object> map=new HashMap<>();
Stream<String> stream=map.keyset().stream();//key
Stream<Object> stream1=map.values().stream();//value
Stream<Map.entry<String,Object>> stream2=map.entrySet().stream();//entry 

在这里插入图片描述

②通过数组中的静态方法stream()获取一个数组流
Integer[] nums=new Integer[10];
Stream<Integer> stream=Arrays.stream(nums);

在这里插入图片描述

③由值创建流
Stream<Integer> stream=Stream.of(1,2,3,4,5);

在这里插入图片描述

④由函数创建无限流
//迭代器生成
Stream<Integer> stream =Stream.iterate(0,(x)->x+2);
stream.forEach(System.out::println);

//随机数生成
Stream<Integer> stream=Stream.generate(Math::random);
stream.forEach(System.out::println);

在这里插入图片描述

在这里插入图片描述

Ⅱ 中间操作

多个中间操作可以连接起来形成一个流水线,除非流水线上触发终止操作,否则中间操作不会执行任何的处理!而在终止操作时一次性全部处理,称为“惰性求值”。

筛选与切片
方法描述
filter(Predicate p)接受Lambda,从流中排除某些元素
distanct()筛选,通过流所生成元素的hashCode()和equal()去除重复元素
limit(long maxsize)截断流,使其元素不超过给定数量
skip(long n)跳过元素,返回一个扔掉前n个元素的流。若流中元素不足,则返回一个空流。与limit(n)互补。
映射
方法描述
map(Function f)接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素
mapToDouble(ToDoubleFunction f)接收一个函数作为参数,该函数会被应用到每个元素上,产生一个新的 DoubleStream
mapToInt(ToIntFunction f)接收一个函数作为参数,该函数会被应用到每个元素上,产生一个新的 IntStream。
mapToLong(ToLongFunction f)接收一个函数作为参数,该函数会被应用到每个元素上,产生一个新的 LongStream。
flatMap(Function f)接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流
排序
方法描述
sorted()产生一个新流,其中按自然顺序排序
sorted(Comparator comp)产生一个新流,其中按比较器顺序排序

Ⅲ 终止操作

终端操作会从流的流水线生成结果。其结果可以是任何不是流的值,例如:List、Integer,甚至是 void 。

查找与匹配
方法描述
allMatch(Predicate p)检查是否匹配所有元素
anyMatch(Predicate p)检查是否至少匹配一个元素
noneMatch(Predicate p)检查是否没有匹配所有元素
findFirst()返回第一个元素
findAny()返回当前流中的任意元素
count()返回流中元素总数
max(Comparator c)返回流中元素总数
min(Comparator c)返回流中最小值
forEach(Consumer c)内部迭代(使用 Collection 接口需要用户去做迭代,称为外部迭代。相反,Stream API 使用内部迭代——它帮你把迭代做了)
归约
方法描述
reduce(T iden, BinaryOperator b)可以将流中元素反复结合起来,得到一个值。返回 T
reduce(BinaryOperator b)可以将流中元素反复结合起来,得到一个值。返回 Optional
收集
方法描述
collect(Collector c)将流转换为其他形式。接收一个 Collector接口的实现,用于给Stream中元素做汇总的方法

Collector 接口中方法的实现决定了如何对流执行收集操作(如收集到 List、Set、Map)。但是 Collectors 实用类提供了很多静态方法,可以方便地创建常见收集器实例,具体方法与实例如下表:

在这里插入图片描述

在这里插入图片描述

例:

1,创建一个Employee实体类
public class Employee {

	private int id;
	private String name;
	private int age;
	private double salary;//状态

	//空参构造
	
	//有参构造
	
	//重写hashCode() 和 equals()
	
	//重写toString()

}
2,创建一个List集合
	//2. 中间操作
	List<Employee> emps = Arrays.asList(
			new Employee(102, "李四", 59, 6666.66),
			new Employee(101, "张三", 18, 9999.99),
			new Employee(103, "王五", 28, 3333.33),
			new Employee(104, "赵六", 8, 7777.77),
			new Employee(104, "赵六", 8, 7777.77),
			new Employee(104, "赵六", 8, 7777.77),
			new Employee(105, "田七", 38, 5555.55)
	);
3,筛选与切片
//filter排除方法
	@Test
	public void test2(){
		//所有的中间操作不会做任何的处理
		Stream<Employee> stream = emps.stream()
			.filter((e) -> {
				return e.getAge() <= 35;
			});
		//只有当做终止操作时,所有的中间操作会一次性的全部执行,称为“惰性求值”
		stream.forEach(System.out::println);
	}
	//--------------------------	
//distinct去重方法
	@Test
	public void test6(){
		emps.stream()
			.distinct()
			.forEach(System.out::println);
	}
	//--------------------------
//limit方法
	@Test
	public void test5(){
		emps.parallelStream()
			.filter((e) -> e.getSalary() >= 5000)
			.limit(2)
			.forEach(System.out::println);
	}
	//--------------------------	
//skip方法
	@Test
	public void test5(){
		emps.parallelStream()
			.filter((e) -> e.getSalary() >= 5000)
			.skip(2)
			.forEach(System.out::println);
	}
4,映射/排序
/*
映射
map——接收 Lambda , 将元素转换成其他形式或提取信息。接收一个函数作为参数,该函数会被应用到每个元素上,并将其映射成一个新的元素。
flatMap——接收一个函数作为参数,将流中的每个值都换成另一个流,然后把所有流连接成一个流
*/
public void Test{
    @Test
    public void test1(){
            List<String> strList = Arrays.asList("aaa", "bbb", "ccc", "ddd", "eee");
 	//--------------------------           
	//map
	strList.stream()
                .map(Test::filterCharacter)
                .forEach((sm) -> {
                    sm.forEach(System.out::print);
                });
        System.out.println();
	//--------------------------        
	//flatmap
     strList.stream()
                .flatMap(Test::filterCharacter)
                .forEach(System.out::print);
       
	//--------------------------       
      //sorted方法
        strList.stream()
                .sorted()
                .map(Test::filterCharacter)
                .forEach((sm) -> {
                    sm.forEach(System.out::print);
                }); 
	//--------------------------                
      //sorted(Comparator comp)
        strList.stream()
                .sorted(Comparator.comparing(String::toLowerCase))
                .flatMap(Test::filterCharacter)
                .forEach(System.out::print);      
    }
    
    
     public static Stream<Character> filterCharacter(String str) {
            List<Character> list = new ArrayList<>();

            for (Character ch : str.toCharArray()) {
                list.add(ch);
            }
            return list.stream();
     }
     

}			
 @Test
    public void test1(){ 
      //类似于add()和addAll()
         List<String> strList2 = Arrays.asList("aaa", "bbb", "ccc", "ddd", "eee");

            //add方法
            List str = new ArrayList<>();
            str.add("xxx");
            str.add(strList2);
            System.out.println(str);
	//--------------------------            
            //addAll方法
            List str1 = new ArrayList<>();
            str1.add("zzz");
            str1.addAll(strList2);
            System.out.println(str1);
}
5,查找/匹配/规约/收集
	List<Employee> emps = Arrays.asList(
			new Employee(102, "李四", 59, 6666.66, Status.BUSY),
			new Employee(101, "张三", 18, 9999.99, Status.FREE),
			new Employee(103, "王五", 28, 3333.33, Status.VOCATION),
			new Employee(104, "赵六", 8, 7777.77, Status.BUSY),
			new Employee(104, "赵六", 8, 7777.77, Status.FREE),
			new Employee(104, "赵六", 8, 7777.77, Status.FREE),
			new Employee(105, "田七", 38, 5555.55, Status.BUSY)
	);
	//3. 终止操作
	/*
		allMatch——检查是否匹配所有元素
		anyMatch——检查是否至少匹配一个元素
		noneMatch——检查是否没有匹配的元素
		findFirst——返回第一个元素
		findAny——返回当前流中的任意元素
		count——返回流中元素的总个数
		max——返回流中最大值
		min——返回流中最小值
	 */
	@Test
	public void test1(){
			boolean bl = emps.stream()
				.allMatch((e) -> e.getStatus().equals(Status.BUSY));
			System.out.println(bl);
	//---------------------------				
			boolean bl1 = emps.stream()
				.anyMatch((e) -> e.getStatus().equals(Status.BUSY));	
			System.out.println(bl1);
	//---------------------------			
			boolean bl2 = emps.stream()
				.noneMatch((e) -> e.getStatus().equals(Status.BUSY));
			System.out.println(bl2);
	//---------------------------				
					Optional<Employee> op = emps.stream()
			.sorted((e1, e2) -> Double.compare(e1.getSalary(), e2.getSalary()))
			.findFirst();
            System.out.println(op.get());
	//--------------------------
            Optional<Employee> op2 = emps.parallelStream()
                .filter((e) -> e.getStatus().equals(Status.FREE))
                .findAny();
            System.out.println(op2.get());
	//--------------------------            
            long count = emps.stream()
						 .filter((e) -> e.getStatus().equals(Status.FREE))
						 .count();
            System.out.println(count);
	//--------------------------
            Optional<Double> op = emps.stream()
                .map(Employee::getSalary)
                .max(Double::compare);
            System.out.println(op.get());
	//--------------------------
            Optional<Employee> op2 = emps.stream()
                .min((e1, e2) -> Double.compare(e1.getSalary(), e2.getSalary()));
            System.out.println(op2.get());
        }
	}
	
/*
归约
reduce(T identity, BinaryOperator) 可以将流中元素反复结合起来,得到一个值。返回 T
reduce(BinaryOperator) ——可以将流中元素反复结合起来,得到一个值。返回 Optional<T>
*/
	@Test
	public void test1(){
		List<Integer> list = Arrays.asList(1,2,3,4,5,6,7,8,9,10);
		
		Integer sum = list.stream()
			.reduce(0, (x, y) -> x + y);
		System.out.println(sum);
	//---------------------------
		
		Optional<Double> op = emps.stream()
			.map(Employee::getSalary)
			.reduce(Double::sum);
		System.out.println(op.get());
	}
	//收集
	//collect——将流转换为其他形式。接收一个 Collector接口的实现,用于给Stream中元素做汇总的方法
	@Test
	public void test3(){
		List<String> list = emps.stream()
			.map(Employee::getName)
			.collect(Collectors.toList());
		
		list.forEach(System.out::println);
		
		System.out.println("----------------------------------");
		
		Set<String> set = emps.stream()
			.map(Employee::getName)
			.collect(Collectors.toSet());
		
		set.forEach(System.out::println);

		System.out.println("----------------------------------");
		
		HashSet<String> hs = emps.stream()
			.map(Employee::getName)
			.collect(Collectors.toCollection(HashSet::new));
		
		hs.forEach(System.out::println);
	}

并行流与串行流

并行流就是把一个内容分成多个数据块,并用不同的线程分别处理每个数据块的流。Java 8 中将并行进行了优化,我们可以很容易的对数据进行并行操作。Stream API 可以声明性地通过 parallel() 与sequential() 在并行流与顺序流之间进行切换

串行流

前面使用的Stream流都是串行,在一个线程上运行

/**
/*串行流
*/
@Test
public void teat(){
	Stream.of(5,6,8,2,9)
			.filter(s->{
				System.out.println(Thread.currentThread()+" "+s);
				return s>3;
			}).count();
}
并行流

parallelStream 其实就是一个并行执行的流,它通过默认的ForkJoinPool,可以提高多线程的速度

获取并行流的两种方法

  1. List<Integer> list=new ArrayList<>();
    	//通过List接口直接获取并行流
    	Stream<Integer> integerStream=list.parallelStream();
    
  2. //将已有的串行流转换为并行流
    Stream<Integer> parallel=Stream.of(1,2,3).parallel();
    
/**
/*并行流
*/
@Test
public void teat(){
	Stream.of(5,6,8,2,9)
			.parallel()
			.filter(s->{
				System.out.println(Thread.currentThread()+" "+s);
				return s>3;
			}).count();
}

Stream并行处理将一个大的任务分割为多个小任务并行执行,

并行流的应用

Fork/Join 它可以将一个大的任务拆分成多个子任务进行并行处理,最后将子任务结果合并成最后的计算结果,并进行输出

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-05-09 12:46:25  更:2022-05-09 12:50:06 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 6:32:38-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码