用户登录
用户注册

分享至

spark 算子

  • 作者: 吻我至凄冷的深宵sp
  • 来源: 51数据库
  • 2020-09-20
我看来,Spark编程中的action算子的作用就像一个触发器,用来触发之前的transformation算子。transformation操作具有懒加载的特性,你定义完操作之后并不会立即加载,只有当某个action的算子执行之后,前面所有的transformation算子才会全部执行。常用的action算子如下代码所列:(Java版)
package cn.spark.study.core;
import java.util.Arrays;
import java.util.List;
import java.util.Map;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaPairRDD;
import org.apache.spark.api.java.JavaRDD;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.api.java.function.Function;
import org.apache.spark.api.java.function.



  你好!

看函数的返回值,transformer返回spark的数据类型RDD或DataFrame,action返回Long,Array等类型

如有疑问,请追问。
软件
前端设计
程序设计
Java相关