graphx
-
spark的核心模块是
Apache Spark是一个快速、通用的大数据处理引擎,它的核心结构主要包括以下几个部分:1. RDD(Resilient Distributed Datasets):弹性分布式数据集,是Spark的基本数据结构,RDD是一个不可变的、分区存储的数据集合,它可以表示一个分布式文件系统的数据集或者一个并行计算框架的数据集,RDD的主要……
Apache Spark是一个快速、通用的大数据处理引擎,它的核心结构主要包括以下几个部分:1. RDD(Resilient Distributed Datasets):弹性分布式数据集,是Spark的基本数据结构,RDD是一个不可变的、分区存储的数据集合,它可以表示一个分布式文件系统的数据集或者一个并行计算框架的数据集,RDD的主要……