Spark避坑系列一(基础知识)

发布时间:2024年01月09日

大家想了解更多大数据相关内容请移驾我的课堂:
大数据相关课程

剖析及实践企业级大数据
数据架构规划设计
大厂架构师知识梳理:剖析及实践数据建模
剖析及实践数据资产运营平台


Spark作为大数据领域离线计算的王者,在分布式数据处理计算领域有着极高的处理效率,而Python作为Spark支持的开发的重要语言之一,特别对各类机器学习算法的支持,使得有着极高的使用率,本系列文章将通过介绍Spark的基础使用,带大伙入坑Spark

一、什么是Spark

Apache Spark是用于大规模数据(large-scala data)处理的统一(unified)分析引擎。

1.1 框架模块

在这里插入图片描述

文章来源:https://blog.csdn.net/gyshun/article/details/135470769
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。