大数据技术原理及应用课实验7 :Spark初级编程实践

发布时间:2024年01月22日

实验7  Spark初级编程实践

一、实验目的

1. 掌握使用Spark访问本地文件和HDFS文件的方法

2. 掌握Spark应用程序的编写、编译和运行方法

二、实验平台

1. 操作系统:Ubuntu18.04(或Ubuntu16.04);

2. Spark版本:2.4.0;

3. Hadoop版本:3.1.3。

三、实验步骤(每个步骤下均需有运行截图)

实验前期准备:

1. Spark读取文件系统的数据

(1)在spark-shell中读取Linux系统本地文件“/home/hadoop/test.txt”,然后统计出文件的行数;

(2)在spark-shell中读取HDFS系统文件“/user/hadoop/test.txt”(如果该文件不存在,请先创建),然后,统计出文件的行数;

文章来源:https://blog.csdn.net/weixin_60530224/article/details/135633670
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。