大数据技术原理及应用课实验7 :Spark初级编程实践

发布时间：2024年01月22日

实验7 Spark初级编程实践

一、实验目的

1. 掌握使用Spark访问本地文件和HDFS文件的方法

2. 掌握Spark应用程序的编写、编译和运行方法

二、实验平台

1. 操作系统：Ubuntu18.04（或Ubuntu16.04）；

2. Spark版本：2.4.0；

3. Hadoop版本：3.1.3。

三、实验步骤（每个步骤下均需有运行截图）

实验前期准备：

1. Spark读取文件系统的数据

（1）在spark-shell中读取Linux系统本地文件“/home/hadoop/test.txt”，然后统计出文件的行数；

（2）在spark-shell中读取HDFS系统文件“/user/hadoop/test.txt”（如果该文件不存在，请先创建），然后，统计出文件的行数；

文章来源:https://blog.csdn.net/weixin_60530224/article/details/135633670
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！