通过hadoop jar命令运行提交MapReduce到YARN中

发布时间:2024年01月24日

实现 Wordcount

大概流程:给定数据输入的路径,给定结果输出的路径;

将输入路径内的数据中的单词进行计数,将结果写到输出路径

如下:

在hadoop下找hadoop-mapreduce-examples-3.1.3.jar ??

cd /opt/module/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar 

切换到home路径(~)

cd ~

编辑一个文档word.txt

vim word.txt

#在里面随便输入单词

通过如下查看hadoop下已有文件

hadoop fs -ls /

在hadoop下创建input和output文件夹

hadoop fs -mkdir -p /input
hadoop fs -mkdir /output

再查看

hadoop fs -ls /

将word.txt放入hadoop的input文件夹下

 hadoop fs -put words.txt input/

可再次查看确认;

通过hadoop jar命令运行提交MapReduce到YARN中,并存到output的wc下:

hadoop jar /opt/module/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount hdfs://master:9000/input hdfs://master:9000/output/wc

通过

hadoop fs -ls /output/wc

查看wc文件

再通过

hadoop fs -cat /output/wc/part-r-00000

就完成了

文章来源:https://blog.csdn.net/m0_75237906/article/details/135715598
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。