通过hadoop jar命令运行提交MapReduce到YARN中

发布时间：2024年01月24日

实现 Wordcount

大概流程：给定数据输入的路径，给定结果输出的路径；

将输入路径内的数据中的单词进行计数，将结果写到输出路径

如下：

在hadoop下找hadoop-mapreduce-examples-3.1.3.jar ??

cd /opt/module/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar

切换到home路径（~）

cd ~

编辑一个文档word.txt

vim word.txt

#在里面随便输入单词

通过如下查看hadoop下已有文件

hadoop fs -ls /

在hadoop下创建input和output文件夹

hadoop fs -mkdir -p /input
hadoop fs -mkdir /output

再查看

hadoop fs -ls /

将word.txt放入hadoop的input文件夹下

 hadoop fs -put words.txt input/

可再次查看确认；

通过hadoop jar命令运行提交MapReduce到YARN中，并存到output的wc下：

hadoop jar /opt/module/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount hdfs://master:9000/input hdfs://master:9000/output/wc

通过

hadoop fs -ls /output/wc

查看wc文件

再通过

hadoop fs -cat /output/wc/part-r-00000

就完成了

文章来源:https://blog.csdn.net/m0_75237906/article/details/135715598
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！