????????对于YARN架构来讲,除了ResourceManager集群资源总管家、NodeManager单机资源管家两个核心角色外,还可以搭配两个辅助角色使得YARN架构的运行更加稳定、更加高效。
? ? ? ? 辅助角色:
? ? ? ? ~代理服务器(ProxyServer)
? ? ? ? ~历史服务器(JobHistoryServer)
? ? ? ? 注意,此处将代理服务器分离出来,让其独立运行,会在一定程度上提高安全性。
功能:记录历史运行的程序的信息以及产生的日志并提供WEB UI站点供用户使用浏览器查看。
????????在这里,我们可以能会有疑惑,为什么要专门设置一个历史服务器呢?如果我想要查看某个程序的运行日志,为什么不直接找到该程序的日志呢?
? ? ? ? 其实,这个问题和YARN的运行机制是相关的。
????????YARN负责的资源分配调度,它会在每个节点中画出一定空间大小的内存,即容器,供某个程序使用,那个该程序产生的日志文件,会存储在已划分的容器中。那么,对于一个节点来说,它里面可能会有n个被划分的容器,就会至少存在n个日志文件,更别说,我们不可能之查看一个服务器的日志文件,所以我们在查看某个程序的日志文件时,就会显得特别麻烦。
? ? ? ? 所以,打开历史服务器是很有必要的。