Oozie是一个基于工作流引擎的开源框架,由Cloudera公司贡献给Apache。它主要用于管理和调度Apache Hadoop作业,支持的任务类型包括Hadoop MapReduce、Pig Jobs等。
Oozie的核心概念包括workflow jobs和coordinator jobs。Workflow jobs是由多个动作(actions)组成的有向无环图(DAG),即任务按照预定的逻辑顺序一步步执行。而Coordinator jobs则是由时间(频率)和数据可用性触发的重复的workflow jobs,可以定时调度相关的任务。此外,Oozie还提供了Bundle Job功能,允许将多个Coordinator绑定在一起,实现复杂的任务调度。
Oozie需要部署到Java Servlet容器中运行,主要用于定时调度任务,使得多个任务能够按照执行的逻辑顺序进行调度。总的来说,Oozie在大数据处理生态中扮演着重要的角色,帮助企业更好地利用已有的信息化数据,发现并解决存在的问题,协助企业及时调整策略做出更好的决策。
网址:https://juejin.cn/post/7100142134430269477
网址:https://zhuanlan.zhihu.com/p/137887088
1、大数据生态圈辅助工具Oozie丨实现企业级自动化任务开发
网址:https://www.bilibili.com/video/BV1KA411e7iB/?spm_id_from=333.337.search-card.all.click&vd_source=849186cc0cbe77dd51dcd8d1dc63a69b
2、尚硅谷Oozie教程(oozie大数据开发标配)
网址:https://www.bilibili.com/video/BV1jb411A7Ar/?spm_id_from=333.337.search-card.all.click&vd_source=849186cc0cbe77dd51dcd8d1dc63a69b
以上就是个人觉得不错的学习网站,希望能帮到学习大数据的人!