基于Kettle开发的web版数据集成开源工具(data-integration)-应用篇

发布时间:2024年01月04日

🔼上一集:基于Kettle开发的web版数据集成开源工具(data-integration)-介绍篇

*??主目录:ETL&ELT专栏

📚第一章 基本流程梳理

📗页面基本操作

登录开始->新建项目->保存项目->运行项目开始(问题还是挺多的,不过主要还是借鉴任务编排这一块,无伤大雅)
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

select role_name,`describe` from dp_portal_role

📗对应后台服务流程

参照页面基本操作,梳理后台对应的服务及表等
在这里插入图片描述

  • 项目主要对应两种表
    • 项目信息表 dp_portal_project :项目编号、名称、描述、类型、状态,分组编号、名称
    • 项目附件信息表 dp_portal_project_file :项目编号、项目文件内容project_file、项目版本号;其中project_file字段通过JSON串存放项目内容
  • 运行项目
    • 调用更新项目信息接口 ProjectServiceApiController.updateSelective
    • 前端通过调用websocket服务,调用运行接口 ProjectExecutorController.executeById
      • @MessageMapping@SendToUser注解是用来处理WebSocket消息并实现广播或点对点消息推送的:
        1. WebSocket客户端向服务器发送一条指向/executeById路径的消息。
        2. 服务器端通过@MessageMapping找到并执行executeById方法。
        3. 方法内部完成业务逻辑处理后,返回的结果会被自动通过WebSocket协议推送给对应用户,即在每个已认证用户的特定通道上发布结果。
          在这里插入图片描述
          在这里插入图片描述
      • projectExecutorService.asyncExecuteByFile
        • executeByFile.execute.start()
          • 构建TransMeta 对象,buildTransMeta(jsonxml)
          • 设置本地引擎执行
          • 创建执行器
          • 启动
        • 调用Kettle本地引擎
          在这里插入图片描述

📚第二章 二开思路

通过上面的流程梳理,发现任务编排工作流主要在前端,各种字段属性和kettle对应都是前端传给后台的,后台直接保存的JSON串,我这里只需要任务编排这块功能,springcloud也用不到,后面如果借鉴该项目,大概要做哪些事?

📗前端

应该可以直接复用,我们用的也是vue2+element架构

📗后端

该项目涉及的技术组件比较多,用到了springcloud,相对来说有点麻烦,到了具体开发阶段,涉及的就比较多了,下一步可以先简单点,就导出一个作业文件,提取相关代码,能够成功执行作业之后,在开始大刀阔斧的开展工作,一步一步推进:

  • kettle本地引擎执行代码
  • 作业文件组装、转换代码
文章来源:https://blog.csdn.net/qq_36434219/article/details/135378698
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。