大数据调度服务监控平台(大数据调度服务监控平台官网)
zhezhongyun 2025-07-06 18:02 38 浏览
简介
Smart Kettle是针对上述企业的痛点,对kettle的使用做了一些包装、优化,使其在web端也能
具备基础的kettle作业、转换的配置、调度、监控,能在很大一定程度上协助企业完成不同业务场景下
数据的ETL(抽取、转换、加工)的能力。
注意:本系统并非是对kettle源码的再造,而是借助kettle的API,实现kettle在web端功能华丽的转身1. 它是一款超轻量级的kettle web端调度监控平台
- 支持作业、转换的自定义模板设置
- 支持作业、转换的多任务模板复制
- 支持作业、转换的GUI端配置同步到web端
- 支持作业、转换的日志自定路径配置
- 支持作业、转换的日志文件下载管理
- 支持作业、转换的集群调度(远程子服务器调用)
- 支持作业、转换的GUI端配置同步到web端
- 支持作业、转换的调度配置
- 支持作业、转换的监控管理
- 支持作业、转换的本地执行
- 支持作业、转换的远程执行
- 支持作业、转换的定时配置
- 支持作业、转换的实时监控
- 支持kettle的web端资源库管理
- 支持自定义线程池设置、任务的并行处理
- 支持kettle 任务的告警监控、日志管理
- 提供丰富的业务库、字典库自定义设置
- 提供完整的、实时的大盘调度监控
- 提供系统的用户、角色、权限管理
- 提供Druid数据库查询脚本的实时监控能力
- 支持 Kettle 7.0.1+以上 版本
2. 它的平台实现充分基于"前后端分离"思想
- 后端架构基于 Springboot实现
- 服务端可发布 REST 服务
- 前端架构基于 VUE,数据组件更加丰富、易于维护
- 客户端通过 AJAX 获取服务端数据并进行界面渲染
3. 它的后端实现基于互联网最流行的微服务技术
- 后端架构采用自己搭建的x-common-base框架
- 后端封装了基于kettle的强大接口插件x-kettle-core
- 后端框架基于springboot+Mybatis实现
- 后端框架易于迁移、二次开发、方便维护
4. 它的前端实现基于互联网最流行的渐进式VUE框架
- 功能组件化,易于二次开发维护
- 新手容易上手,短时间内入门
- 界面更加美观、组件更加丰富
- 平台功能架构见如下图:
项目简介
整个工程的目录结构如下:
后端工程:
- 内部网站:x-smart-kettle-server
- github.com:x-smart-kettle-server
- gitee.com:x-smart-kettle-server
├─doc
│ └─database
│ ├─MySql_ds0 --基础数据库设置
│ └─MySql_ds1 --基础数据库设置
├─docker --容器部署详情
├─folder
├─jenkins --jenkins持续部署详情
├─settings --maven默认配置
├─src
│ ├─main
│ │ ├─java
│ │ │ └─org
│ │ │ └─yaukie
│ │ │ └─frame
│ │ │ ├─autocode --代码机入口
│ │ │ │ ├─controller
│ │ │ │ ├─dao
│ │ │ │ │ └─mapper
│ │ │ │ ├─model
│ │ │ │ └─service
│ │ │ │ ├─api
│ │ │ │ └─impl
│ │ │ ├─config --系统基础配置入口
│ │ │ ├─kettle
│ │ │ │ ├─api --kettle核心接口所在位置
│ │ │ │ ├─core
│ │ │ │ ├─listener --kettle监听所在位置
│ │ │ │ ├─quartz --定时器所在位置
│ │ │ │ └─service
│ │ │ ├─listener
│ │ │ └─pool --线程池配置所在位置
│ │ └─resources --核心配置所在位置
│ │ ├─mapper
│ │ ├─template
│ │ └─ui
│ │ └─images
│ └─test
│ └─java
│ └─org
│ └─yaukie
│ └─frame --核心逻辑所在位置前端工程:
- 内部网站:x-smart-kettle-front
- github.com:x-smart-kettle-front
- gitee.com:x-smart-kettle-front
├─docker
│ ├─dev
│ └─prod
├─jenkins
├─public
│ ├─cron
│ └─json
├─src
│ ├─api
│ │ ├─login-form
│ │ ├─main
│ │ │ └─components
│ │ │ ├─a-back-top
│ │ │ ├─error-store
│ │ │ ├─fullscreen
│ │ │ ├─header-bar
│ │ │ │ ├─custom-bread-crumb
│ │ │ │ └─sider-trigger
│ │ │ ├─language
│ │ │ ├─side-menu
│ │ │ ├─tags-nav
│ │ │ └─user
│ │ ├─page-box
│ │ │ └─src
│ │ │ └─styles
│ │ │ └─css
│ │ ├─page-table
│ │ │ └─src
│ │ │ ├─components
│ │ │ └─styles
│ │ │ └─css
│ │ ├─parent-view
│ │ ├─search-box
│ │ │ └─src
│ │ │ └─styles
│ │ │ └─css
│ │ ├─upload-file
│ │ │ └─src
│ │ │ └─styles
│ │ │ └─css
│ │ ├─upload-img
│ │ │ └─src
│ │ │ └─styles
│ │ │ ├─css
│ │ │ └─images
│ │ ├─upload-img-list
│ │ │ └─src
│ │ │ └─styles
│ │ │ └─css
│ │ ├─upload-video
│ │ │ └─src
│ │ │ └─styles
│ │ │ ├─css
│ │ │ └─images
│ │ └─weeks
│ │ └─src
│ ├─config
│ ├─directive
│ │ └─module
│ ├─libs --工具类
│ ├─locale --国际化配置
│ │ └─lang
│ ├─mock
│ │ └─data
│ ├─router --基础路由配置
│ │ └─modules
│ ├─store --系统状态机
│ │ └─module
│ ├─styles
│ │ └─components
│ └─view --调度平台核心前端功能
│ ├─business --业务配置
│ ├─examples
│ │ ├─common
│ │ └─page
│ ├─exception --异常监控
│ ├─homepage --调度大屏
│ │ └─common
│ ├─job --作业调度
│ ├─log --日志监控
│ ├─login --登录模板
│ ├─pool --线程池配置
│ ├─repo --资源库配置
│ ├─scheduler --定时器调度
│ ├─task --定时调度
│ ├─trans --转换调度
│ └─warning --告警监控
环境要求
- Maven3+
- Jdk1.8+
- Mysql5.7+
功能概览
- 登录界面
登录界面内置了两个账号,一个是admin,一个是superadmin,密码随便输入即可
- 系统菜单
- 调度大盘
调度大盘上半部分,展示近期实例运行详情,包括运行成功、运行失败、运行中、以及未运行的实例总体概况
调度大盘中间部分,则通过图表统计作业以及转换实例的分类情况
调度大盘下半部分,则主要展示实例在某段时间的运行趋势如何,可以透过折线图很直观的看出每个时间段的 执行情况,包括运行失败、运行成功的次数分布 调度大盘的最下面则主要统计任务告警情况
- 调度管理
调度管理分为作业调度以及转换调度,作业调度包括作业名称、描述、运行状态以及运行时间等信息展示 , 在作业调度查询界面,选择创建作业(按模板),则将会根据选定模板创建作业
在作业调度查询界面,选择新建作业(已有),则将会从资源库中选择已通过客户端配置好的作业
在作业调度查询界面,选中目标作业之后,在上方点击合适的执行按钮,将会执行对应任务,并实时监控任务状态
在作业调度查询界面,选中目标作业之后,点击调度监控,则可以查看作业的调度图
上述所有操作,转换调度的操作方式同作业类似
- 定时调度
在作业调度界面,选中执行方式,在执行方式中,选择定时任务执行,则进入到定时执行调度界面
在作业定时界面中,您可以选择任意的定时规则 - 资源库管理
可以维护多个资源库,本系统同时支持文件库以及数据库资源库,但建议使用数据库作为资源库,文件库作为 资源库使用过程中,经常会出现一些奇怪的问题,并且从数据备份角度来讲,不安全 - 告警监控
告警监控主要采集作业任务或转换任务在某段时间内的执行细节,并将执行细节以异常记录的形式存储下来
便于后续任务调度过程中任务执行细节的跟踪,方便开发或运维人员精准找出任务异常原因
使用方式
- 下载源码,自行搭建环境
- 给你封装好插件,本地bat或shell脚本跑
- 基于云端地址访问(需要购买阿里云或其他什么云服务器,要收费哦)
1. 源码访问
- 下载 x-smart-kettle-server 后端应用 ,下载地址详见上述简介
- 步骤一
将源码下载到本地,建议使用IDEA打开(Eclipse的没空研究,本人很久不再使用),至于如何下载,如何导入至IDEA, 作为一个专业的研发人员,这里不再赘述,直接进入到步骤二: - 步骤二 配置一下maven的setting.xml,方便从本人的阿里云仓库下载相应的jar包,仓库地址配置为:
<servers>
<server>
<id>rdc-releases</id>
<username>Y3z0VZ</username>
<password>Bb8byTSlq0</password>
</server>
<server>
<id>rdc-snapshots</id>
<username>Y3z0VZ</username>
<password>Bb8byTSlq0</password>
</server>
</servers> ```
<pluginRepository>
<id>snapshots</id>
<url>https://maven.aliyun.com/nexus/content/groups/public</url>
<releases>
<enabled>false</enabled>
</releases>
<snapshots>
<enabled>true</enabled>
</snapshots>
</pluginRepository>
<pluginRepository>
<id>rdc-releases</id>
<url>https://repo.rdc.aliyun.com/repository/128991-release-EJH8o1/</url>
<releases>
<enabled>true</enabled>
</releases>
<snapshots>
<enabled>false</enabled>
</snapshots>
</pluginRepository>
<pluginRepository>
<id>rdc-snapshots</id>
<url>https://repo.rdc.aliyun.com/repository/128991-snapshot-NY2Ub0/</url>
<releases>
<enabled>false</enabled>
</releases>
<snapshots>
<enabled>true</enabled>
</snapshots>
</pluginRepository>
</pluginRepositories>
</profile> 内容不要更改,因为里面配置的是我本人的阿里云仓库地址,密码不会再改变,如果有变化,会在网站统一通知,届时,
重新下载即可 ,仓库环境配置好之后,静静等待jar下载吧,等下载完毕,要去仓库检查一下是否有如下几个jar:
```xml
x1-simple-job-1.0.0-SNAPSHOT.jar
x-kettle-core-1.0.0-SNAPSHOT.jar
x-common-base-1.0.0-SNAPSHOT.jar
x-common-pro-1.0.0-SNAPSHOT.jar如果本地仓库有如上几个jar,那么恭喜您,下载成功,接下来开始进入到步骤三:
- 步骤三
开始配置一下应用的yml文件,文件内容如下:
#配置服务器
server:
port: ${XTL_APP_SERVER_PORT:9876}
servlet:
context-path: ${XTL_APP_SERVER_PATH:/xtl-server}
#配置数据源
spring:
redis:
enabled: ${XTL_REDIS_ENABLED:false}
host: ${XTL_REDIS_HOST:127.0.0.1}
port: ${XTL_REDIS_PORT:6379}
password: ${XTL_REDIS_PASS:root}
jedis:
pool:
max-active: 8
max-wait: -1
max-idle: 500
min-idle: 0
lettuce:
shutdown-timeout: 0
application:
name: ${XTL_APP_NAME:xtl-app} #应用服务名称
datasource:
type: com.alibaba.druid.pool.DruidDataSource
driver-class-name: com.mysql.jdbc.Driver
#系统数据库访问地址【必填项】
url: ${XTL_APP_DATASOURCE_URL:jdbc:mysql://localhost:3306/xtl?useUniCode=true&characterEncoding=UTF-8}
#系统数据库用户名【必填项】
username: ${XTL_APP_DATASOURCE_USERNAME:root}
#系统数据库密码【必填项】
password: ${XTL_APP_DATASOURCE_PASS:root}
# 关闭sharding-jdbc 必须为false
shardingsphere:
enabled: false
kettle:
scheduler:
#是否开启定时调度,默认为fals,则系统启动不会自动执行定时
enabled: ${XTL_KETTLE_SCHEDULER:false} #kettle定时调度启用为true,应用启动之后,自动将任务加入到定时器执行,设置为false则需要手动触发定时任务
log:
file:
#日志物理路径【必填项】
path: ${XTL_KETTLE_LOG_FILE_PATH:/xtl/kettle/logs} # 这个地方建议一定要配置一个存放目录,方便后期下载,查看历史执行记录,如果为"",则不会产生日志到服务器
size: ${XTL_KETTLE_LOG_FILE_SIZE:10} # 控制日志文件的大小,默认是10M,超过10M则截断请求
repo:
# 自定义数据库资源库 使用之前必须先定义资源库【必填项】
name: ${XTL_KETTLE_REPO_NAME:临时资源库} # 资源库名称【必填项】
hostName: ${XTL_KETTLE_DB_HOST:localhost} # 数据库连接地址【必填项】
dbPort: ${XTL_KETTLE_DB_PORT:3306} # 数据库端口 资源库目前仅支持MySQL【必填项】
dbName: ${XTL_KETTLE_DB_NAME:etl} # 数据库实例名【必填项】
userName: ${XTL_KETTLE_DB_USERNAME:root} #数据库用户名【必填项】
passWord: ${XTL_KETTLE_DB_PASS:root} # 数据库密码【必填项】
repoLoginName: ${XTL_KETTLE_REPO_LOGINNAME:admin} #资源库登录账户 默认admin【必填项】
repoLoginPass: ${XTL_KETTLE_REPO_LOGINPASS:admin} #资源库登录密码 默认admin【必填项】
# 该线程池会优先充满至最大的线程数(JDK默认优先将任务提交到队列,队列满了再充满至最大的线程数)
pool:
# 线程池前缀
namePrefix: ${XTL_THREAD_POOL_PREFIX:kettleThreadPool}
# 核心线程数
coreThreads: ${XTL_THREAD_POOL_CORE:20}
# 最大的线程数
maxThreads: ${XTL_THREAD_POOL_MAX:50}
# 队列容量
queueCapacity: ${XTL_THREAD_POOL_QUEUE_CAPACITY:100}
# 5分钟空闲则释放
keepAliveTimeMin: ${XTL_THREAD_POOL_KEEPALIVE:5}
logging:
#系统日志存放路径
path: ${XTL_APP_LOG_PATH:/maven/xtl-web-server/logs}
level:
root: ${XTL_APP_LOG_LEVEL:info}配置注释写的很清楚了,这里不再解释,如有不懂的地方,请留言
- 步骤四 步骤三完成之后,需要在本地建立一个应用数据库,数据库脚本详见:doc->database->Mysql,包括建表语句及初始化数据
请自行在本地执行,并完善yml配置 。 - 步骤五 步骤四完成之后,开始配置kettle资源库数据库,虽然本系统同时支持文件库以及数据库资源库,但还是强烈建议使用数据库作为
资源库,考虑数据移植方便性、安全性、高效性,使用数据库作为资源库,资源库请自行建立,并完善yml配置。 - 步骤六 上述内容都配置好之后,这里运行: Start.java 启动应用,并在浏览器访问:http://ip:port/xtl-server/swagger-ui.hml ,出现如下截图,那么恭喜您启动成功:
- 下载 x-smart-kettle-font 前端应用 ,下载地址详见上述简介 步骤一
Smart Kettle 调度监控平台的前端部署,需要依赖NodeJs环境,请自行百度搜素下载、安装,这里不再赘述
--安装NodeJs
--安装Vue脚手架
--配置node环境变量
# clone the project
git clone http://open.inspur.com/yuenbin/x-smart-kettle-front.git
git clone https://gitee.com/yaukie/x-smart-kettle-front.git
git clone http://github.com/yaukie/x-smart-kettle-front.git
// install dependencies
npm install
// develop
npm run dev- 步骤二 配置一下vue-config.js ,把后端服务器的地址换成您的地址即可
devServer: {
proxy: {
"/xtl-server": {
target: "http://localhost:9876/xtl-server/",
pathRewrite: { "^/xtl-server": "" },
changeOrigin: true
}
}
}然后执行 npm run dev 本地启动应用,出现如下控制台打印的信息,则恭喜您前端也启动成功!
2. 插件访问
TODO
- 后续补充更加人性化的使用方式,正在完善中。。。
3. 云端访问
- 打算搞个阿里云服务器,但太贵了,暂时没钱,,不过读者要是赞助一下,可以考虑^_^ TODO
后续计划
- 功能需求方面
1、后续考虑增加集群子服务器远程执行
2、后续考虑增加用户权限、角色权限设计
3、后续考虑增加线程池高级配置,支持多线程任务的灵活配置
4、后续研究Vue前端实现集成Kettle组件,实现Web端的Kettle任务流程编排 - 部署运维方面
1、考虑做到应用+服务+数据库一体化,jar包集成
2、考虑通过Docker容器方式实现功能移植
3、考虑通过Jenkins实现打包、部署
4、考虑发布到阿里云或其他什么云,远端访问
相关模块
注意:模块不依赖于框架,可以独立使用。
- x-common-base -- 基于Springboot自研的微服务架构
- x-common-pro -- 构建统一的jar包存放基础包
- x-kettle-core -- 基于Kettle Api 打造的核心Kettle调用接口组件
- x1-simple-job -- 基于Quartz的定时器调用插件
相关推荐
- Python入门学习记录之一:变量_python怎么用变量
-
写这个,主要是对自己学习python知识的一个总结,也是加深自己的印象。变量(英文:variable),也叫标识符。在python中,变量的命名规则有以下三点:>变量名只能包含字母、数字和下划线...
- python变量命名规则——来自小白的总结
-
python是一个动态编译类编程语言,所以程序在运行前不需要如C语言的先行编译动作,因此也只有在程序运行过程中才能发现程序的问题。基于此,python的变量就有一定的命名规范。python作为当前热门...
- Python入门学习教程:第 2 章 变量与数据类型
-
2.1什么是变量?在编程中,变量就像一个存放数据的容器,它可以存储各种信息,并且这些信息可以被读取和修改。想象一下,变量就如同我们生活中的盒子,你可以把东西放进去,也可以随时拿出来看看,甚至可以换成...
- 绘制学术论文中的“三线表”具体指导
-
在科研过程中,大家用到最多的可能就是“三线表”。“三线表”,一般主要由三条横线构成,当然在变量名栏里也可以拆分单元格,出现更多的线。更重要的是,“三线表”也是一种数据记录规范,以“三线表”形式记录的数...
- Python基础语法知识--变量和数据类型
-
学习Python中的变量和数据类型至关重要,因为它们构成了Python编程的基石。以下是帮助您了解Python中的变量和数据类型的分步指南:1.变量:变量在Python中用于存储数据值。它们充...
- 一文搞懂 Python 中的所有标点符号
-
反引号`无任何作用。传说Python3中它被移除是因为和单引号字符'太相似。波浪号~(按位取反符号)~被称为取反或补码运算符。它放在我们想要取反的对象前面。如果放在一个整数n...
- Python变量类型和运算符_python中变量的含义
-
别再被小名词坑哭了:Python新手常犯的那些隐蔽错误,我用同事的真实bug拆给你看我记得有一次和同事张姐一起追查一个看似随机崩溃的脚本,最后发现罪魁祸首竟然是她把变量命名成了list。说实话...
- 从零开始:深入剖析 Spring Boot3 中配置文件的加载顺序
-
在当今的互联网软件开发领域,SpringBoot无疑是最为热门和广泛应用的框架之一。它以其强大的功能、便捷的开发体验,极大地提升了开发效率,成为众多开发者构建Web应用程序的首选。而在Spr...
- Python中下划线 ‘_’ 的用法,你知道几种
-
Python中下划线()是一个有特殊含义和用途的符号,它可以用来表示以下几种情况:1在解释器中,下划线(_)表示上一个表达式的值,可以用来进行快速计算或测试。例如:>>>2+...
- 解锁Shell编程:变量_shell $变量
-
引言:开启Shell编程大门Shell作为用户与Linux内核之间的桥梁,为我们提供了强大的命令行交互方式。它不仅能执行简单的文件操作、进程管理,还能通过编写脚本实现复杂的自动化任务。无论是...
- 一文学会Python的变量命名规则!_python的变量命名有哪些要求
-
目录1.变量的命名原则3.内置函数尽量不要做变量4.删除变量和垃圾回收机制5.结语1.变量的命名原则①由英文字母、_(下划线)、或中文开头②变量名称只能由英文字母、数字、下画线或中文字所组成。③英文字...
- 更可靠的Rust-语法篇-区分语句/表达式,略览if/loop/while/for
-
src/main.rs://函数定义fnadd(a:i32,b:i32)->i32{a+b//末尾表达式}fnmain(){leta:i3...
- C++第五课:变量的命名规则_c++中变量的命名规则
-
变量的命名不是想怎么起就怎么起的,而是有一套固定的规则的。具体规则:1.名字要合法:变量名必须是由字母、数字或下划线组成。例如:a,a1,a_1。2.开头不能是数字。例如:可以a1,但不能起1a。3....
- Rust编程-核心篇-不安全编程_rust安全性
-
Unsafe的必要性Rust的所有权系统和类型系统为我们提供了强大的安全保障,但在某些情况下,我们需要突破这些限制来:与C代码交互实现底层系统编程优化性能关键代码实现某些编译器无法验证的安全操作Rus...
- 探秘 Python 内存管理:背后的神奇机制
-
在编程的世界里,内存管理就如同幕后的精密操控者,确保程序的高效运行。Python作为一种广泛使用的编程语言,其内存管理机制既巧妙又复杂,为开发者们提供了便利的同时,也展现了强大的底层控制能力。一、P...
- 一周热门
- 最近发表
- 标签列表
-
- HTML 教程 (33)
- HTML 简介 (35)
- HTML 实例/测验 (32)
- HTML 测验 (32)
- JavaScript 和 HTML DOM 参考手册 (32)
- HTML 拓展阅读 (30)
- HTML文本框样式 (31)
- HTML滚动条样式 (34)
- HTML5 浏览器支持 (33)
- HTML5 新元素 (33)
- HTML5 WebSocket (30)
- HTML5 代码规范 (32)
- HTML5 标签 (717)
- HTML5 标签 (已废弃) (75)
- HTML5电子书 (32)
- HTML5开发工具 (34)
- HTML5小游戏源码 (34)
- HTML5模板下载 (30)
- HTTP 状态消息 (33)
- HTTP 方法:GET 对比 POST (33)
- 键盘快捷键 (35)
- 标签 (226)
- opacity 属性 (32)
- transition 属性 (33)
- 1-1. 变量声明 (31)
