Skip to main content

ODS config template

本片文档主要介绍ODS配置模板的参数和使用方式。

配置模板example可以参考quick start的配置文件

数据源配置:ods_etl_config

source_connection: 配置在application.properties中的connection

source_table: 从哪张表获取数据

source_db: 从哪个数据库获取数据

source_type: 数据库类型,例如:mysql

target_connection: 目标连接,配置在application.properties中的connection。例如:hive

target_table: ods表名

target_db: ods数据库库名

target_type: 目标数据库类型,例如:hive

row_filter_expression: 是否可空:是。例如:location = 'shanghai',表示只取上海地区的数据。会作为where表达式拼接在查询源数据表的sql中

load_type: 增量全量,可选值:incremental,full

log_driven_type: 日志驱动类型,可选值:timewindow/upstream/kafka_offset/auto_inc_id/diff

upstream: 依赖于哪一个上游任务,对于ods任务而言,一般为空

depends_on: 依赖于哪一个任务,对于ods任务而言,一般为空

default_start: timewindow模式下的开始时间

partition_format: 分区格式,可选值:空字符串或者year/month/day

time_format: 时间格式,默认值:YYYY-MM-DD hh:mm:ss

period: 多少分钟运行一次任务,对于daily的任务应为1440

表配置:ods_config

source_table: 从哪张表获取数据

source_column: 源表列名称

column_type: 源表列类型

column_description: 源表列描述

is_PK: 源表是否主键

is_nullable: 源表是否可空

incremental_column: 增量列,一般为业务时间字段

target_table: 目标表名

target_column: 目标表列

extra_column_expression: 扩展列表达式,可以在源表多个列的基础上做sql表达式计算,例如 md5(concat_ws('', user_name, .. , user_address)),结果作为新列插入目标列,这时对应的源列为空值。