导言
本文将快速讲解workflow的基本用法,包括
- 变量
- 临时表
- 控制流 workflow_spec.sql
- step读写数据
- 数据源
- 扩展
- UDF
- Transformer
- 自定义数据源
本文将具体展开日志驱动的实现逻辑和细节
本文将从混沌工程在数据工程领域的遐想来引入“日志驱动”的必要性。
本文将从以下几个维度展开Sharp ETL的数据工程化实践:
本文结合目前的数据工程实践,尝试展开数据工程实践中ETL的原则,并对Sharp ETL做简要介绍。
ETL或ELT是进行数据处理的常见手段之一,随着数据平台渡过蛮荒时代开始精细化治理,原始的编码方式和无组织的SQL脚本已经不能满足需求。我们将会通过展开现有ETL在当前遇到的困境来引入Sharp ETL的独有但必不可缺的功能。