抱歉,您的浏览器无法访问本站

本页面需要浏览器支持(启用)JavaScript


了解详情 >

blaire

👩🏻‍💻ブレア🥣

image

1. Data Layer

image
No. Title Tech
1. 数据采集 flume, kafka, sqoop, logstach, datax
2. 数据存储 mysql, hdfs, hbase, redis, elastic, kudu, mongodb
3. 数据计算 hive, tez, spark, flink, storm
4. 数据查询 presto, kylin, impala, druid, clickhouse
5. 数据可视化 echarts, superset, quickbl, dataV
6. 任务调度 azkaban, airflow, Oozie
7. 集群监控 Zabbix
8. 元数据管理 Apache Atlas
9. 权限管理 Aapche Ranger

2. Data Layer Boundary

3. Topic

No. 主题名称 主题描述
1. 客户USR 个人, 商家,用户. 用户信息, 人行征信信息, 个人信息 如: 学历, 职业等
2. 产品PRD 分析服务相关的信息. 如信用卡还款,红包… 等等
3. 交易TRD 订单生命周期管理。 记录订单的创建、付款、成功、关闭。
4. 事件EVT 风险事件,运营活动,点击日志 等
5. 协议AGT 合约
6. 财务FIN 财务相关的分析。 如:银行备付金余额,个人账户可垫资的金额
7. 资金CAP 即客户的实体货币或者虚拟货币或者相关的等价物为中心得出的分析指标。 如:张三的账户余额、账户购买商品金额,账户支付金额、转账金额、资金流水分析等
8. 资产AST 用户的经营活动的过程中给其带来经济效益的资源,并以资产为中心分析相关信息. 资产可分为: 固定资产, 长期投资,虚拟资产。 固定资产: 房/车辆
9. 关系REL 客户行为往来等社会活动带来的影响分析. 如: 资金网络关系, 社交关系, 关系挖掘网络
10. 地址ADR 客户相关地址位置经纬度分析

4. Data Update

4.1 Data Life Cycle

Data Layer 表类型 表类型描述 生命周期管理规则
ODS/DM/ADS/DIM - - 不做处理
DWD _h 时全量 31days, 直到月末
_hh 时增量 366days
_d 天全量 31days, 直到月末
_dd 天增量 366days
(w)(m)(y) 周/月/年 7m / 24m

4.2 Data Type

Data Type Desc
STRING 字符串数据
BIGINT 长整型数据
DOUBLE 双精度型浮点数据

4.3 NULL

NVL(time, “9991231235959”)

NVL(date, “9991231”)

Reference

Comments