目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

大数据全系列 教程

1869个小节阅读:467k

收藏
全部开发者教程

408考研

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(245)
赞(0)

数仓模型设计

将业务需要用到的数据表通过Sqoop抽取到ODS层。根据业务我们在数仓中构建“用户主题”,具体数据分层如下:

以上各个表之间的数据流转关系如下:

在Hive中构建ODS层对应的表:

  1. TO_YCAK_USR_D:微信用户日全量表

    物理模型名称TO_YCAK_USR_DDATA_TYPECOMMENT
    逻辑模型名称微信用户全量表数据类型注释
    用户IDUIDint(11) 
    注册机器IDREG_MIDint(11) 
    性别GDRvarchar(1) 
    生日BIRTHDAYvarchar(16) 
    手机号码MSISDNvarchar(32) 
    地区IDLOC_IDint(11) 
    注册登录模式LOG_MDEint(1)1免费,2付费,默认为0
    注册时间REG_TMvarchar(32) 
    用户当前经验值USR_EXPvarchar(32) 
    累计积分SCOREint(11) 
    用户等级LEVELint(11) 
    微信IDWX_IDvarchar(32) 
  2. TO_YCAK_USR_ALI_D:支付宝用户日全量表

    物理模型名称TO_YCAK_USR_ALI_DDATA_TYPECOMMENT
    逻辑模型名称支付宝用户全量表数据类型注释
    用户IDUIDint(11) 
    注册机器IDREG_MIDint(11) 
    性别GDRvarchar(1) 
    生日BIRTHDAYvarchar(16) 
    手机号码MSISDNvarchar(32) 
    地区IDLOC_IDint(11) 
    注册登录模式LOG_MDEint(1)1免费,2付费,默认为0
    注册时间REG_TMvarchar(32) 
    用户当前经验值USR_EXPvarchar(32) 
    累计积分SCOREint(11) 
    用户等级LEVELint(11) 
    用户类型,1公司账户,2个人账户USR_TYPEvarchar(64)用户类型,1公司账户,2个人账户
    实名认证IS_CERTvarchar(1)T通过,已实名 F未实名
    是否学生IS_STDNTvarchar(1)T是,F不是
    支付宝IDALY_IDvarchar(64) 
  3. TO_YCAK_USR_QQ_D: QQ用户日全量表

    物理模型名称TO_YCAK_USR_QQ_DDATA_TYPECOMMENT
    逻辑模型名称QQ用户日全量表数据类型注释
    用户IDUIDint(11) 
    注册机器IDREG_MIDint(11) 
    性别GDRvarchar(1) 
    生日BIRTHDAYvarchar(16) 
    手机号码MSISDNvarchar(32) 
    地区IDLOC_IDint(11) 
    注册登录模式LOG_MDEint(1)1免费,2付费,默认为0
    注册时间REG_TMvarchar(32) 
    用户当前经验值USR_EXPvarchar(32) 
    累计积分SCOREint(11) 
    用户等级LEVELint(11) 
    QQIDQQIDvarchar(64) 
  4. TO_YCAK_USR_APP_D :APP用户信息日全量表

    物理模型名称TO_YCAK_USR_APP_DDATA_TYPE
    逻辑模型名称APP用户信息日全量表数据类型
    用户IDUIDint(11)
    注册机器IDREG_MIDint(11)
    性别GDRvarchar(1)
    生日BIRTHDAYvarchar(16)
    手机号码MSISDNvarchar(32)
    地区IDLOC_IDint(11)
    注册时间REG_TMvarchar(32)
    用户当前经验值USR_EXPvarchar(32)
    用户等级LEVELint(11)
    用户在app系统的idAPP_IDvarchar(32)
  5. TO_YCAK_USR_LOGIN_D : 用户登录数据日增量表

    物理模型名称TO_YCAK_USR_LOGIN_DDATA_TYPECOMMENT
    逻辑模型名称用户登录数据表日增量数据类型注释
    自增唯一主键IDint自增唯一主键
    用户IDUIDint用户ID
    机器IDMIDint机器ID
    登录时间LOGIN_TMdatetime登录时间
    登出时间LOGOUT_TMdatetime登出时间,默认值0000-00-00 00:00:00
    登录模式MODE_TYPEint玩家登录模式1为免费2为付费默认为0
    数据日期data_dtvarchar(32)分区字段
  6. TW_USR_BASEINFO_D :活跃用户基础信息日增量表

    物理模型名称TW_USR_BASEINFO_DDATA_TYPECOMMENT
    逻辑模型名称活跃用户基础信息日增量表数据类型注释
    用户IDUIDint(11) 
    注册机器IDREG_MIDint(11) 
    注册渠道REG_CHNLvarchar(1)0:未知,1:微信,2:支付宝,3:QQ,4:APP
    渠道IDREF_UIDvarchar(1) 
    性别GDRvarchar(1)1:男,2:女,0:不明
    生日BIRTHDAYvarchar(16) 
    手机号码MSISDNvarchar(32) 
    地区IDLOC_IDint(11) 
    注册登录模式LOG_MDEvarchar(1)1免费,2付费,默认为0
    注册日期REG_DTvarchar(32) 
    注册时间REG_TMvarchar(32) 
    用户当前经验值USR_EXPvarchar(32) 
    累计积分SCOREint(11) 
    用户等级LEVELint(11) 
    用户类型,1公司账户,2个人账户USR_TYPEvarchar(64)用户类型,1公司账户,2个人账户
    实名认证IS_CERTvarchar(1)T通过,已实名 F未实名
    是否学生IS_STDNTvarchar(1)T是,F不是
    数据日期data_dtvarchar(32)分区字段

以上表模型中,最终获取7日用户活跃信息从EDS层TW_USR_BASEINFO_D表统计得到,这里将统计到的7日活跃用户情况存放在DM层,这里通过SparkSQL直接将结果存放在user_7days_active表中,提供查询展示。

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2