目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

大数据全系列 教程

1869个小节阅读:467.3k

收藏
全部开发者教程

408考研

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(258)
赞(0)

机器位置信息日统计编码

  • 创建类com.itbaizhan.scala.musicproject.eds.machine.GenerateTwMacLocD.scala
  • 构建SparkSession对象、参数合法性判断、切换Hive命名空间
  • 首先使用过去30日的数据获取机器真正的经纬度,得到对象pre30DaysDataFrame:
  • 需要对所有用户对同一机器上报的相同经纬度信息进行去重,分组求和,并修改列的名称,然后得到 的数据注册为临时表TEMP_PRE30_MAC_LOC_INFO:
  • 根据不同用户上报数据,筛选出所有机器位置中每台机器出现次数最多的机器位置
  • 封装方法:根据经纬度信息调用高德API,获取对应的位置信息
描述字段名类型
机器IDMIDint(11)
纬度Xvarchar(14)
经度Yvarchar(14)
出现此时CNTint(11)

高德API转换得到:

逻辑模型名称机器位置信息日统计表数据类型
机器IDMIDint(11)
纬度Xvarchar(14)
经度Yvarchar(14)
出现次数CNTint(11)
地址ADDERvarchar(128)
省份PRVCvarchar(64)
城市CTYvarchar(64)
城市编码CTY_CDvarchar(12)
县区DISTRICTvarchar(64)
县区编码AD_CDvarchar(12)
乡镇街道TOWN_SHIPvarchar(64)
乡镇街道编码TOWN_CDvarchar(12)
社区名称NB_NMvarchar(64)
社区类型NB_TPvarchar(64)
建筑名称BD_NMvarchar(64)
建筑类型BD_TPvarchar(64)
道路名称STREETvarchar(64)
道路门牌号STREET_NBvarchar(64)
道路坐标STREET_LOCvarchar(64)
道路方位STREET_DRCTIONvarchar(64)
门牌地址到请求坐标的距离STREET_DSTANCEvarchar(64)
商圈信息BUS_INFOvarchar(128)
  • 调用封装的高德API的方法,获取对应的位置信息
  • 获取昨天 TW_MAC_LOC_D 机器位置信息日统计表中统计的所有机器的位置信息 并与今天统计的过去30天的机器位置信息做差集,找出30天前的机器位置信息,然后与今天统计的过去30天的机器位置信息做交集得到目前所有机器的位置信息
  • 将结果保存到EDS层表 TW_MAC_LOC_D 中。

配置分析日期为20301004执行程序

node4的hive客户端查询:

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2