目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

大数据全系列 教程

1869个小节阅读:465.7k

收藏
全部开发者教程

408考研

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(284)
赞(0)

Azkaban配置任务流

使用Azkaban来配置任务流进行任务调度。

node1node2node3node4
 ZKZKZK
NameNodeNameNodeRMRM
 DataNode/NMDataNode/NMDataNode/NM
MySQL HiveHive_Client
Flume Sqoop 
SparkSparkSpark 
AzkabanAzkabanAzkabanSuperset
  • 集群中提交任务,需要修改项目中的application.conf文件配置项:local.run="false"

  • 并将项目打包MusicProject-1.0-SNAPSHOT-jar-with-dependencies.jar,并上传到node3。

  • 确保在Hive中创建各个ODS层表及EDS层表

  • 编写执行第一个job的脚本

    内容如下:

  • 准备抽取mysql数据的sqoop脚本(node3上安装了sqoop)

    内容如下:

  • mysql数据抽取数据到Hive ODS脚本2extract_mysqldata_to_ods.sh

    内容如下:

  • 清洗歌库歌曲表脚本

    内容如下:

  • 生成歌曲特征日统计表脚本 4produce_tw_song_ftur_d.sh

    内容如下:

  • 生成歌曲热度表脚本 5produce_tw_song_rsi_d.sh

    内容如下:

  • 生成歌手热度表脚本 6produce_tw_singer_rsi_d.sh

    内容如下:

  • 启动Azkaban

    启动exec server

    扩展:关闭命令bin/shutdown-exec.sh

    激活Executor

    1. http://node1:12345/executor?action=activate

    2. http://node2:12345/executor?action=activate

    3. http://node3:12345/executor?action=activate

    【温馨提示】重启Azkaban Executor Server得重新激活

    启动 web server

    测试访问http://node2:8081/,并用azkaban用户登录

  • 编写azkaban 各个job组成任务流:

    1. 创建req1文件夹

    2. 在文件中创建azkaban.project

    3. 在文件中创建basic.flow

  • 压缩两个文件为req1.zip

  • azkaban创建项目,将req1.zip上传到项目,并配置参数

  • 继续执行

  • 检查相关表中的数据。

 

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2