目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

大数据全系列 教程

1869个小节阅读:465.8k

收藏
全部开发者教程

408考研

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(275)
赞(0)

运行模式_Yarn Client

Spark On YARN是有两种运行模式:

  1. Client模式
  2. Cluster模式

这两种模式的区别就是Driver运行的位置。

  1. Client模式即:Driver运行在客户端进程中, 比如Driver运行在spark-submit程序的进程中。一般用户开发和测试。
  2. Cluster模式即:Driver运行在YARN容器内部, 和ApplicationMaster在同一个容器内。一般用于生产环境。

提交原理图:

流程总结

  1. NodeManage不断的向ResourceManager汇报资源的使用情况
  2. 提交作业,Driver在任务提交的本地机器上运行
  3. Driver启动后会和ResourceManager通讯申请启动ApplicationMaster
  4. ResourceManager分配container,在合适的NodeManager上启动AM。
  5. AM负责向ResourceManager申请资源启动Executor
  6. ResourceManager接到ApplicationMaster的资源申请后会分配container,
  7. 然后ApplicationMaster在资源分配指定的NodeManager上启动Executor进程
  8. Executor进程启动后会向Driver反向注册,Executor全部注册完成后Driver开始执行main函数,之后执行到Action算子时,触发一个Job,并根据宽依赖开始划分stage,每个stage生成对应的TaskSet。
  9. 将task分发到各个Executor上执行,监控这些task,并回收结果。

常用提交命令:

或者:

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2