大数据全系列 教程
1869个小节阅读:467.6k
目录
408考研
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
bin/spark-shell执行
xxxxxxxxxx
[root@node1 ~]# spark-shell --master spark://node1:7077
# --master来连接到集群使用
测试代码:
xxxxxxxxxx
scala> sc.parallelize(Array(2,4,6)).map(_+ 1).collect()
[Stage 0:> (0
[Stage 0:===================> (1 [Stage 0:=======================================> (2 res0: Array[Int] = Array(3, 5, 7)
scala> # ctrl+c 终止退出
bin/spark-submit执行
xxxxxxxxxx
spark-submit --master spark://node1:7077 \
--class org.apache.spark.examples.SparkPi \
/opt/spark-3.2.1/examples/jars/spark-examples_2.12-3.2.1.jar 20
# --master来指定将任务提交到集群运行
[root@node1 ~]# spark-submit --master spark://node1:7077 \
> --class org.apache.spark.examples.SparkPi \
> /opt/spark-3.2.1/examples/jars/spark-examples_2.12-3.2.1.jar 20
Pi is roughly 3.1410715705357855
[root@node1 ~]#
执行流程
实时效果反馈
1. 以下关于Standalone运行模式的描述,正确的是:
A Worker不断向Master汇报资源情况
B Master接受请求,在Master节点启动Driver进程。
C Driver端发送task到worker节点上执行,worker将执行情况和执行结果返回给Driver端。
D 以上三个选项都正确
答案:
1=>D