SparkStreaming_整合Kafka模式-【官方】百战程序员_IT在线教育培训机构

Receiver模式原理图(已经过时，了解即可)
Direct模式原理图
Driect模式就是将kafka看成存数据的一方，这种模式没有采用Receiver接收器模式，而是采用直连的方式，不是被动接收数据，而是主动去取数据，在处理每批次时会根据offset位置向Kafka中获取数据。
消费者偏移量也不是用zookeeper来管理，而是使用Spark自己进行消费者偏移量的维护，如果没有设置checkpoint机制，消费偏移量默认是存在内存中，如果设置了checkpoint目录，那么消费偏移量也会保存在checkpoint中。
Direct模式底层读取Kafka数据实现是Simple Consumer api实现，这种api提供了从每批次数据中获取offset的接口，所以对于精准消费数据的场景，可以使用Direct 模式手动维护offset方式来实现数据精准消费。

Direct模式并行度设置

Direct模式的并行度与当前读取的topic的partition个数一致，所以Direct模式并行度由读取的kafka中topic的partition数决定的。

实时效果反馈

1. 关于SparkStreaming整合Kafka的Direct模式的描述，错误的是：

A Driect模式就是将kafka看成存数据的一方，这种模式没有采用Receiver接收器模式，而是采用直连的方式。

B Driect模式中Spark不是被动接收数据，而是主动去取数据，在处理每批次时会根据offset位置向Kafka中获取数据。

C 消费者偏移量也不是用zookeeper来管理，而是使用Spark自己进行消费者偏移量的维护，如果没有设置checkpoint机制，消费偏移量默认是存在内存中，如果设置了 checkpoint目录，那么消费偏移量也会保存在checkpoint中。

D SparkStreaming整合Kafka的Receiver模式比Direct模式更好用，更流行。

答案：

1=>D

北京市昌平区回龙观镇南店村综合商业楼2楼226室