订单监控_Spark_Streaming整合Kafka_下-【官方】百战程序员_IT在线教育培训机构


xxxxxxxxxx
package com.itbaizhan.spark

import org.apache.kafka.clients.consumer.ConsumerRecord
import org.apache.kafka.common.serialization.StringDeserializer
import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.InputDStream
import org.apache.spark.streaming.kafka010.ConsumerStrategies.Subscribe
import org.apache.spark.streaming.kafka010.{ConsumerStrategies, KafkaUtils, LocationStrategies}
import org.apache.spark.streaming.kafka010.LocationStrategies.PreferConsistent
import org.apache.spark.streaming.{Seconds, StreamingContext}

object SparkStreamingAndKafka {

  def main(args: Array[String]): Unit = {

    // 1、sparkconf  使用本地模式运行 * 内部会自动计算cpu核数
    val conf = new SparkConf().setMaster("local[*]").setAppName("sparkstreamingkafa")
    // 2、创建steamingContext
    val sc = new StreamingContext(conf, Seconds(1))

    // 3、kafka配置
    val kafkaParams = Map[String, Object](
      // 指定broker地址清单
      "bootstrap.servers" -> "node2:9092,node3:9092,node4:9092",
      /*键的序列化器*/
      "key.deserializer" -> classOf[StringDeserializer],
      /*值的序列化器*/
      "value.deserializer" -> classOf[StringDeserializer],
      /*消费者所在分组的 ID*/
      "group.id" -> "test0002",
      /**
       * 改属性指定消费者在读取一个没有偏移量的分区或者偏移量无效的情况下怎么处理
       * latest: 在偏移量无效的情况下， 消费者从最新的记录开始读取数据
       * earliest: 在偏移量无效的情况下， 消费者从起始位置开始读取分区记录
       */

      "auto.offset.reset" -> "latest",
      /*是否自动提交*/
      "enable.auto.commit" -> (false: java.lang.Boolean)
    )
    //4、 指定topic
    val topics = Array("my_test")
    //5、 直接方式获取kafka分区数据。 从每个分区直接读取数据大大提供并行能力
    val stream:InputDStream[ConsumerRecord[String,String]] =  KafkaUtils.createDirectStream[String, String](
      sc,
      //位置策略
      PreferConsistent,
      // 订阅主题
      Subscribe[String,String](topics,kafkaParams)
    )

    // 打印实时流中数据条数
    stream.map(record => (record.key(),record.value())).print()


    // 启动sparkstreaming启动
    sc.start()
    // 等待优雅停止
    sc.awaitTermination()
  }

}

订单监控_Spark_Streaming整合Kafka_上订单监控_实时统计订单总数之消费订单数据

北京市昌平区回龙观镇南店村综合商业楼2楼226室