流批一体DataSource_FlinkKafkaConsumer实战-【官方】百战程序员_IT在线教育培训机构

订阅的主题：topic，一个Topic名称或一个列表（多个Topic）
反序列化规则：DeserializationSchema / KafkaDeserializationSchema
消费者属性:
1. 集群地址："bootstrap.servers" -> "node1:9092,node2:9092,node3:9092"
2. 消费者组id(如果不设置，会有默认的，但是默认的不方便管理)：group.id

当从Kafka消费数据时，需要指定反序列化实现类：将Kafka读取二进制数据，转换为String对象。


xxxxxxxxxx
package com.itbaizhan.flink.scala.source

import org.apache.flink.api.common.serialization.SimpleStringSchema
import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer
import org.apache.kafka.common.serialization.StringDeserializer

import java.util.Properties

object FlinkKafkaConsumerDemo {
  def main(args: Array[String]): Unit = {
    //构建环境对象
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    //设置并行度 推荐设置主题的分区相同
    env.setParallelism(3)
    //kafka参数配置
    val prop = new Properties()
    //设置brokers地址
    prop.setProperty("bootstrap.servers","node2:9092,node3:9092,node4:9092")
    //设置消费者组
    prop.setProperty("group.id","flinkgroup1")
    //添加隐式转换
    import org.apache.flink.streaming.api.scala._
    //读取kafka中的数据
    val dataDS: DataStream[String] = env.addSource(
      new FlinkKafkaConsumer[String]("flink-topic1", new SimpleStringSchema(), prop))
    //输出
    //dataDS.print()
    dataDS.flatMap(_.split("\\s+"))
      .map((_,1))
      .keyBy(_._1)
      .sum(1)
      .print()
    //触发执行
    env.execute("FlinkKafkaConsumerDemo")
  }
}

流批一体DataSource_KafkaConnector 流批一体DataSource_FlinkKafkaConsumer测试

北京市昌平区回龙观镇南店村综合商业楼2楼226室