流批一体DataSource_Kafka数据源Offset扩展-【官方】百战程序员_IT在线教育培训机构

setStartFromGroupOffsets：
- 从groupId上次消费数据记录开始消费，将上次消费偏移量存储在topic__consumer_offsets；
- 如果消费组是第一次消费数据，从最大偏移量开始消费。
setStartFromEarliest：从最小偏移量消费数据
setStartFromLatest：从最大偏移量消费数据
setStartFromTimestamp：消费每条数据时间戳大于指定时间戳
setStartFromSpecificOffsets：从指定偏移量开始消费数据，偏移量值大于设置偏移量

代码演示：


xxxxxxxxxx
package com.itbaizhan.flink.scala.source

import org.apache.flink.api.common.serialization.SimpleStringSchema
import org.apache.flink.streaming.api.scala.StreamExecutionEnvironment
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer
import org.apache.flink.streaming.connectors.kafka.internals.KafkaTopicPartition

import java.lang
import java.util.Properties

object FlinkKafkaConsumerOffsetDemo {
  def main(args: Array[String]): Unit = {
    //构建环境对象
    val env = StreamExecutionEnvironment.getExecutionEnvironment
    //设置并行度 推荐设置主题的分区相同
    env.setParallelism(3)
    //配置kafka链接的参数
    val prop = new Properties()
    prop.setProperty("bootstrap.servers","node2:9092,node3:9092,node4:9092")
    prop.setProperty("group.id","flinkgroup1")
    //构建FlinkKafkaConsumer对象
    val kafkaConsumer = new FlinkKafkaConsumer[String]("flink-topic1", new SimpleStringSchema(), prop)
    //TODO 1.Flink从topic中现存的数据里最小位置开始消费
    //kafkaConsumer.setStartFromEarliest()
    //TODO 2.Flink从topic中最新的数据开始消费
    //kafkaConsumer.setStartFromLatest()
    //TODO 3.Flink从topic中指定group上次消费的位置开始消费，必须配置group.id参数
    //kafkaConsumer.setStartFromGroupOffsets()
    //TODO 4.Flink从topic中指定时间戳
    //kafkaConsumer.setStartFromTimestamp(1671609649341L)
    //TODO 5.Flink从topic的分区指定具体的偏移量
    val offsets = new java.util.HashMap[KafkaTopicPartition, java.lang.Long]()
    offsets.put(new KafkaTopicPartition("flink-topic1",0),2L)
    offsets.put(new KafkaTopicPartition("flink-topic1",1),3L)
    offsets.put(new KafkaTopicPartition("flink-topic1",2),2L)
    //勿忘我
    kafkaConsumer.setStartFromSpecificOffsets(offsets)

    import org.apache.flink.streaming.api.scala._
    //添加kafka源
    val dataDS = env.addSource(kafkaConsumer)
    //输出
    dataDS.print()
    //触发执行
    env.execute("FlinkKafkaConsumerOffsetDemo")
  }
}

注意：上面所设置消费偏移量位置，表示不考虑流式程序从Checkpoint检查点或保存点SavePoint恢复。

Offset Explorer 2扩展：

下载网址：https://www.kafkatool.com/download.html

配置网址：https://blog.csdn.net/m0_67401660/article/details/126061426

流批一体DataSource_Kafka数据源Offset 流批一体DataSource_KafkaSource

北京市昌平区回龙观镇南店村综合商业楼2楼226室