虚拟车站_Spark SQL读取HBase订单数据-【官方】百战程序员_IT在线教育培训机构


xxxxxxxxxx
      <dependency>
            <groupId>org.apache.hbase</groupId>
            <artifactId>hbase-mapreduce</artifactId>
            <exclusions>
                <exclusion>
                    <groupId>*</groupId>
                    <artifactId>*</artifactId>
                </exclusion>
            </exclusions>
        </dependency>

创建VirtualStationsProcessor


xxxxxxxxxx
object VirtualStationsProcessor {
    
}

创建SparkSession


xxxxxxxxxx
package com.itbaizhan.core

import com.itbaizhan.common.Constants
import org.apache.hadoop.conf.Configuration
import org.apache.hadoop.hbase.HBaseConfiguration
import org.apache.hadoop.hbase.client.Result
import org.apache.hadoop.hbase.io.ImmutableBytesWritable
import org.apache.hadoop.hbase.mapreduce.TableInputFormat
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.SparkSession

/**
 * 虚拟车站
 */
object VirtualStationsProcessor {

  def main(args: Array[String]): Unit = {

    // 1、SparkSession 是 spark sql的入口。
    val sparkSession = SparkSession.builder()
      .master("local[*]")
      .appName("VirtualStationsProcessor")
      .getOrCreate()


    // 2、获取Hbase链接
    val conf:Configuration = HBaseConfiguration.create()
    conf.set("hbase.zookeeper.quorum", "node2,node3,node4")
    conf.set("hbase.zookeeper.property.clientPort", "2181")
    // 3、读取HBase那个表
    conf.set(TableInputFormat.INPUT_TABLE, Constants.HTAB_HAIKOU_ORDER)

    // 4、读取表中数据RDD
    val hRDD:RDD[(ImmutableBytesWritable,Result)] = sparkSession.sparkContext.newAPIHadoopRDD(
      conf,
      classOf[TableInputFormat],
      classOf[ImmutableBytesWritable] , //HBASE  TABLE   rowkey  ImmutableBytesWritable = String
      classOf[Result] // V  result
    )

    // 5、 打印
    hRDD.foreach( result =>{
      println(result)
    })

  }

}

虚拟车站_储存订单数据至HBase 虚拟车站_创建订单数据的DataFrame

北京市昌平区回龙观镇南店村综合商业楼2楼226室