目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

大数据全系列 教程

1869个小节阅读:467.2k

收藏
全部开发者教程

408考研

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(260)
赞(0)

1.2.5 Region

  1. HBase自动把表水平划分成多个区域(region),每个region会保存一个表里面某段连续的数据 (每条记录都有一个行键,按照行键字典序排列)
  2. 每个表一开始只有一个region,随着数据不断插入表,region不断增大,当增大到一个阈值的时候,region就会等分为两个新的region(裂变)
  3. 当table中的行不断增多,就会有越来越多的region。这样一张完整的表被保存在多个Regionserver 上。
  4. 一个region由一个或多个store组成,在一个region内部一个store对应一个CF(列族)
  5. HRegion是HBase中分布式存储和负载均衡的最小单元。最小单元就表示不同的HRegion可以分布在不同的 HRegion server上。HRegion由一个或者多个Store组成,每个store保存一个columns family。每个Store又由一个memStore和0至多个StoreFile组成。如图:StoreFile以HFile格式保存在HDFS上。

实时反馈

1. 关于HBase的Region描述,错误的是:

A HBase自动把表水平划分成多个区域(region),每个region会保存一个表里面某段连续的数据。

B 一个region由一个或多个store组成,在一个region内部一个store对应一个CF(列族)。

C Region是HBase中分布式存储和负载均衡的最小单元。

D 当一个表中的数据对应多个region时,它们必须出现在不同的regionserver上。

答案:

1.D

1.2.6 MemStore 与 StoreFile

  1. store包括位于内存中的memstore和位于磁盘的storefile。
  2. 写操作先写入memstore,当memstore中的数据达到某个阈值,hregionserver会启动flush进程写入storefile,每次写入形成单独的一个storefile。
  3. 当storefile文件的数量增长到一定阈值后,系统会进行合并(minor、major compaction),在合并过程中会进行版本合并和删除工作,形成更大的storefile
  4. 当一个region所有storefile的大小超过一定阈值后,会把当前的region分割为两个,并由hmaster分配到相应的regionserver服务器,实现负载均衡
  5. 客户端检索数据,先找blockcache(查询缓存),找不到再找memstore,还找不到再去找storefile

实时反馈

1. 关于HBase的MemStore 与StoreFile描述,错误的是:

A store包括位于内存中的memstore和位于磁盘的storefile。

B 写操作先写入memstore,当memstore中的数据达到某个阈值,hregionserver会启动flush进程写入storefile,每次写入形成单独的一个storefile。

C 当storefile文件的数量增长到一定阈值后,系统会进行Region拆分。

D 当一个region所有storefile的大小超过一定阈值后,会把当前的region分割为两个。

答案:

1.C

 

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2