大数据全系列 教程
1869个小节阅读:467.2k
目录
408考研
JAVA全系列 教程
面向对象的程序设计语言
Python全系列 教程
Python3.x版本,未来主流的版本
人工智能 教程
顺势而为,AI创新未来
大厂算法 教程
算法,程序员自我提升必经之路
C++ 教程
一门通用计算机编程语言
微服务 教程
目前业界流行的框架组合
web前端全系列 教程
通向WEB技术世界的钥匙
大数据全系列 教程
站在云端操控万千数据
AIGC全能工具班
A A
White Night
##五、Protocol Bufffer压缩
###5.1 问题引入
对hbase的文件做解析
浏览器HDFS文件系统:
/hbase_ha/data/itbaizhan/phone_log/a8e1214096c27c921b7302e9e45d908e/basic
如果没有文件的话,需要hbase客户端执行命令:flush 'itbaizhan:phone_log'
hbase hfile -p -f HDFS_PATH(hbase数据文件的hdfs路径)
xxxxxxxxxx
[root@node4 ~]# hbase hfile -p -f /hbase_ha/data/itbaizhan/phone_log/5c74a6d9d6537dca70cc55373d450614/basic/d8da359c1aa942b6aa51ea22c817319b
K:15884065159_92233695122010238071675/basic:date/1639038415245/Put/vlen=19/seqid=5 V: 2050-01-01 20:42:32
K:15884065159_92233695122010238071675/basic:dnum/1639038415245/Put/vlen=11/seqid=5 V: 19990119533
K:15884065159_92233695122010238071675/basic:length/1639038415245/Put/vlen=4/seqid=5 V: \x00\x00\x00\x86
K:15884065159_92233695122010238071675/basic:type/1639038415245/Put/vlen=4/seqid=5 V: \x00\x00\x00\x00
Scanned kv count -> 40000
发现rowkey、列族名称被重复保存了多次,如何解决呢?