目录
百战程序员,全站22050+开发课程+文档 ,学习精选优质好课快人一步!观看视频 快捷键ALT+N

大数据全系列 教程

1869个小节阅读:467.8k

收藏
全部开发者教程

408考研

JAVA全系列 教程

面向对象的程序设计语言

Python全系列 教程

Python3.x版本,未来主流的版本

人工智能 教程

顺势而为,AI创新未来

大厂算法 教程

算法,程序员自我提升必经之路

C++ 教程

一门通用计算机编程语言

微服务 教程

目前业界流行的框架组合

web前端全系列 教程

通向WEB技术世界的钥匙

大数据全系列 教程

站在云端操控万千数据

AIGC全能工具班

A

A A

White Night

阅读(266)
赞(0)

3.8 内部表与外部表

(1) Hive 内部表

删除表时,元数据与数据都会被删除

Table Type: MANAGED_TABLE 内部表

(2) Hive 外部表

删除外部表只删除metastore的元数据,不删除hdfs中的表数据

Table Type: EXTERNAL_TABLE external

首先将person.txt文件上传到hdfs的/usr目录

建表脚本:

创建表:

查看表的信息:

查询表中数据:

内部表和外部表的区别:

1、创建表的时候,内部表直接存储在默认的hdfs路径(/user/hive_remote/warehouse),外部表需要自己指定路径

2、删除表的时候,内部表会将数据和元数据全部删除,外部表只删除元数据,数据不删除

外部表删除前:

在hive中删除表:

再次检查元数据

查看hdfs对应的目录和文件还存在:

结论删除外部表时,元数据被删除;表对应的路径下的数据文件还存在。

删除内部表演示:

删除前:

从另外一个维度查看:

查看元数据:

在hive中将表person2_2删除:

查看元数据:

查看hdfs上文件:

查看hdfs对应的目录和文件不存在。

结论:删除内部表时元数据和表对应目录以及目录下数据文件都被删除了。

注意:hive:读时检查(实现解耦,提高数据加载的效率)

关系型数据库:写时检查

演示:

 

北京市昌平区回龙观镇南店村综合商业楼2楼226室

©2014-2023 百战卓越(北京)科技有限公司 All Rights Reserved.

京ICP备14032124号-2