转载:hive清空外部表的三种方式

    科技2022-07-11  77

    原始链接:https://blog.csdn.net/lixiaoksi/article/details/106919895

     

     

    hive清空外部表的三种方式

     

    本文总结hive中清空外部表的三种方式

    hive版本:2.1.1

    环境准备

    新建一张外部表:

    create external  table test_external (name String,age int,sex String) stored as orc;

    插入数据:

    insert into table test_external values("johnson",18,"男");

    查看数据:

    如果此时使用truncate 命令的话,会抛出错误信息 FAILED: SemanticException [Error 10146]: Cannot truncate non-managed table test_external.

    那如果在实际场景中,需要去清空外部表,我们该怎么办呢?

    方式一:将外部表文件所在目录指定成一个空的目录

    alter table test_external set location 'hdfs://bd227:8020/opt/hive/warehouse/test_external_like';

    注:此方式并没有清空外部表之前所指定路径下的文件。

    方式二:使用命令 set TBLPROPERTIES('EXTERNAL'='false')  将外部表变为内部表后,执行truncate命令,然后再更改为外部表

    1:alter table test_external  set TBLPROPERTIES('EXTERNAL'='false');

    此时查看建表语句,external关键字已不存在,说明已变成了受hive meta store 管理的内部表

    2:truncate table test_external;

    执行truncate 命令,将表清空,查看hdfs上对应表的路径下,文件也一并被清空

    3:alter table test_external  set TBLPROPERTIES('EXTERNAL'='true');

    将表属性更改为外部表 set TBLPROPERTIES('EXTERNAL'='true') 

    方式三:使用 insert overwrite 语句代替实现 truncate 功能

    1:新建一张临时表 test_external_temp; 该表结构与外部表的表结构一样。

     create temporary table  test_external_temp (name String,age int,sex String) stored as orc;

    注意:该临时表只对当前会话有效。倘若你创建了临时表,重新打开一个hive cli,此时你找不到这张表

    2:执行 insert overwrite table test_external select * from test_external_temp; 使用overwrite 关键字执行了清空表操作

     

    补充:根据官网描述 

    Starting Hive 4.0.0 ( HIVE-19981 - Managed tables converted to external tables by the HiveStrictManagedMigration utility should be set to delete data when the table is dropped RESOLVED  ) setting table property external.table.purge=true, will also delete the data.   

    Hive 4.0.0开始,亦可使用 external.table.purge=true 也可清空表数据。

    到底使用什么方式去清空外部表,还需根据实际场景去选择,如果还有其他方法,还请大家留言补充。

    Processed: 0.064, SQL: 8