2021年大数据Hive(六):Hive的表生成函数

时间:2021-6-19 作者:admin

全网最详细的Hive文章系列,强烈建议收藏加关注!

后面更新文章都会列出历史文章目录,帮助大家回顾知识重点。

系列历史文章

2021年大数据Hive(五):Hive的内置函数(数学、字符串、日期、条件、转换、行转列)
2021年大数据Hive(四):Hive查询语法
2021年大数据Hive(三):手把手教你如何吃透Hive数据库和表操作(学会秒变数仓大佬)
2021年大数据Hive(二):Hive的三种安装模式和MySQL搭配使用
2021年大数据Hive(一):Hive基本概念

前言

2021年全网最详细的大数据笔记,轻松带你从入门到精通,该栏目每天更新,汇总知识分享
2021年大数据Hive(六):Hive的表生成函数

Hive的表生成函数

一、explode函数

explode(col):将hive一列中复杂的array或者map结构拆分成多行。
explode(ARRAY) 数组的每个元素生成一行
explode(MAP) map中每个key-value对,生成一行,key为一列,value为一列

数据:

10 CLARK|KING|MILLER
20 SMITH|JONES|SCOTT|ADAMS|FORD
30 ALLEN|WARD|MARTIN|BLAKE|TURNER|JAMES

建表:

create table emp2(
deptno int,
names array<string>
)
row format delimited fields terminated by '\t'
collection items terminated by '|';

插入数据

load data local inpath '/export/data/hivedatas/emp2.txt' into table emp2;

查询数据

select * from emp;

2021年大数据Hive(六):Hive的表生成函数

使用expload查询

select explode(names) as name from emp;

2021年大数据Hive(六):Hive的表生成函数

二、LATERAL VIEW侧视图

LATERAL VIEW
用法:LATERAL VIEW udtf(expression) tableAlias AS columnAlias
解释:用于和split, explode等UDTF一起使用,它能够将一列数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合。

列转行

select deptno,name from emp2 lateral view explode(names) tmp_tb as name;

2021年大数据Hive(六):Hive的表生成函数

三、Reflect函数

reflect函数可以支持在sql中调用java中的自带函数

1、使用java.lang.Math当中的Max求两列中最大值

创建hive表

create table test_udf(col1 int,col2 int) row format delimited fields terminated by ',';

–准备数据 test_udf.txt

1,2
4,3
6,4
7,5
5,6

–加载数据

load data local inpath '/export/data/hivedatas/test_udf.txt'  into table test_udf;

–使用java.lang.Math当中的Max求两列当中的最大值

select reflect("java.lang.Math","max",col1,col2) from test_udf;

本博客大数据系列文章会一直每天更新,记得收藏加关注喔~

声明:本文内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。