Hive函数

    科技2022-07-17  111

    文章目录

    1.查看函数2.函数的分类按函数的来源:按函数的特征: 常用函数常用日期函数常用取整函数集合操作

    1.查看函数

    函数有库的概念,系统提供的除外,系统提供的函数可以在任意库使用!查看当前库所有的函数:show functions;查看函数的使用: desc function 函数名查看函数的详细使用: desc function extended 函数名

    2.函数的分类

    按函数的来源:

    ①系统函数,自带的,直接使用即可②用户自定义的函数。 a)遵守hive函数类的要求,自定义一个函数类 b)打包函数,放入到hive的lib目录下,或在HIVE_HOME/auxlib,auxlib用来存放hive可以加载的第三方jar包的目录 c)创建一个函数,让这个函数和之前编写的类关联函数有库的概念 d)使用函数

    按函数的特征:

    ①UDF: 用户定义的函数。 一进一出。 输入单个参数,返回单个结果!比如:cast(‘a’ as int) 返回 null②UDTF: 用户定义的表生成函数。 一进多出。传入一个参数(集合类型),返回一个结果集!③UDAF: 用户定义的聚集函数。 多进一出。 传入一列多行的数据,返回一个结果(一列一行) 。比如:count(),avg(),sum()

    常用函数

    常用日期函数

    hive默认解析的日期必须是: 2019-11-24 08:09:10 unix_timestamp:返回当前或指定时间的时间戳 from_unixtime:将时间戳转为日期格式 current_date:当前日期 current_timestamp:当前的日期加时间 to_date:抽取日期部分 year:获取年 month:获取月 day:获取日 hour:获取时 minute:获取分 second:获取秒 weekofyear:当前时间是一年中的第几周 dayofmonth:当前时间是一个月中的第几天 months_between: 两个日期间的月份,前-后 add_months:日期加减月 datediff:两个日期相差的天数,前-后 date_add:日期加天数 date_sub:日期减天数 last_day:日期的当月的最后一天

    date_format格式化日期 date_format( 2019-11-24 08:09:10,‘yyyy-MM’) mn

    常用取整函数

    round: 四舍五入 ceil: 向上取整 floor: 向下取整

    常用字符串操作函数 upper: 转大写 lower: 转小写 length: 长度 trim: 前后去空格 lpad: 向左补齐,到指定长度 rpad: 向右补齐,到指定长度 regexp_replace: SELECT regexp_replace(‘100-200’, ‘(\d+)’, ‘num’)='num-num 使用正则表达式匹配目标字符串,匹配成功后替换!

    集合操作

    size: 集合(map和list)中元素的个数 map_keys: 返回map中的key map_values: 返回map中的value array_contains: 判断array中是否包含某个元素 sort_array: 将array中的元素排序

    Processed: 0.011, SQL: 8