本文主要给大家展示“Hive高阶聚合函数的用法示例”,简单易懂,组织清晰,希望能帮你解决疑惑。让边肖带领你学习“Hive高阶聚合函数用法示例”一文。
如果需要做一些多维度的索引统计,我们通常会选择olap引擎,比如kylin等。如果数据量比较大,但是如果数据量不大也可以实现hive。
创建表wedw_tmp.hive_function_test_df
(
省名字符串注释'省名'
,city_name字符串注释“城市名称”
,area_name字符串注释'区域名称'
,people_cnt int注释'人口数量'
,amt十进制(16,2)注释'国内生产总值'
)
以“,”结尾的行格式分隔字段
广东,广州,白云区,100,30
广州市番禺区120,45
广东,深圳,福田区,200,67
广东深圳南山区29.01万
浙江杭州萧山区80,20
浙江,杭州,滨江区,120,50
浙江,宁波,江东区,80,23
浙江,宁波,江北区,45,5
从wedw_tmp.hive_function_test_df中选择*;
一个带立方体
挑选
省名
,城市名
,区域名称
,sum(people_cnt)为all_people_cnt
从
wedw_tmp .蜂巢_函数_测试_df
分组依据
省名
,城市名
,区域名称
带立方体
;
两个分组集
挑选
省名
,城市名
,区域名称
,sum(people_cnt)为all_people_cnt
从
wedw_tmp .蜂巢_函数_测试_df
分组依据
省名
,城市名
,区域名称
分组集((),(省名),(省名,市名))
;
三个带汇总
挑选
省名
,城市名
,区域名称
,sum(people_cnt)为all_people_cnt
从
wedw_tmp .蜂巢_函数_测试_df
分组依据
省名
,城市名
,区域名称
带汇总
;
这就是文章“Hive高阶聚合函数的用法示例”的全部内容。感谢您的阅读!相信大家都有一定的了解,希望分享的内容对大家有所帮助。想了解更多知识,请关注行业资讯频道!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/141704.html