Hadoop中如何进行数据可视化和报表生成？代码举例讲解

发表于2023年7月9日2023年6月11日作者 IT之美

在Hadoop中进行数据可视化和报表生成的主要方式是:

1、使用Pig/Hive进行简单的统计与汇总:

2、将统计结果存储在Hbase/Hive表中:

3、使用LUCENE为统计结果建立索引:

4、使用Zeppelin/Jupyter进行数据可视化:

5、 Zeppelin显示Hive表统计示例:

CREATE TABLE page_views 
(viewTime INT, userid BIGINT, 
   page_url STRING, referrer_url STRING) 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '\t';

SELECT page_url, count(*) as counts 
FROM page_views 
GROUP BY page_url 
ORDER BY counts DESC LIMIT 5

所以通过Hive进行统计与汇总,再使用Zeppelin将结果转化为图表,我们可以实现简单高效的数据可视化分析功能。