Hive中如何进行排序操作？代码举例讲解

在Hive中,我们可以使用以下方式进行排序操作:

SELECT * FROM employees ORDER BY salary ASC;

这会按salary字段升序排序查询结果。

SELECT * FROM employees SORT BY dept_id, salary DESC;

这会先按dept_id字段排序,再按salary降序排序。

SELECT * FROM employees 
DISTRIBUTE BY dept_id
SORT BY salary DESC;

这会先按dept_id分发到Reducer,然后每个Reducer只对自己的部分数据按salary降序排序。

CREATE TABLE employees
CLUSTERED BY dept_id 
AS ...;

SELECT * FROM employees WHERE dept_id = 10;

这会创建employees表,并按dept_id字段分类存储。当查询dept_id为10的行时,只需要扫描包含dept_id为10的文件,提高效率。