常用函数
当进行大数据分析时,SQL中的函数非常丰富,以下是更详细的展开:
-
窗口函数 (Window Functions):
ROW_NUMBER()
: 为结果集中的每一行分配一个唯一的整数,用于排序。RANK()
: 为结果集中的每一行分配一个排名,相同值会有相同的排名,但会跳过相同排名数量。DENSE_RANK()
: 为结果集中的每一行分配一个密集排名,相同值会有相同的排名,但不会跳过相同排名数量。LAG(column, n)
: 返回结果集中当前行之前第 n 行的值。LEAD(column, n)
: 返回结果集中当前行之后第 n 行的值。OVER(PARTITION BY column ORDER BY column)
: 与窗口函数一起使用,定义窗口规范,通过指定分区和排序方式。
-
聚合函数 (Aggregate Functions):
COUNT(column)
或COUNT(*)
: 计算行数或满足条件的行数。SUM(column)
: 对指定列进行求和。AVG(column)
: 计算平均值。MIN(column)
和MAX(column)
: 分别获取最小值和最大值。
-
日期和时间函数:
DATE_A