【MySQL】MySQL版本8+ 窗口函数 Lead 的两种使用

发布时间:2024年01月10日

力扣题

1、题目地址

1709. 访问日期之间最大的空档期

2、模拟表

表:UserVisits

Column NameType
user_idint
visit_datedate
  • 该表没有主键,它可能有重复的行
  • 该表包含用户访问某特定零售商的日期日志。

3、要求

假设今天的日期是 ‘2021-1-1’ 。

编写解决方案,对于每个 user_id ,求出每次访问及其下一个访问(若该次访问是最后一次,则为今天)之间最大的空档期天数 window 。

返回结果表,按用户编号 user_id 排序。

结果格式如下示例所示:

示例 1:

输入:
UserVisits 表:

user_idvisit_date
12020-11-28
12020-10-20
12020-12-3
22020-10-5
22020-12-9
32020-11-11

输出:

user_idbiggest_window
139
265
351

解释:

对于第一个用户,问题中的空档期在以下日期之间:

  • 2020-10-20 至 2020-11-28 ,共计 39 天。
  • 2020-11-28 至 2020-12-3 ,共计 5 天。
  • 2020-12-3 至 2021-1-1 ,共计 29 天。

由此得出,最大的空档期为 39 天。
对于第二个用户,问题中的空档期在以下日期之间:

  • 2020-10-5 至 2020-12-9 ,共计 65 天。
  • 2020-12-9 至 2021-1-1 ,共计 23 天。

由此得出,最大的空档期为 65 天。
对于第三个用户,问题中的唯一空档期在 2020-11-11 至 2021-1-1 之间,共计 51 天。

4、代码编写

Lead (列名) 语法

SELECT user_id, MAX(biggest_window) AS biggest_window
FROM (
    SELECT *, DATEDIFF(
    	IFNULL(
    		Lead(visit_date) over (partition by user_id order by visit_date), 
    		'2021-1-1'
    	), visit_date
    ) AS biggest_window
    FROM UserVisits
) AS one
GROUP BY user_id

如果加 IFNULL

SELECT *, DATEDIFF(
	IFNULL(
		Lead(visit_date) over (partition by user_id order by visit_date), 
		'2021-1-1'
	), visit_date
) AS biggest_window
FROM UserVisits
| user_id | visit_date | biggest_window |
| ------- | ---------- | -------------- |
| 1       | 2020-10-20 | 39             |
| 1       | 2020-11-28 | 5              |
| 1       | 2020-12-03 | 29             |
| 2       | 2020-10-05 | 65             |
| 2       | 2020-12-09 | 23             |
| 3       | 2020-11-11 | 51             |

如果不加 IFNULL,还需要特别处理

SELECT *, DATEDIFF(
    Lead(visit_date) over (partition by user_id order by visit_date),  
    visit_date
) AS biggest_window
FROM UserVisits
| user_id | visit_date | biggest_window |
| ------- | ---------- | -------------- |
| 1       | 2020-10-20 | 39             |
| 1       | 2020-11-28 | 5              |
| 1       | 2020-12-03 | null           |
| 2       | 2020-10-05 | 65             |
| 2       | 2020-12-09 | null           |
| 3       | 2020-11-11 | null           |

Lead (列名, 偏移量, 超出记录窗口时的默认值) 语法

SELECT user_id, MAX(biggest_window) AS biggest_window
FROM (
    SELECT *, DATEDIFF(
    	Lead(visit_date, 1, '2021-01-01') over (partition by user_id order by visit_date), 
    	visit_date
    ) AS biggest_window
    FROM UserVisits
) AS one
GROUP BY user_id
文章来源:https://blog.csdn.net/weixin_50223520/article/details/135508708
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。