【1.查询至少连续3天下单的用户】
思路1(使用lead):
- distinct user_id,create_date去重,确保每个用户每天只有一条访问记录
- lead(create_date,2,‘9999-12-31’) over(partition by user_id order by create_date)根据用户分区,订单日期排序,取后2行的订单日期(取不到则返回’9999-12-31’)
- 用datediff计算【订单日期】与【后2行订单日期】的差值,如果等于2则说明存在连续3天下单
- 筛选出datediff等于2的记录,distinct user_id即可
思路2(使用row_number):
- distinct user_id,create_date去重,确保每个用户每天只有一条访问记录
- row_number() over(partition by user_id order by create_date)按用户分区,按访问日期排序,添加序号
- 每个日期与序号相减获得一个新的日期
- group by user_id,diff对用户和新的日期进行分组,然后count()统计日期,判断count() >=3
【2. 用户登录日志表user_id,visit_date 用sql查询出近30天连续访问7天以上的用户数量】
思路:
- 筛选近30天每个用户的访问记录,并去重确保同一个用户当天只有一条记录
- 对用户分组按访问日期排序,添加序号
- 每条记录的访问日期与对应的序号相减,获得一个新的日期字段
- group by用户,新的日期字段,统计个数,having筛选大于等于7
select user_id,diff,count(*) as cnt
from
(
select
user_id,
visit_date,
date_sub(visit_date,row_number() over(partition by user_id order by visit_date)) as diff
from
(
select distinct user_id,visit_date
from table
where visit_date >= date_sub(current_date,30)
) t1
) t2
group by user_id,diff
having cnt >= 7