一、sql相关问题
1、sql中on和where的区别: join过程可以这样理解:首先两个表做一个笛卡尔积,on后面的条件是对这个笛卡尔积做一个过滤形成一张临时表,如果没有where就直接返回结果,如果有where就对上一步的临时表再进行过滤
- left join : 左连接,返回左表中所有的记录以及右表中连接字段相等的记录。
- right join : 右连接,返回右表中所有的记录以及左表中连接字段相等的记录。
- inner join : 内连接,又叫等值连接,只返回两个表中连接字段相等的行。
- full join : 外连接,返回两个表中的行:left join + right join。
cross join : 结果是笛卡尔积,就是第一个表的行数乘以第二个表的行数。
数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。
在使用 left jion 时,on 和 where 条件的区别如下: 1、 on 条件是在生成临时表时使用的条件,它不管 on 中的条件是否为真,都会返回左边表中的记录。 2、where 条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有 left join 的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。
二、写sql题
1、连续7天每天登录每个网站的用户前3
select id,count(*)
from
(select *,date_add(dated,-rown) as startdate
from
(select *,row_number() over(PARTITION by id order by dated) as rown
from
(select distinct id, to_date(date) as dated
from table ) a
) b
)c
GROUP BY id,startdate
having count(*)>=7;
具体思路: 1、因为每天用户登录次数可能不止一次,所以需要先将用户每天的登录日期去重。 2、再用row_number() over(partition by _ order by _)函数将用户id分组,按照登陆时间进行排序。 3、计算登录日期减去第二步骤得到的结果值,用户连续登陆情况下,每次相减的结果都相同。 4、按照id和日期分组并求和,筛选大于等于7的即为连续7天登陆的用户。
|