SQL语句执行有一定的执行顺序,接下来我们看一个常用的SQL语句
select distinct x, max(id) from t1
join t2
on t1.x = t2.x
where 1=1
group by x
having count(x) > 2
order by x
limit 1
1、FROM 查询表数据,执行笛卡尔积
先确定从哪个表中取数据,所以最先执行from tab。对FROM子句中的前两个表执行笛卡尔积(交叉联接),生成虚拟表VT1,获取不同数据源的数据集。
from后面需要接多个表,解析器按照从右到左的顺序处理FROM子句中的表名,尽量把数据量小的表放在最右边来进行关联。(即:小表驱动大表)
2、ON 应用ON过滤器
对虚拟表VT1 应用ON筛选器,ON 中的逻辑表达式将应用到虚拟表 VT1中的各个行,筛选出满足ON 逻辑表达式的行,生成虚拟表 VT2 。
3、JOIN 添加外部行
如果指定了OUTER JOIN保留表中未找到匹配的行将作为外部行添加到虚拟表 VT2,生成虚拟表 VT3。保留表如下:
LEFT OUTER JOIN把左表记为保留表(左连接)
RIGHT OUTER JOIN把右表记为保留表(右连接)
FULL OUTER JOIN把左右表都作为保留表(内连接)
在虚拟表 VT2表的基础上添加保留表中被过滤条件过滤掉的数据,非保留表中的数据被赋予NULL值,最后生成虚拟表 VT3。
4、WEHRE过滤器
对虚拟表 VT3应用WHERE筛选器。根据指定条件对数据进行筛选,并把满足的数据插入虚拟表 VT4。
where条件的解析顺序是自下而上的,把能筛选出小量数据的条件放在where语句的最左边。where后不可以加聚合函数
5、GROUP BY 分组
按GROUP BY子句中的列/列表将虚拟表 VT4中的行唯一的值组合成为一组,生成虚拟表VT5。如果应用了GROUP BY,非聚合字段必须出现在GROUP BY子句中或在聚合函数中使用。从这一步开始,后面的语句中都可以使用SELECT中的别名。
6、AGG_FUNC 聚合函数
常用的聚合函数有max,min, count,sum,聚合函数的执行在group by之后,having之前。如果在where中写聚合函数,就会出错。
常用聚合函数
AVG:返回平均值
COUNT:返回行数
FIRST:返回第一个记录的值
LAST:返回最后一个记录的值
MAX: 返回最大值
MIN:返回最小值
SUM: 返回总和
7、HAVING 应用HAVING过滤器
对虚拟表VT5应用HAVING筛选器。根据指定的条件对数据进行筛选,并把满足的数据插入虚拟表VT6。
HAVING 中可以是普通条件的筛选,也能是聚合函数,HAVING 语句在SQL中的主要作用与WHERE语句作用是相同的,但是HAVING是过滤聚合值,在 SQL 中增加 HAVING 子句原因就是,WHERE 关键字无法与聚合函数一起使用,HAVING子句主要和GROUP BY子句配合使用。
8、SELECT 选出指定列
将虚拟表 VT6中的在SELECT中出现的列筛选出来,并对字段进行处理展示,计算SELECT子句中的表达式,产生虚拟表 VT7。
9、DISTINCT 行去重
将重复的行从虚拟表 VT7中移除,产生虚拟表 VT8。DISTINCT用来去除重复行,只保留唯一的。(仅仅去重,distinct 没有 group by效率高)group by应用的范围更广泛一些。
10、ORDER BY 排序
执行order by 将数据按照一定顺序排序,将虚拟表 VT8中的行按ORDER BY 子句中的列/列表排序,生成游标 VC9 ,注意不是虚拟表。因此使用 ORDER BY 子句查询不能应用于表达式。同时,ORDER BY子句的执行顺序为从左到右排序,是非常消耗资源的。执行order by 将数据按照一定顺序排序
11、LIMIT 指定返回行
从VC9的开始处选择指定数量行,生成虚拟表 VT10,并返回调用者。