在看有关SQL优化的资料时,常会看到一个词叫 全表扫描。下面来看一下什么是全表扫描。
全表扫描
在数据库中,对无索引的表进行查询一般称为全表扫描。 全表扫描是数据库服务器用来搜寻表的每一条记录的过程,直到所有符合给定条件的记录返回为止。全表扫描是从表中读取所有行,然后过滤掉不符合选择条件的行。
全表扫描的成本 = 表的数据块总数 / 多块读取
相对于索引范围扫描来说,全表扫描的成本是衡定不变的。无论查询是想访问一笔数据还是访问整个表的所有数据,全表扫描都会把整张表读出来。 索引范围扫描不同,因为有了索引这个有序的数据结构做支持,可以只访问需要的索引块和需要的数据块,而不是访问整张表。
何时适用全表扫描
1. 单表查询 表很小,索引可能就比表还大。 访问的数据占全表数据的百分比很大,索引访问的总成本大于全表扫描的成本。 相对于索引来说,表中的数据排列过于凌乱,表现出来就是索引的 clustering_factor 很大,导致索引的访问成本剧增。
2. 多表连接 hash join的时候,内层表和外层表都可以使用全表扫描。 nest loop的时候,外层表可以使用全表扫描,内层表一般不用全表扫描。
一般对大表进行全表扫描,容易引起SQL查询效率低。
索引范围扫描在SQL执行计划里标为 INDEX RANGE SCAN。