今天我就来和大家聊聊如何分析SQL Server中SQL语句的优化和效率。很多人可能不太了解。为了让大家更好的了解,边肖为大家总结了以下内容,希望大家能从这篇文章中有所收获。
很多人不知道SQL语句在SQL SERVER中是如何执行的。他们担心自己写的SQL语句会被SQL SERVER误解。例如:
从表1中选择*其中name='zhangsan '和tID 10000
并执行:
从表1中选择*其中tID为10000,名称='张山'
有些人不知道上面两个语句的执行效率是否相同,因为如果我们单纯看语句的顺序,两个语句确实是不一样的,而如果tID是聚合索引,那么后一句只能从10000后的表的记录中找到。在前一句中,我们首先要从整个表中查找几个名称='张三',然后根据约束条件tID10000提出查询结果。
其实这样的担心是没有必要的。SQL SERVER中有一个“查询分析优化器”,可以计算where子句中的搜索条件,确定哪个索引可以减少表扫描的搜索空间,即可以实现自动优化。
虽然查询优化器可以根据where子句自动优化查询,但是大家还是有必要了解一下查询优化器的工作原理。否则,有时查询优化器不会像您预期的那样快速查询。
在查询分析阶段,查询优化器查看查询的每个阶段,并决定限制要扫描的数据量是否有用。如果一个阶段可以用作扫描参数(SARG),它被称为可优化的,并且可以通过使用索引快速获得所需的数据。
SARG的定义:一种用于限制搜索的操作,因为它通常指特定的匹配,一个值范围内的匹配或两个以上条件的“与”连接。
表格如下:
列运算符常量或变量
或者
常量或变量运算符的列名可以出现在运算符的一侧,而常量或变量则出现在运算符的另一侧。例如:
姓名='张三'
价格5000
500的价格
名字='张三',价格5000
如果一个表达式不能满足SARG形式,就不能限制搜索范围,也就是说,SQL SERVER必须判断每一行是否满足WHERE子句中的所有条件。因此,索引对于不符合SARG形式的表达式是无用的。
在介绍完SARG之后,我们来总结一下使用SARG的经验以及与实践中的一些数据不同的结论:
1、Like语句是否属于SARG取决于所使用的通配符的类型
——比如:名字像‘张%’——,这是的
-还有:名字像' %张'-,它不属于。
原因是在字符串中打开了通配符% 1,这使得索引不可用。
2、or 会引起全表扫描
名字=‘张三’和5000的价格象征着SARG,而名字=‘张三’或5000的价格不符合SARG。使用或会导致全表扫描。
3、非操作符、函数引起的不满足SARG形式的语句
不符合SARG形式的语句的最典型情况是包含非运算符的语句,例如:NOT,=、不存在,不在,不喜欢,等等。还有功能。
以下是一些不满足SARG形式的例子:
ABS(价格)5000
类似“% 3”的名称
-一些表达式,例如:
价格*25000
- SQL SERVER也会考虑它SARG,SQL SERVER会把这个公式转换成:WHERE价格是2500/2。
但是我们不建议这样做,因为有时候SQL SERVER不能保证这种转换完全等同于原始表达式。
4、IN 的作用相当与OR
声明:
从表1中选择*其中tid在(2,3)
表示“对象”: analysand
从表1中选择*其中tid=2或tid=3
是的,它会导致全表扫描。如果tid上有索引,其索引也将无效。
5、尽量少用NOT
6、exists 和 in 的执行效率是一样的
许多材料表明,存在比不存在更有效率,而不存在应该尽可能多地使用而不是不存在。但实际上,我测试了一下,发现它们之间的执行效率是一,不管它们之前有没有。
样的。因为涉及子查询,我们试验这次用SQL SERVER自带的pubs数据库。运行前我们可以把SQL SERVER的statistics I/O状态打开:
(1)select title,price from titles where title_id in (select title_id from sales where qty>30)
该句的执行结果为:
表 'sales'。扫描计数 18,逻辑读 56 次,物理读 0 次,预读 0 次。表 'titles'。扫描计数 1,逻辑读 2 次,物理读 0 次,预读 0 次。
(2)select title,price from titles where exists (select * from sales where sales.title_id=titles.title_id and qty>30)
第二句的执行结果为:
表 'sales'。扫描计数 18,逻辑读 56 次,物理读 0 次,预读 0 次。表 'titles'。扫描计数 1,逻辑读 2 次,物理读 0 次,预读 0 次。
我们从此可以看到用exists和用in的执行效率是一样的。
7、用函数charindex()和前面加通配符%的LIKE执行效率一样
前面,我们谈到,如果在LIKE前面加上通配符%,那么将会引起全表扫描,所以其执行效率是低下的。但有的资料介绍说,用函数charindex()来代替LIKE速度会有大的提升,经我试验,发现这种说明也是错误的:
select gid,title,fariqi,reader from tgongwen where charindex('刑侦支队',reader)>0 and fariqi>'2004-5-5'
用时:7秒,另外:扫描计数 4,逻辑读 7155 次,物理读 0 次,预读 0 次。
select gid,title,fariqi,reader from tgongwen where reader like '%' + '刑侦支队' + '%' and fariqi>'2004-5-5'
用时:7秒,另外:扫描计数 4,逻辑读 7155 次,物理读 0 次,预读 0 次。
8、union并不绝对比or的执行效率高
我们前面已经谈到了在where子句中使用or会引起全表扫描,一般的,我所见过的资料都是推荐这里用union来代替or。事实证明,这种说法对于大部分都是适用的。
select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi='2004-9-16' or gid>9990000
用时:68秒。扫描计数 1,逻辑读 404008 次,物理读 283 次,预读 392163 次。
select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi='2004-9-16'unionselect gid,fariqi,neibuyonghu,reader,title from Tgongwen where gid>9990000
用时:9秒。扫描计数 8,逻辑读 67489 次,物理读 216 次,预读 7499 次。
看来,用union在通常情况下比用or的效率要高的多。
但经过试验,笔者发现如果or两边的查询列是一样的话,那么用union则反倒和用or的执行速度差很多,虽然这里union扫描的是索引,而or扫描的是全表。
select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi='2004-9-16' or fariqi='2004-2-5'
用时:6423毫秒。扫描计数 2,逻辑读 14726 次,物理读 1 次,预读 7176 次。
select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi='2004-9-16'unionselect gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi='2004-2-5'
用时:11640毫秒。扫描计数 8,逻辑读 14806 次,物理读 108 次,预读 1144 次。
9、字段提取要按照“需多少、提多少”的原则,避免“select *”
我们来做一个试验:
select top 10000 gid,fariqi,reader,title from tgongwen order by gid desc用时:4673毫秒select top 10000 gid,fariqi,title from tgongwen order by gid desc用时:1376毫秒select top 10000 gid,fariqi from tgongwen order by gid desc用时:80毫秒
由此看来,我们每少提取一个字段,数据的提取速度就会有相应的提升。提升的速度还要看您舍弃的字段的大小来判断。
10、count(*)不比count(字段)慢
某些资料上说:用*会统计所有列,显然要比一个世界的列名效率低。这种说法其实是没有根据的。我们来看:
select count(*) from Tgongwen用时:1500毫秒
select count(gid) from Tgongwen用时:1483毫秒
select count(fariqi) from Tgongwen用时:3140毫秒
select count(title) from Tgongwen用时:52050毫秒
从以上可以看出,如果用count(*)和用count(主键)的速度是相当的,而count(*)却比其他任何除主键以外的字段汇总速度要快,而且字段越长,汇总的速度就越慢。我想,如果用count(*), SQL SERVER可能会自动查找最小字段来汇总的。当然,如果您直接写count(主键)将会来的更直接些。
11、order by按聚集索引列排序效率最高
我们来看:(gid是主键,fariqi是聚合索引列):
select top 10000 gid,fariqi,reader,title from tgongwen
用时:196 毫秒。 扫描计数 1,逻辑读 289 次,物理读 1 次,预读 1527 次。
select top 10000 gid,fariqi,reader,title from tgongwen order by gid asc
用时:4720毫秒。 扫描计数 1,逻辑读 41956 次,物理读 0 次,预读 1287 次。
select top 10000 gid,fariqi,reader,title from tgongwen order by gid desc用时:4736毫秒。 扫描计数 1,逻辑读 55350 次,物理读 10 次,预读 775 次。
select top 10000 gid,fariqi,reader,title from tgongwen order by fariqi asc用时:173毫秒。 扫描计数 1,逻辑读 290 次,物理读 0 次,预读 0 次。
select top 10000 gid,fariqi,reader,title from tgongwen order by fariqi desc用时:156毫秒。 扫描计数 1,逻辑读 289 次,物理读 0 次,预读 0 次。
从以上我们可以看出,不排序的速度以及逻辑读次数都是和“order by 聚集索引列” 的速度是相当的,但这些都比“order by 非聚集索引列”的查询速度是快得多的。
同时,按照某个字段进行排序的时候,无论是正序还是倒序,速度是基本相当的。
12、高效的TOP
事实上,在查询和提取超大容量的数据集时,影响数据库响应时间的最大因素不是数据查找,而是物理的I/0操作。如:
select top 10 * from (select top 10000 gid,fariqi,title from tgongwenwhere neibuyonghu='办公室'order by gid desc) as aorder by gid asc
这条语句,从理论上讲,整条语句的执行时间应该比子句的执行时间长,但事实相反。因为,子句执行后返回的是10000条记录,而整条语句仅返回10条语句,所以影响数据库响应时间最大的因素是物理I/O操作。而限制物理I/O操作此处的最有效方法之一就是使用TOP关键词了。TOP关键词是SQL SERVER中经过系统优化过的一个用来提取前几条或前几个百分比数据的词。经笔者在实践中的应用,发现TOP确实很好用,效率也很高。但这个词在另外一个大型数据库ORACLE中却没有,这不能说不是一个遗憾,虽然在ORACLE中可以用其他方法(如:rownumber)来解决。
看完上述内容,你们对如何分析SQL Server中的SQL语句优化与效率问题有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/128592.html