如何分析SQL Server中的SQL语句优化与效率问题

技术如何分析SQL Server中的SQL语句优化与效率问题今天就跟大家聊聊有关如何分析SQL Server中的SQL语句优化与效率问题,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这

今天我就来和大家聊聊如何分析SQL Server中SQL语句的优化和效率。很多人可能不太了解。为了让大家更好的了解,边肖为大家总结了以下内容,希望大家能从这篇文章中有所收获。

很多人不知道SQL语句在SQL SERVER中是如何执行的。他们担心自己写的SQL语句会被SQL SERVER误解。例如:

从表1中选择*其中name='zhangsan '和tID 10000

并执行:

从表1中选择*其中tID为10000,名称='张山'

有些人不知道上面两个语句的执行效率是否相同,因为如果我们单纯看语句的顺序,两个语句确实是不一样的,而如果tID是聚合索引,那么后一句只能从10000后的表的记录中找到。在前一句中,我们首先要从整个表中查找几个名称='张三',然后根据约束条件tID10000提出查询结果。

其实这样的担心是没有必要的。SQL SERVER中有一个“查询分析优化器”,可以计算where子句中的搜索条件,确定哪个索引可以减少表扫描的搜索空间,即可以实现自动优化。

虽然查询优化器可以根据where子句自动优化查询,但是大家还是有必要了解一下查询优化器的工作原理。否则,有时查询优化器不会像您预期的那样快速查询。

在查询分析阶段,查询优化器查看查询的每个阶段,并决定限制要扫描的数据量是否有用。如果一个阶段可以用作扫描参数(SARG),它被称为可优化的,并且可以通过使用索引快速获得所需的数据。

SARG的定义:一种用于限制搜索的操作,因为它通常指特定的匹配,一个值范围内的匹配或两个以上条件的“与”连接。

表格如下:

列运算符常量或变量

或者

常量或变量运算符的列名可以出现在运算符的一侧,而常量或变量则出现在运算符的另一侧。例如:

姓名='张三'

价格5000

500的价格

名字='张三',价格5000

如果一个表达式不能满足SARG形式,就不能限制搜索范围,也就是说,SQL SERVER必须判断每一行是否满足WHERE子句中的所有条件。因此,索引对于不符合SARG形式的表达式是无用的。

在介绍完SARG之后,我们来总结一下使用SARG的经验以及与实践中的一些数据不同的结论:

1、Like语句是否属于SARG取决于所使用的通配符的类型

——比如:名字像‘张%’——,这是的

-还有:名字像' %张'-,它不属于。

原因是在字符串中打开了通配符% 1,这使得索引不可用。

2、or 会引起全表扫描

名字=‘张三’和5000的价格象征着SARG,而名字=‘张三’或5000的价格不符合SARG。使用或会导致全表扫描。

3、非操作符、函数引起的不满足SARG形式的语句

不符合SARG形式的语句的最典型情况是包含非运算符的语句,例如:NOT,=、不存在,不在,不喜欢,等等。还有功能。

以下是一些不满足SARG形式的例子:

ABS(价格)5000

类似“% 3”的名称

-一些表达式,例如:

价格*25000

- SQL SERVER也会考虑它SARG,SQL SERVER会把这个公式转换成:WHERE价格是2500/2。

但是我们不建议这样做,因为有时候SQL SERVER不能保证这种转换完全等同于原始表达式。

4、IN 的作用相当与OR

声明:

从表1中选择*其中tid在(2,3)

表示“对象”: analysand

从表1中选择*其中tid=2或tid=3

是的,它会导致全表扫描。如果tid上有索引,其索引也将无效。

5、尽量少用NOT

6、exists 和 in 的执行效率是一样的

许多材料表明,存在比不存在更有效率,而不存在应该尽可能多地使用而不是不存在。但实际上,我测试了一下,发现它们之间的执行效率是一,不管它们之前有没有。

样的。因为涉及子查询,我们试验这次用SQL SERVER自带的pubs数据库。运行前我们可以把SQL SERVER的statistics I/O状态打开:

(1)select title,price from titles where title_id in (select title_id from sales where qty>30)

该句的执行结果为:

表 'sales'。扫描计数 18,逻辑读 56 次,物理读 0 次,预读 0 次。表 'titles'。扫描计数 1,逻辑读 2 次,物理读 0 次,预读 0 次。

(2)select title,price from titles  where exists (select * from sales  where sales.title_id=titles.title_id and qty>30)

第二句的执行结果为:

表 'sales'。扫描计数 18,逻辑读 56 次,物理读 0 次,预读 0 次。表 'titles'。扫描计数 1,逻辑读 2 次,物理读 0 次,预读 0 次。

我们从此可以看到用exists和用in的执行效率是一样的。

7、用函数charindex()和前面加通配符%的LIKE执行效率一样  

前面,我们谈到,如果在LIKE前面加上通配符%,那么将会引起全表扫描,所以其执行效率是低下的。但有的资料介绍说,用函数charindex()来代替LIKE速度会有大的提升,经我试验,发现这种说明也是错误的:

select gid,title,fariqi,reader from tgongwen   where charindex('刑侦支队',reader)>0 and fariqi>'2004-5-5'

用时:7秒,另外:扫描计数 4,逻辑读 7155 次,物理读 0 次,预读 0 次。

select gid,title,fariqi,reader from tgongwen   where reader like '%' + '刑侦支队' + '%' and fariqi>'2004-5-5'

用时:7秒,另外:扫描计数 4,逻辑读 7155 次,物理读 0 次,预读 0 次。

8、union并不绝对比or的执行效率高  

我们前面已经谈到了在where子句中使用or会引起全表扫描,一般的,我所见过的资料都是推荐这里用union来代替or。事实证明,这种说法对于大部分都是适用的。

select gid,fariqi,neibuyonghu,reader,title from Tgongwen   where fariqi='2004-9-16' or gid>9990000

用时:68秒。扫描计数 1,逻辑读 404008 次,物理读 283 次,预读 392163 次。

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi='2004-9-16'unionselect gid,fariqi,neibuyonghu,reader,title from Tgongwen where gid>9990000

用时:9秒。扫描计数 8,逻辑读 67489 次,物理读 216 次,预读 7499 次。

看来,用union在通常情况下比用or的效率要高的多。

但经过试验,笔者发现如果or两边的查询列是一样的话,那么用union则反倒和用or的执行速度差很多,虽然这里union扫描的是索引,而or扫描的是全表。

select gid,fariqi,neibuyonghu,reader,title from Tgongwen   where fariqi='2004-9-16' or fariqi='2004-2-5'

用时:6423毫秒。扫描计数 2,逻辑读 14726 次,物理读 1 次,预读 7176 次。

select gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi='2004-9-16'unionselect gid,fariqi,neibuyonghu,reader,title from Tgongwen where fariqi='2004-2-5'

用时:11640毫秒。扫描计数 8,逻辑读 14806 次,物理读 108 次,预读 1144 次。

9、字段提取要按照“需多少、提多少”的原则,避免“select *”

  我们来做一个试验:

select top 10000 gid,fariqi,reader,title from tgongwen order by gid desc用时:4673毫秒select top 10000 gid,fariqi,title from tgongwen order by gid desc用时:1376毫秒select top 10000 gid,fariqi from tgongwen order by gid desc用时:80毫秒

由此看来,我们每少提取一个字段,数据的提取速度就会有相应的提升。提升的速度还要看您舍弃的字段的大小来判断。

10、count(*)不比count(字段)慢  

某些资料上说:用*会统计所有列,显然要比一个世界的列名效率低。这种说法其实是没有根据的。我们来看:

select count(*) from Tgongwen用时:1500毫秒

select count(gid) from Tgongwen用时:1483毫秒

select count(fariqi) from Tgongwen用时:3140毫秒

select count(title) from Tgongwen用时:52050毫秒

从以上可以看出,如果用count(*)和用count(主键)的速度是相当的,而count(*)却比其他任何除主键以外的字段汇总速度要快,而且字段越长,汇总的速度就越慢。我想,如果用count(*), SQL SERVER可能会自动查找最小字段来汇总的。当然,如果您直接写count(主键)将会来的更直接些。

11、order by按聚集索引列排序效率最高  

我们来看:(gid是主键,fariqi是聚合索引列):

select top 10000 gid,fariqi,reader,title from tgongwen

用时:196 毫秒。 扫描计数 1,逻辑读 289 次,物理读 1 次,预读 1527 次。

select top 10000 gid,fariqi,reader,title from tgongwen order by gid asc

用时:4720毫秒。 扫描计数 1,逻辑读 41956 次,物理读 0 次,预读 1287 次。

select top 10000 gid,fariqi,reader,title from tgongwen order by gid desc用时:4736毫秒。 扫描计数 1,逻辑读 55350 次,物理读 10 次,预读 775 次。

select top 10000 gid,fariqi,reader,title from tgongwen order by fariqi asc用时:173毫秒。 扫描计数 1,逻辑读 290 次,物理读 0 次,预读 0 次。

select top 10000 gid,fariqi,reader,title from tgongwen order by fariqi desc用时:156毫秒。 扫描计数 1,逻辑读 289 次,物理读 0 次,预读 0 次。

从以上我们可以看出,不排序的速度以及逻辑读次数都是和“order by 聚集索引列” 的速度是相当的,但这些都比“order by 非聚集索引列”的查询速度是快得多的。  

同时,按照某个字段进行排序的时候,无论是正序还是倒序,速度是基本相当的。

12、高效的TOP  

事实上,在查询和提取超大容量的数据集时,影响数据库响应时间的最大因素不是数据查找,而是物理的I/0操作。如:

select top 10 * from (select top 10000 gid,fariqi,title from tgongwenwhere neibuyonghu='办公室'order by gid desc) as aorder by gid asc

这条语句,从理论上讲,整条语句的执行时间应该比子句的执行时间长,但事实相反。因为,子句执行后返回的是10000条记录,而整条语句仅返回10条语句,所以影响数据库响应时间最大的因素是物理I/O操作。而限制物理I/O操作此处的最有效方法之一就是使用TOP关键词了。TOP关键词是SQL SERVER中经过系统优化过的一个用来提取前几条或前几个百分比数据的词。经笔者在实践中的应用,发现TOP确实很好用,效率也很高。但这个词在另外一个大型数据库ORACLE中却没有,这不能说不是一个遗憾,虽然在ORACLE中可以用其他方法(如:rownumber)来解决。

看完上述内容,你们对如何分析SQL Server中的SQL语句优化与效率问题有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注行业资讯频道,感谢大家的支持。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/128592.html

(0)

相关推荐

  • 租用美国服务器有哪些特色

    技术租用美国服务器有哪些特色对于美国服务器租用,相信很多海外站长一定不陌生,但是相比香港、台湾等高速亚太机房,美国服务器有哪些功能?下面USA-IDC就来简单介绍一下在美国的专用服务器的最令人兴奋的功能支持硬件RAID

    礼包 2021年12月9日
  • 党的思想路线的核心是,实事求是思想路线的目的是什么

    技术党的思想路线的核心是,实事求是思想路线的目的是什么实事是客观存在着的一切事物党的思想路线的核心是,求是我们去探究,是就是事物发展的规律,也就是按照事物的本来面貌去发掘事物发展的规律,而规律是主观认识,但必须与实事相符

    生活 2021年10月26日
  • Python代码格式化工具pycodestyle怎么使用

    技术Python代码格式化工具pycodestyle怎么使用本篇内容介绍了“Python代码格式化工具pycodestyle怎么使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学

    攻略 2021年11月29日
  • 笑的种类,笑的学问和笑的种类有多少

    技术笑的种类,笑的学问和笑的种类有多少笑 心理学家们现在发现笑的种类:笑是人类与他人交流的最古老的方式之一,而在此之前,笑只被看作是人类幽默感的体现。人类笑是为了和别人团结一致或者嘲笑他们,要么用笑和别人调情。我们中的每

    生活 2021年10月20日
  • 额宝,支付宝于额宝。是什么意思

    技术额宝,支付宝于额宝。是什么意思支付宝里的余额是支付宝平台的一个资金账户额宝,可以随存随取,也可以用于支付宝上面消费,但转入余额账户的资金不产生收益。余额宝是一种资金管理服务。转入余额宝,即购买货币基金,可享货币基金收

    生活 2021年10月20日
  • 互联网中有哪些开源UML工具

    技术互联网中有哪些开源UML工具这篇文章主要介绍了互联网中有哪些开源UML工具,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1.StarUMLStarUM

    攻略 2021年12月11日