索引失效的原因是什么

技术索引失效的原因是什么本篇内容主要讲解“索引失效的原因是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“索引失效的原因是什么”吧!MySQL数据是如何存储的?聚集索引我们

本文主要讲解“索引失败的原因是什么”,感兴趣的朋友不妨看看。本文介绍的方法简单、快速、实用。让边肖带你学习“指数失败的原因是什么”!

MySQL数据是如何存储的?

聚集索引

让我们按如下方式构建一个表。

创建表“student”(“id”int(11)不为null auto _ increment注释“学生编号”,“name”varchar(10)不为null注释“学生姓名”,“age”int(11)不为null注释“学生年龄”,主键(“id ”),键`。插入以下sql

insertintostudent(`name `,` age `)值(' a ',10);insertintostudent(`name `,` age `)值(' c ',12);insertintostudent(`name `,` age `)值(' b ',9);insertintostudent(`name `,` age `)值(' d ',15);insertintostudent(`name `,` age `)值(' h ',17);插入student(`name `,` age `)值(' l ',13);insertintostudent(`name `,` age `)值(' k ',12);insertintostudent(`name `,` age `)值(' x ',9);数据如下。

索引失效的原因是什么

图片mysql按照页面存储数据,每页大小为16k。

在MySQL中,您可以通过执行以下语句来查看页面的大小。

showglobalstatuslike ' innodb _ page _ size '的结果是16384,也就是16kb。

在InnoDB存储引擎中,数据以主键作为索引进行组织。记录以单个链表的形式按照主键从小到大的顺序链接在一起。

有些朋友可能会问,创建表的时候没有指定主键怎么办?

如果创建表时没有显示已定义的主键,InnoDB存储引擎将按如下方式选择或创建主键。

首先,判断表中是否有非空的唯一索引。如果有,列就是主键。如果有多个非空唯一索引,InnoDB存储引擎将选择第一个定义的非空唯一索引作为主键。

如果不满足上述条件,InnoDB存储引擎会自动创建一个大小为6字节的指针作为索引。

并且页面以双链表的形式链接在一起。并且下一个数据页中用户记录的主键值必须大于上一个数据页中的主键值。

假设一个页面只能容纳3条数据,数据存储结构如下。

索引失效的原因是什么

可以看出,当我们想要查询一条数据或者插入一条数据时,需要从第一页开始,依次遍历每一页的链表,效率很低。

om/upload/information/20210521/377/511303.jpg" alt="索引失效的原因是什么">

我们可以给这页做一个目录,保存主键和页号的映射关系,根据二分法就能快速找到数据所在的页。但这样做的前提是这个映射关系需要保存到连续的空间,如数组。如果这样做会有如下几个问题

  1. 随着数据的增多,目录所需要的连续空间越来越大,并不现实

  2. 当有一个页的数据全被删除了,则相应的目录项也要删除,它后面的目录项都要向前移动,成本太高

我们可以把目录数据放在和用户数据类似的结构中,如下所示。目录项有2个列,主键和页号。

索引失效的原因是什么

数据很多时,一个目录项肯定很多,毕竟一个页的大小为16k,我们可以对数据建立多个目录项目,在目录项的基础上再建目录项,如下图所示

索引失效的原因是什么

这其实就是一颗B+树,也是一个聚集索引,即数据和索引在一块。叶子节点保存所有的列值

以 InnoDB 的一个整数字段索引为例,这个 N 差不多是 1200。这棵树高是 4 的时候,就可以存 1200 的 3 次方个值,这已经17  亿了。考虑到树根的数据块总是在内存中的,一个 10 亿行的表上一个整数字段的索引,查找一个值最多只需要访问  3次磁盘。其实,树的第二层也有很大概率在内存中,那么访问磁盘的平均次数就更少了。

非聚集索引

索引失效的原因是什么

聚集索引和非聚集索引非常类似,区别如下

聚集索引叶子节点的值为所有的列值非聚集索引叶子节点的值为索引列+主键

当我们查询name为h的用户信息时(学号,姓名,年龄),因为name上建了索引,先从name非聚集索引上,找到对应的主键id,然后根据主键id从聚集索引上找到对应的记录。

从非聚集索引上找到对应的主键值然后到聚集索引上查找对应记录的过程为回表

联合索引/索引覆盖

假设teacher表定义如下,在name和age列上建立联合索引

CREATE TABLE `teacher` (   `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '教师编号',   `name` varchar(10) NOT NULL COMMENT '教师姓名',   `age` int(11) NOT NULL COMMENT '教师年龄',   `ismale` tinyint(3) NOT NULL COMMENT '是否男性',   PRIMARY KEY (`id`),   KEY `idx_name_age` (`name`, `age`) ) ENGINE=InnoDB;

插入如下sql

insert into teacher (`name`, `age`, `ismale`) value('aa', 10, 1); insert into teacher (`name`, `age`, `ismale`) value('dd', 12, 0); insert into teacher (`name`, `age`, `ismale`) value('cb', 9, 1); insert into teacher (`name`, `age`, `ismale`) value('cb', 15, 1); insert into teacher (`name`, `age`, `ismale`) value('bc', 17, 0); insert into teacher (`name`, `age`, `ismale`) value('bb', 15, 1); insert into teacher (`name`, `age`, `ismale`) value('dd', 15, 1); insert into teacher (`name`, `age`, `ismale`) value('dd', 12, 0);

索引失效的原因是什么

对name和age列建立联合索引

目录页由name列,age列,页号这三部分组成。目录会先按照name列进行排序,当name列相同的时候才对age列进行排序。

数据页由name列,age列,主键值这三部分组成。同样的,数据页会先按照name列进行排序,当name列相同的时候才对age列进行排序。

索引失效的原因是什么

当执行如下语句的时候,会有回表的过程

select * from student where name = 'aa';

当执行如下语句的时候,没有回表的过程

select name, age from student where name = 'aa';

为什么不需要回表呢?

因为idx_name_age索引的叶子节点存的值为主键值,name值和age值,所以从idx_name_age索引上就能获取到所需要的列值,不需要回表,即索引覆盖

仔细看一下联合索引这个图,你就基本上能明白为什么不满足最左前缀原则的索引会失效?

索引下推

当执行如下语句的时候

select * from student where name like '张%' and age = 10 and ismale = 1;

在5.6版本之前的执行过程如下,先从idx_name_age索引上找到对应的主键值,然后回表找到对应的行,判断其他字段的值是否满足条件

索引失效的原因是什么

在5.6引入了索引下推优化,可以在遍历索引的过程中,对索引中包含的字段做判断,直接过滤掉不满足条件的数据,减少回表次数,如下图

索引失效的原因是什么

最左前缀原则

加速查询

主要针对组合索引,满足如下2个条件即可满足左前缀原则

需要查询的列和组合索引的列顺序一致

查询不要跨列

构造数据如下,其中在name,address,country上建了联合索引

CREATE TABLE `people` (   `name` varchar(50) NOT NULL,   `address` varchar(50) NOT NULL,   `country` varchar(50) NOT NULL,   KEY `idx_name_addr_country` (`name`,`address`,`country`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

举几个例子,下面涉及到一些explain相关的知识,后面单开一篇长文来做介绍

例子一

explain select * from people where name = "jack" and address = "beijing" and country = "china"

索引失效的原因是什么

type为ref,key_len为456=(50*3+2)*3,联合索引的所有列都使用了

例子二

explain select * from people where name = "jack"

索引失效的原因是什么

type为ref,key_len为152=50*3+2,联合索引只使用了name列

例子三

explain select * from people where address = "beijing"

索引失效的原因是什么

type为index,表明查询的时候对整个索引进行了扫描,并没有加速查找。

假设有如下的联合索引 key idx_a_b_c(a,b,c)

sql 是否使用索引
where a = x and b = x and c = x
where a = x and b = x 是,部分索引
where a = x 是,部分索引
where b = x 否,不包含最左列name
where b = x and c = x 否,不包含最左列name

如果你仔细看了前面联合索引是如何存储的,那你一定能看懂是否使用索引的介绍

目录页是按照 a b c 列的顺序依次递增排序的。先按照a列排序,如果a列相同,再按照b列排序,如果b列相同,才按照c列排序

所以查询列值a b c,则这个排序规则能用到,即会走索引。如果只查列值b,并不能用到这个排序规则,所以得遍历所有的记录

加速排序

最左前缀原则不仅用在查询中,还能用在排序中。MySQL中,有两种方式生成有序结果集:

  1. 通过有序索引顺序扫描直接返回有序数据

  2. Filesort排序,对返回的数据进行排序

因为索引的结构是B+树,索引中的数据是按照一定顺序进行排列的,所以在排序查询中如果能利用索引,就能避免额外的排序操作。EXPLAIN分析查询时,Extra显示为Using  index。

所有不是通过索引直接返回排序结果的操作都是Filesort排序,也就是说进行了额外的排序操作。EXPLAIN分析查询时,Extra显示为Using  filesort,当出现Using filesort时对性能损耗较大,所以要尽量避免Using filesort

还是先举2个例子,然后总结

explain select * from people order by name

索引失效的原因是什么

Extra列只有Using index,即根据索引顺序进行扫描

explain select * from people order by address

索引失效的原因是什么

在这里插入图片描述

Extra列有Using filesort

总结:假如说有如下联合索引,key idx_a_b_c(a,b,c)

order by 能使用索引排序

order by a order by a,b order by a,b,c order by a desc, b desc, c desc where a = const order by b,c where a = const and b = const order by c where a = const and b > const order by b,c

order by 不能使用索引进行排序

order by b order by c order by b, c order by a asc, b desc, c desc //排序不一致 where g = const order by b,c //丢失a索引 where a = const order by c //丢失b索引 where a = const order by a,d //d不是索引的一部分 where a in (...) order by b,c //范围查询

这个原因就不用我解释了把,相信你一定看懂了

联合索引的好处

索引覆盖,减少了很多回表的操作,提高了查询的效率

索引下推,索引列越多,通过索引筛选出的数据越少。有1000W条数据的表,有如下sql:select * from table where col1=1  and col2=2 and  col3=3,假设假设每个条件可以筛选出10%的数据,如果只有单值索引,那么通过该索引能筛选出1000W10%=100w条数据,然后再回表从100w条数据中找到符合col2=2  and col3= 3的数据;如果是联合索引,通过索引筛选出1000w*10%*10% *10%=1w,效率提升可想而知!

索引为什么会失效?

当别人问我索引在什么条件下会失效时,我能背出一大堆规则

  1. 不要在索引列上进行运算或使用函数

  2. 前导模糊查询不会使用索引,例如 like %李

  3. 负向条件索引不会使用索引,建议用in。负向条件有:!=、<>、not in、not exists、not like 等

索引是按照一定规则排好序的,如果对索引列使用函数,或者 like % 李,具体的值都不知道,它怎么在B+树上加速查询?

到此,相信大家对“索引失效的原因是什么”有了更深的了解,不妨来实际操作一番吧!这里是网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/41733.html

(0)

相关推荐

  • 使用SPM固定执行计划

    技术使用SPM固定执行计划 使用SPM固定执行计划使用SPM固定执行计划
    2 YEARS AGOORACLEVIEWED56TIMES.数据库在运行过程中,会由于各种原因的变化,存在执行计划不稳定的情况

    礼包 2021年11月19日
  • SQL优化技巧有哪些

    技术SQL优化技巧有哪些这篇文章主要讲解了“SQL优化技巧有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“SQL优化技巧有哪些”吧!一、索引优化索引的数据结构是 B+

    攻略 2021年11月12日
  • 睡眠浅,入睡难,睡眠浅,如何改善

    技术睡眠浅,入睡难,睡眠浅,如何改善我听过一种说法,人之所以睡不着是因为大脑神经细胞异常兴奋活跃睡眠浅。这种说法是否有科学依据,也无从考证。不过,我比较认同这种说法。我曾经的经历也基本上和你类似,睡眠不好。有时整夜睡不着

    生活 2021年10月30日
  • web前端面试中的常见的算法问题有哪些

    技术web前端面试中的常见的算法问题有哪些这篇文章主要介绍“web前端面试中的常见的算法问题有哪些”,在日常操作中,相信很多人在web前端面试中的常见的算法问题有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操

    攻略 2021年11月15日
  • 僵尸粉自助下单,抖音找人刷粉是什么意思?

    技术僵尸粉自助下单,抖音找人刷粉是什么意思?僵尸粉自助下单,抖音找人刷粉是什么意思?你是否经常拍抖音短视频却无法上热门,你是否辛苦专研却没有什么收获!这些都是因为你没有掌握对抖音上热门的方法,方法不对,埋头苦干只能南辕北

    测评 2021年11月11日
  • 怎么使用UML

    技术怎么使用UML怎么使用UML,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。多初次接触UML的朋友们可能会感觉它各种各样的线条、关系、描述

    攻略 2021年11月2日