浅析MySQL-索引篇01

浅析MySQL-索引篇01

article2024/7/8 12:44:11/文章来源:https://blog.csdn.net/wh2691259/article/details/139939684

什么是索引？

索引是帮助存储引擎快速获取数据的一种数据结构，类似于数据的目录。

索引的分类

按数据结构分类：

MySQL 常见索引有 B+Tree 索引、HASH 索引、Full-Text 索引。

Innodb是MySQL5.5之后的默认存储引擎，B+Tree索引类型也是MySQL采用的最多索引类型。

在创建表时，InnoDB存储引擎会根据不同的场景选择不同的列作为索引：

如果有主键，默认会使用主键作为聚簇索引的索引键；
如果没有主键，就选择一个唯一列作为聚簇索引的索引键;
如果两个都没有，将自动生成一个隐式自增 id 列作为聚簇索引的索引键;

其他索引都属于二级索引或非聚簇索引。创建的主键索引和二级索引默认使用的都是B+tree索引。

按物理存储分类：

索引分为聚簇索引、非聚簇索引。

聚簇索引的B+tree的叶子节点存放的是实际数据，所有完整的数据记录都存放在聚簇索引的B+Tree的叶子节点里；

非聚簇索引的B+Tree的叶子节点存放的是主键值，不是实际数据记录

因此，在查询时使用了非聚簇索引，如果查询的数据字段能在非聚簇索引里查询到，那么就不需要回表，这个过程称作覆盖索引。如果查询的数据字段不在非聚簇索引中，就会先检索非聚簇索引，找到对应的叶子节点，获取到主键值后，然后在检索聚簇索引，就能查到数据了，这个过程就称作回表。

按字段特性分类：

索引分为主键索引、唯一索引、普通索引、前缀索引。

这里说明下前缀索引：

前缀索引指的是对字符类型(char、varchar)字段的前几个字符建立的索引，而不是在整个字段上建立索引。使用此类索引可以检索索引占用的存储空间，提升查询效率。

create index idx_name_prefix on tbl_user(name(3));

按字段个数分类：

分为单列索引、联合索引。

这里说明下联合索引，它就是将多个字段组合成一个索引。

索引的结构

比如在tb_user中添加idx_name_age(name,age)联合索引

CREATE INDEX idx_name_age ON tbl_user(name, age);

下图就是联合索引idx_name_age中B+Tree形式的大致结构：

从上面的图可以看出，联合索引的非叶子节点用两个字段的值作为B+Tree的key值。当在联合索引查询数据时，先按name字段比较，在name字段相同的情况下在按age字段比较。也就是说先按name字段进行排序，然后再name字段相同的情况再按age字段排序。

因此，使用联合索引时，就会存在最左匹配原则。如果查询条件不遵守「最左匹配原则」联合索引会失效，查询就无法利用到索引进行快速查询。

为什么选择B+Tree？

B+ 树的非叶子节点不存放实际的记录数据，仅存放索引，因此数据量相同的情况下，相比存储即存索引又存记录的 B 树，B+树的非叶子节点可以存放更多的索引，因此 B+ 树可以比 B 树更「矮胖」，查询底层节点的磁盘 I/O次数会更少。
B+ 树有大量的冗余节点（所有非叶子节点都是冗余索引），这些冗余索引让 B+ 树在插入、删除的效率都更高，比如删除根节点的时候，不会像 B 树那样会发生复杂的树的变化；
B+ 树叶子节点之间用链表连接了起来，有利于范围查询，而 B 树要实现范围查询，因此只能通过树的遍历来完成范围查询，这会涉及多个节点的磁盘 I/O 操作，范围查询效率不如 B+ 树。

索引的优化

下面举例说明几种常见的优化索引手段：

前缀索引优化；
覆盖索引优化；
主键索引最好是自增的；
防止索引失效；

前缀索引优化

使用某个字段中字符串的前几个字符串建立索引，为什么需要使用前缀来建立索引呢？

目前是为了减小索引字段大小，可以增加一个索引页中存储的索引值，有效提高索引的查询速度。因为会存在大字符串的字段作为索引，这个场景就适合使用前缀索引方式来减小索引项的大小

缺点：①order by无法使用前缀索引 ②无法把前缀索引用作覆盖索引

覆盖索引优化

指的是SQL中查询的所有字段，在索引B+Tree的叶子节点都能找得到，从非聚簇索引中查询得到记录，而不需要通过聚簇索引查询获得，避免了回表的操作。

主键索引是自增

建表的时候，我们一般把主键设置成自增，为什么这么做呢？

Innodb引擎中，以聚簇索引为例，数据存放在叶子节点中，也就是说，同一个叶子节点内的各个数据都是按主键顺序存放的，因此当有一条新数据要插入时，数据库会根据主键将其插入到对应的叶子节点中。

如果使用自增主键，那么每次插入的新数据就会按顺序添加到当前索引节点的位置，不需要移动已有数据，当页写满，就会自动开辟一个新页。因为每次插入一条新纪录，都是追加操作，不需要重新移动数据，因此这种插入数据的方法效率非常高。

如果使用非自增主键，那么每次插入主键的索引值都是随机的，每次插入新的数据时，就可能会插入到现有数据页中间的某个位置，这将不得不移动其他数据来满足新数据的插入，甚至需要从一个页复制数据到另外一个页，这种情况我们称为页分裂。页分裂可能会导致造成大量的内存碎片，导致索引节后不紧凑，影响查询效率。

索引最好设置为 NOT NULL

第一：索引列存在NULL就会导致优化器在做索引选择的时候更加复杂，难以优化。比如进行索引统计，count会省略之为NULL的行
第二： NULL是一个没有意义的值，但是它会占用物理空间，所以会带来存储空间的问题。如果表中存在允许为NULL的字段，那么行格式中至少会用1字节空间存储NULL值列表。

防止索引失效

对索引使用左或者左右模糊匹配

当我们使用左或者左右模糊匹配的时候，都会造成索引失效

select * from tbl_score where name like '%王';
select * from tbl_score where name like '%王%';

执行计划中的 type=ALL 就代表了全表扫描，而没有走索引。

如果查询的是右模糊的话，会走索引。

select * from  tbl_score like '王%';

执行计划中的type=range表示走了索引扫描。

为什么 like 关键字左或者左右模糊匹配无法走索引呢？

因为索引结构是B+Tree，它是按照「索引值」有序排序存储的，只能根据前缀进行比较。

对索引使用函数

如果查询条件中对索引字段使用函数，就会导致索引失效。

select * from tbl_score where mod(score, 2) = 0;

执行计划中type=ALL，代表未走索引。

为什么对索引使用函数，就无法走索引了呢？

因为索引保存的是索引字段的原始值，而不是经过函数计算后的值，因此肯定没法走索引。但是在8.0版本后，增加了函数索引。即可这对函数计算后的值建立索引，也就是说索引的值是函数计算后的值。

alter table tbl_score add key idx_score_mod ((mod(score,2)));

添加完后，执行计划如下：

对索引进行表达式计算

在查询条件中对索引进行表达式计算，也是无法走索引的。

select * from tbl_score where age + 2=10;

执行计划如下，type=ALL未走索引

修改查询方式

select * from tbl_score where age = 10 - 2;

执行计划如下，type=ref走了索引

对索引隐式类型转换

如果索引字段是字符串类型，但是在条件查询中，输入的参数是整型的话，你会在执行计划的结果发现这条语句会走全表扫描

在tbl_score中存在一个字段status 类型是varchar(4)

select * from tbl_score where status=1;

执行计划中，type=ALL未走索引。

修改方式：

select * from tbl_score where status='1';

执行计划中，type=ref表示已走索引。

联合索引非最左匹配

联合索引要能正确使用需要遵循最左匹配原则，也就是按照最左优先的方式进行索引的匹配

select * from tbl_score where score= 10;

执行计划中type=ALL未走索引。

为什么联合索引不遵循最左匹配原则就会失效？

在联合索引的情况下，数据是按照索引第一列排序，第一列数据相同时才会按照第二列排序。

也就是说，如果我们想使用联合索引中尽可能多的列，查询条件中的各个列必须是联合索引中从最左边开始连续的列。如果我们仅仅按照第二列搜索，肯定无法走索引

WHERE 子句中的 OR

在 WHERE 子句中，如果在 OR 前的条件列是索引列，而在 OR 后的条件列不是索引列，那么索引会失效

但是or查询条件中都有字段都是索引字段，并不一定走索引。还需要看优化器怎么决定。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mfbz.cn/a/773986.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

数据结构笔记第3篇：双向链表

数据结构笔记第3篇：双向链表

1、双向链表的结构注意：这里的 "带头" 跟前面我们说的 "头结点" 是两个概念，实际前面的在单链表阶段称呼不严谨，但是为了同学们更好的理解就直接称为单链表的头结点。带头链表里的头结点，实际为 "哨兵…

阅读更多...

第TR1---TR3周： Pytorch复现Transformer

第TR1---TR3周： Pytorch复现Transformer

TR1 一、文本输入处理 1. 词向量和常见的NLP 任务一样，首先会使用词嵌入算法（embedding algorithm），将输入文本序列的每个词转换为一个词向量。如下图所示，假设我们的输入文本是序列包含了3个词，那么每…

阅读更多...

2025深圳国际人工智能展览会

2025深圳国际人工智能展览会

2025深圳国际人工智能展览会 Shenzhen International Artificial Intelligence Exhibition 2025 时间：2025年6月25-27日地点：深圳国际会展中心（宝安新馆） 详询主办方陆先生 I38（前三位） I82I&#…

阅读更多...

Linux系统部署MongoDB开源文档型数据库并实现无公网IP远程访问

Linux系统部署MongoDB开源文档型数据库并实现无公网IP远程访问

文章目录前言1. 安装Docker2. 使用Docker拉取MongoDB镜像3. 创建并启动MongoDB容器4. 本地连接测试5. 公网远程访问本地MongoDB容器5.1 内网穿透工具安装5.2 创建远程连接公网地址5.3 使用固定TCP地址远程访问 💡 推荐前些天发现了一个巨牛的人工智能学习网站&am…

阅读更多...

chrome 谷歌浏览器插件打包

chrome 谷歌浏览器插件打包

1、找到id对应的字符串去搜索 C:\Users\<你的用户名>\AppData\Local\Google\Chrome\User Data\Default\Extensions2、选择根目录直接加载下面的路径扩展可用：

阅读更多...

【探索Linux】P.37（传输层 —— TCP协议通信机制 | 确认应答(ACK)机制 | 超时重传机制）

【探索Linux】P.37（传输层 —— TCP协议通信机制 | 确认应答(ACK)机制 | 超时重传机制）

阅读导航引言一、确认应答(ACK)机制1. 成功接收2. 过程中存在丢包3. 引入序列号（1）序列号的定义（2）序列号的作用（3）序列号的工作原理（4）序列号和确认应答号二、超时重传机制1. 超时…

阅读更多...

【操作与配置】Linux的CPU深度学习环境

【操作与配置】Linux的CPU深度学习环境

Conda安装可浏览官网：Miniconda — Anaconda 文档这四条命令会快速而且悄悄地安装最新的64位安装程序，然后清理安装过程中产生的文件。如果需要安装 Linux 版本的其他版本或架构的 Miniconda，只需要在命令中更改安装程序的名称。 mkdir …

阅读更多...

隐私计算实训营第二期第十课：基于SPU机器学习建模实践

隐私计算实训营第二期第十课：基于SPU机器学习建模实践

隐私计算实训营第二期-第十课第十课：基于SPU机器学习建模实践1 隐私保护机器学习背景1.1 机器学习中隐私保护的需求1.2 PPML提供的技术解决方案 2 SPU架构2.1 SPU前端2.2 SPU编译器2.3 SPU运行时2.4 SPU目标 3 密态训练与推理3.1 四个基本问题3.2 解决数据来源问题…

阅读更多...

二叉搜索树（BST)

二叉搜索树（BST)

目录一、概念二、代码实现 1.框架 2.查找 3.插入 4.删除 5.递归的写法三、应用一、概念二、代码实现 1.框架 #pragma oncenamespace utoKey {//结点template<class K>struct BinarySearchTreeNode{//结点的typedeftypedef BinarySearchTreeNode Node;//Nod…

阅读更多...

利用pg_rman进行备份与恢复操作

利用pg_rman进行备份与恢复操作

文章目录 pg_rman简介一、安装配置pg_rman二、创建表与用户三、备份与恢复 pg_rman简介 pg_rman 是 PostgreSQL 的在线备份和恢复工具。类似oracle 的 rman pg_rman 项目的目标是提供一种与 pg_dump 一样简单的在线备份和 PITR 方法。此外，它还为每个数据库集群维护…

阅读更多...

AIGC时代，“人”的核心价值在何处？

AIGC时代，“人”的核心价值在何处？

随着科技的浪潮汹涌向前，人工智能生成内容（AIGC）已悄然渗透至我们生活的每一个角落，从创意设计到信息传播，其影响力与变革力愈发显著。在这一由算法驱动的新纪元里，人类社会运作模式、学习途径及职业形态均…

阅读更多...

眼动追踪技术 | 眼动的分类和模型

眼动追踪技术 | 眼动的分类和模型

摘要灵长类动物用于调整中央凹位置的正常眼动，几乎都可以归结为五种基本类型的组合：扫视、平稳追踪、聚散、前庭眼震和生理性眼震(与注视相关的微小运动)。聚散运动用于将双眼聚焦于远处的目标(深度知觉)。其他运动(如适应和聚焦)指的是眼动的非位置变…

阅读更多...

LMT加仿真，十一届大唐杯全国总决赛

LMT加仿真，十一届大唐杯全国总决赛

这次省赛带了太多个省一了，并且很多都进入了国赛总决赛，具体可看下面的图片，只放了一部分。目前只有B组是只有一个商用设备赛也就是LMT，A组和高职组都是仿真实践赛加上商用设备赛。针对商用设备赛有对应的资料&#xff…

阅读更多...

【深度学习】第3章——回归模型与求解分析

【深度学习】第3章——回归模型与求解分析

一、回归分析 1.定义分析自变量与因变量之间定量的因果关系，根据已有的数据拟合出变量之间的关系。 2.回归和分类的区别和联系 3.线性模型 4.非线性模型 5.线性回归※ 面对回归问题，通常分三步解决第一步：选定使用的model，…

阅读更多...

CFS三层内网渗透——第二层内网打点并拿下第三层内网（三）

CFS三层内网渗透——第二层内网打点并拿下第三层内网（三）

目录八哥cms的后台历史漏洞配置socks代理以我的kali为例,手动添加 socks配置好了，直接sqlmap跑登录进后台蚁剑配置socks代理测试连接编辑成功上线上传正向后门生成正向后门上传后门内网信息收集进入目标二内网机器&#xf…

阅读更多...

SAP-SD同一物料下单价格确不同

SAP-SD同一物料下单价格确不同

业务说明： 业务部门反馈，同一物料下销售订单时，价格确不同。那么这个价格是怎么取到的呢？ 逻辑说明： 1、首先查看销售订单可以看到相同物料价格是不同的，条件类型都是ZPR5，但是客户是不同…

阅读更多...

相关款式1111

相关款式1111

一、花梨木迎客松 1. 风速打单发现只有在兄弟店铺有售卖六月份成交订单数有62笔 2. 生意参谋兄弟店铺商品访客数：3548，支付件数：95件二. 竹节茶刷（引流） 1. 风速打单六月订单数有165笔兄弟：…

阅读更多...

揭秘数据之美：【Seaborn】在现代【数学建模】中的革命性应用

揭秘数据之美：【Seaborn】在现代【数学建模】中的革命性应用

目录已知数据集 tips 生成数据集并保存为CSV文件数据预览： 导入和预览数据步骤1：绘制散点图（Scatter Plot） 步骤2：添加回归线（Regression Analysis） 步骤3：分类变量分析&…

阅读更多...

Mall，正在和年轻人重新对话

Mall，正在和年轻人重新对话

【潮汐商业评论/原创】结束了一下午的苦闷培训，当Cindy赶到重庆十字大道时，才发现十字路口上的巨大“飞行棋”在前两天就已经撤展了。 “来了又错过，就会觉得遗憾，毕竟这样的路口不多，展陈又不可能会返场。” 飞行棋…

阅读更多...

藏文作文写作业推荐什么学习工具？《藏文翻译词典》App值得你使用，一款好用准确的藏语词汇查询辞典！

藏文作文写作业推荐什么学习工具？《藏文翻译词典》App值得你使用，一款好用准确的藏语词汇查询辞典！

探索藏语的奥秘，体验藏族文化的魅力，尽在《藏文翻译词典》App。这款App是藏汉翻译的神器，也是藏语学习者的必备工具。在学习过程中遇到不会的藏语单词，可以使用《藏文翻译词典》App进行查询！ 主要特性： 藏…

阅读更多...

最新文章