mysql中关于冗余和重复索引


本文摘自PHP中文网,作者一个新手,侵删。

mysql允许在相同列上创建多个索引,无论是有意还是无意,mysql需要单独维护重复的索引,并且优化器在优化查询的时候也需要逐个地进行考虑,这会影响性能。

  重复索引是指的在相同的列上按照相同的顺序创建的相同类型的索引,应该避免这样创建重复索引,发现以后也应该立即删除。但,在相同的列上创建不同类型的索引来满足不同的查询需求是可以的。


1

2

3

4

5

CREATE TABLE test(

  ID INT NOT NULL PRIMARY KEY,

  A INT NOT NULL,

  B INT NOT NULLUNIQUE(ID),  INDEX(ID),

) ENGINE=InnoDB;

  这段SQL创建了3个重复索引。通常并没有理由这么做。

  冗余索引和重复索引有一些不同,如果创建了索引(a,b),再创建索引(a)就是冗余索引,因为这只是前面一个索引的前缀索引,因此(a,b)也可以当作(a)来使用,但是(b,a)就不是冗余索引,索引(b)也不是,因为b不是索引(a,b)的最左前缀列,另外,其他不同类型的索引在相同列上创建(如哈希索引和全文索引)不会是B-Tree索引的冗余索引,而无论覆盖的索引列是什么。

  冗余索引通常发生再为表添加新索引的时候。例如,有人可能会增加一个新的索引(A,B)而不是扩展以后的索引(A)。还有一种情况是将一个索引扩展为(A,ID),其中ID是主键,对于InnoDB来说主键已经包含在二级索引中了,所以这也是冗余的。

  大多数情况下都不需要冗余索引,应该尽量扩展已有的索引而不是创建新索引,但也有时候处于性能方面的考虑需要冗余索引,因为扩展已有的索引会导致其变得太大,从而影响其他使用该索引的查询性能。如:如果在整数列上有一个索引,现在需要额外增加一个很长的varchar列来扩展该索引,那么性可能会急剧下降,特别是有查询把这个索引当作覆盖索引,或者这是myisam表并且有很多范围查询的时候(由于myisam的前缀压缩)

  比如,有一张userinfo表。这个表有1000000条数据,对每个state_id值大概有20000条记录。在state_id有一个索引,那么下面的SQL我们称之为Q1


1

SELECT count(*) FROM userinfo WHERE state_id=5; --Q1

  改查询的执行速度大概是每秒115次(QPS)

  还有一个SQL,我们称之为Q2


1

SELECT state_id,city,address FROM userinfo WHERE state_id=5; --Q2

  这个查询的QPS是10,提升该索引性能最简单的办法就是狂战索引为(state_id,city,address),让索引能覆盖查询:


1

ALERT TABLE userinfo ADD KEY state_id_2(state_id,city,address);

  (注:state_id已经有索引了,根据前面的概念,这是一个冗余索引而不是重复索引)

怎么找出冗余索引和重复索引呢?

1.可以使用Shlomi Noach的common_schema中的一些试图来定位,common_schema是一系列可以安装到服务器上的常用的存储和试图。

2.可以使用Percona Toolkit中的pt_duplicate-key-checker,该工具通过分析表结构来找出冗余和重复的索引。

以上就是mysql中关于冗余和重复索引 的详细内容,更多文章请关注木庄网络博客

相关阅读 >>

mysql查看是否锁表

mysql中 in和not in用法详解

linux如何线上安装mysql

mysql连不上localhost怎么办?

mysql中常用的技能介绍

mysql explain的作用是什么?

mysql表格不显示中文,乱码怎么办

总结mysql存储过程in、out、inout参数示例

mysql数据表中字段的数据类型有哪些?

如何将node.js与mysql连接?

更多相关阅读请进入《mysql》频道 >>


数据库系统概念 第6版
书籍

数据库系统概念 第6版

机械工业出版社

本书主要讲述了数据模型、基于对象的数据库和XML、数据存储和查询、事务管理、体系结构等方面的内容。



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...