分析优化Mysql 多表联合查询效率


本文摘自PHP中文网,作者小云云,侵删。

mysql大数据查询优化对于许多站长来讲都不会仔细的去分析了,对于这个问题小编最近碰到一个100W数据优化问题了,下面整理了一些mysql关联查询优化的测试及相关分析希望能帮助到大家。

相关mysql视频教程推荐:《mysql教程》

一,简单的关联子查询的一种优化 .

很多时候,在mysql上实现的子查询的性能较差,这听起来实在有点难过。特别有时候,用到IN()子查询语句时,对于上了某种数量级的表来说,耗时多的难以估计。本人mysql知识所涉不深,只能慢慢摸透个中玄机了。
假设有这样的一个exists查询语句:

1

2

3

select * from table1

 where exists

     (select * from table2 where id>=30000 and table1.uuid=table2.uuid);

table1为十万行级的表,table2为百万行级的表,本机测试结果用时2.40s。

通过explain可以看到子查询是一个相关子查询(DEPENDENCE SUBQUERY); Mysql会首先对外表table1进行全表扫描,然后根据返回的uuid逐次执行子查询。如果外层表是一个很大的表,我们可以想象查询性能会表现得比此次测试更糟糕。

一种简单的优化方案为使用inner join的方法来代替子查询, 查询语句则可以改为:

1

select * from table1 innner join table2 using(uuid) where table2.id>=30000;

本机测试结果用时0.68s。

通过explain可以看到mysql使用了SIMPLE类型(子查询或union以外的查询方式); Mysql优化器会先过滤table2,然后对table1和table2做笛卡尔积得出结果集后,再通过on条件来过滤数据。

二、多表联合查询效率分析及优化
1. 多表连接类型
1. 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如:

1

2

3

4

5

6

01.SELECT * FROM table1 CROSS JOIN table2  

02.SELECT * FROM table1 JOIN table2  

03.SELECT * FROM table1,table2 

SELECT * FROM table1 CROSS JOIN table2

SELECT * FROM table1 JOIN table2

SELECT * FROM table1,table2

由于其返回的结果为被连接的两个数据表的乘积,因此当有WHERE, ON或USING条件的时候一般不建议使用,因为当数据表项目太多的时候,会非常慢。一般使用LEFT [OUTER] JOIN或者RIGHT [OUTER] JOIN

2. 内连接INNER JOIN 在MySQL中把INNER JOIN叫做等值连接,即需要指定等值连接条件在MySQL中CROSS和INNER JOIN被划分在一起。 join_table: table_reference [INNER | CROSS] JOIN table_factor [join_condition]

3. MySQL中的外连接,分为左外连接和右连接,即除了返回符合连接条件的结果之外,还要返回左表(左连接)或者右表(右连接)中不符合连接条件的结果,相对应的使用NULL对应。

例子:

user表:

1

2

3

4

5

id | name

  ―――

  1 | libk

  2 | zyfon

  3 | daodao

user_action表:

1

2

3

4

5

6

7

user_id | action

  ―――――

  1 | jump

  1 | kick

  1 | jump

  2 | run

  4 | swim

sql:

1

2

3

4

5

6

7

8

9

10

11

01.select id, name, action from user as

02.left join user_action a on u.id = a.user_id 

select id, name, action from user as u

left join user_action a on u.id = a.user_idresult:

id | name    | action

――――――――――?C

1  | libk         | jump           ①

1  | libk         | kick             ②

1  | libk         | jump           ③

2  | zyfon      | run               ④

3  | daodao | null              ⑤

分析:
注意到user_action中还有一个user_id=4, action=swim的纪录,但是没有在结果中出现,
而user表中的id=3, name=daodao的用户在user_action中没有相应的纪录,但是却出现在了结果集中
因为现在是left join,所有的工作以left为准.
结果1,2,3,4都是既在左表又在右表的纪录,5是只在左表,不在右表的纪录

工作原理:

从左表读出一条,选出所有与on匹配的右表纪录(n条)进行连接,形成n条纪录(包括重复的行,如:结果1和结果3),如果右边没有与on条件匹配的表,那连接的字段都是null.然后继续读下一条。

引申:
我们可以用右表没有on匹配则显示null的规律, 来找出所有在左表,不在右表的纪录, 注意用来判断的那列必须声明为not null的。
如:
sql:

1

2

3

4

5

6

01.select id, name, action from user as

02.left join user_action a on u.id = a.user_id 

03.where a.user_id is NULL 

select id, name, action from user as u

left join user_action a on u.id = a.user_id

where a.user_id is NULL

(注意:

1.列值为null应该用is null 而不能用=NULL
2.这里a.user_id 列必须声明为 NOT NULL 的.)
上面sql的result:

1

2

3

4

id | name | action 

 ――――――――?C 

 3 | daodao | NULL

――――――――――――――――――――――――――?C

一般用法:

a. LEFT [OUTER] JOIN:

除了返回符合连接条件的结果之外,还需要显示左表中不符合连接条件的数据列,相对应使用NULL对应

1

2

3

01.SELECT column_name FROM table1 LEFT [OUTER] JOIN table2 ON table1.column=table2.column 

 SELECT column_name FROM table1 LEFT [OUTER] JOIN table2 ON table1.column=table2.column

b. RIGHT [OUTER] JOIN:

RIGHT与LEFT JOIN相似不同的仅仅是除了显示符合连接条件的结果之外,还需要显示右表中不符合连接条件的数据列,相应使用NULL对应

1

2

01.SELECT column_name FROM table1 RIGHT [OUTER] JOIN table2 ON table1.column=table2.column 

  SELECT column_name FROM table1 RIGHT [OUTER] JOIN table2 ON table1.column=table2.columnTips:

1. on a.c1 = b.c1 等同于 using(c1)
2. INNER JOIN 和 , (逗号) 在语义上是等同的
3. 当 MySQL 在从一个表中检索信息时,你可以提示它选择了哪一个索引。
如果 EXPLAIN 显示 MySQL 使用了可能的索引列表中错误的索引,这个特性将是很有用的。
通过指定 USE INDEX (key_list),你可以告诉 MySQL 使用可能的索引中最合适的一个索引在表中查找记录行。
可选的二选一句法 IGNORE INDEX (key_list) 可被用于告诉 MySQL 不使用特定的索引。如:

1

2

3

4

5

6

7

8

01.mysql> SELECT * FROM table1 USE INDEX (key1,key2) 

02.-> WHERE key1=1 AND key2=2 AND key3=3; 

03.mysql> SELECT * FROM table1 IGNORE INDEX (key3) 

04.-> WHERE key1=1 AND key2=2 AND key3=3; 

mysql> SELECT * FROM table1 USE INDEX (key1,key2)

-> WHERE key1=1 AND key2=2 AND key3=3;

mysql> SELECT * FROM table1 IGNORE INDEX (key3)

-> WHERE key1=1 AND key2=2 AND key3=3;

2. 表连接的约束条件
添加显示条件WHERE, ON, USING

阅读剩余部分

相关阅读 >>

mysql高级知识之 架构介绍

使用phpmyadmin怎样修改mysql密码

mysql的db文件怎么打开?

mysql怎样重新编辑表

mysql 如何利用分片来解决 500 亿数据的存储问题

mysql集群压测的详细介绍

解决mysql收缩事务日志及问题解决办法

mysql性能优化

mysql8.0连接协议及3306、33060、33062端口的作用解析

mysql的初始密码在哪看

更多相关阅读请进入《mysql》频道 >>


数据库系统概念 第6版
书籍

数据库系统概念 第6版

机械工业出版社

本书主要讲述了数据模型、基于对象的数据库和XML、数据存储和查询、事务管理、体系结构等方面的内容。



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...