本文摘自PHP中文网,作者不言,侵删。
本篇文章给大家带来的内容是关于MySQL线程处于Opening tables的问题解决(附示例) ,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
问题描述
最近有一台MySQL5.6.21的服务器,在应用发布后,并发线程Threads_running迅速升高,达到2000左右,大量线程处于等待Opening tables、closing tables状态,应用端相关逻辑访问超时。
【分析过程】
1、16:10应用发布结束后,Opened_tables不断增加,如下图所示:
查看当时故障期间抓取的pt-stalk日志文件,时间点2019-01-18 16:29:37,Open_tables 的值为3430,而table_open_cache的配置值为2000。 当Open_tables值大于table_open_cache值时,每次新的session打开表,有一些无法命中table cache,而不得不重新打开表。这样反应出来的现象就是有大量的线程处于opening tables状态。
2、这个实例下的表,加上系统数据库下总计851张,远小于table_open_cache的2000,为什么会导致Open_tables达到3430呢 从官方文档中可以得到解释, https://dev.mysql.com/doc/refman/5.6/en/table-cache.html
1
table_open_cache
is
related
to
max_connections.
For
example,
for
200 concurrent running connections, specify a
table
cache
size
of
at
least 200 * N,
where
N
is
the maximum number
of
tables per
join
in
any
of
the queries which you
execute
.
当时并发线程数达到1980,假设这些并发连接中有30%是访问2张表,其他都是单表,那么cache size就会达到(1980*30%*2+1980*70%*1)=2574
3、QPS在发布前后都比较平稳,从外部请求来看并没有突增的连接请求,但在发布后threads_running上升到接近2000的高位,一直持续。猜测是由于某个发布的SQL语句触发了问题。
4、查看当时抓取的processlist信息,有一句SQL并发访问很高,查询了8张物理表,SQL样本如下:
1
<code>
select
id,
name
,email
from
table1
left
join
table2<br>
union
all
<br>
select
id,
name
,email
from
table3
left
join
table4<br>
union
all
<br>
select
id,
name
,email
from
table5
left
join
table6<br>
union
all
<br>
select
id,
name
,email
from
table7
left
join
table8<br>
where
id
in
(
'aaa'
);</code>
5、在测试环境中创建相同的8张表,清空表缓存,单个session执行SQL前后对比,Open_tables的值会增加8,如果高并发的情况下,Open_tables的值就会大幅增加。
问题重现
在测试环境上模拟高并发访问的场景,并发1000个线程同时执行上面的SQL语句,复现了生产环境类似的现象,Open_tables迅速达到3800,大量进程处于Opening tables、closing tables状态。
优化方案
1、 定位到问题原因后,我们与开发同事沟通,建议优化该SQL,降低单句SQL查询表的数量或大幅降低该SQL的并发访问频率。 不过开发同事还没来的及优化,生产环境上故障又出现了。当时DBA排障时将table_open_cache从2000增加4000,CPU使用率上升,效果并不明显,等待Opening tables的问题依然存在。
2、 分析故障期间抓取的pstack信息,用pt-pmp聚合后,看到大量线程在open_table时等待mutex资源:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
#0 0x0000003f0900e334
in
__lll_lock_wait ()
from
/lib64/libpthread.so.0
#1 0x0000003f0900960e
in
_L_lock_995 ()
from
/lib64/libpthread.so.0
#2 0x0000003f09009576
in
pthread_mutex_lock ()
from
/lib64/libpthread.so.0
#3 0x000000000069ce98
in
open_table(THD*, TABLE_LIST*, Open_table_context*) ()
#4 0x000000000069f2ba
in
open_tables(THD*, TABLE_LIST**, unsigned
int
*, unsigned
int
, Prelocking_strategy*) ()
#5 0x000000000069f3df
in
open_normal_and_derived_tables(THD*, TABLE_LIST*, unsigned
int
) ()
#6 0x00000000006de821
in
execute_sqlcom_select(THD*, TABLE_LIST*) ()
#7 0x00000000006e13cf
in
mysql_execute_command(THD*) ()
#8 0x00000000006e4d8f
in
mysql_parse(THD*,
char
*, unsigned
int
, Parser_state*) ()
#9 0x00000000006e62cb
in
dispatch_command(enum_server_command, THD*,
char
*, unsigned
int
) ()
#10 0x00000000006b304f
in
do_handle_one_connection(THD*) ()
#11 0x00000000006b3177
in
handle_one_connection ()
#12 0x0000000000afe5ca
in
pfs_spawn_thread ()
#13 0x0000003f09007aa1
in
start_thread ()
from
/lib64/libpthread.so.0
#14 0x0000003f088e893d
in
clone ()
from
/lib64/libc.so.6
这时table_cache_manager中的mutex冲突非常严重。 由于MySQL5.6.21下table_open_cache_instances参数的默认值为1,想到增大table_open_cache_instances参数,增加表缓存分区,应该可以缓解争用。
3、 在测试环境上,我们调整两个参数table_open_cache_instances=32,table_open_cache=6000,同样并发1000个线程执行问题SQL,这次等待Opening tables、closing tables的线程消失了,MySQL的QPS也从12000上升到55000。 对比相同情况下,只调整table_open_cache=6000,等待Opening tables的进程数从861下降到203,问题有所缓解,有600多个进程已经从等待Opening tables变为运行状态,QPS上升到40000左右,但不能根治。
源码分析
查了下代码有关table_open_cache的相关逻辑: 1、Table_cache::add_used_table函数如下,当新的连接打开的表在table cache中不存在时,打开表加入到used tables list:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
bool Table_cache::add_used_table(THD *thd,
TABLE
*
table
)
{
Table_cache_element *el;
assert_owner();
DBUG_ASSERT(
table
->in_use == thd);
/*
Try
to
get Table_cache_element representing this
table
in
the cache
from
array
in
the TABLE_SHARE.
*/
el=
table
->s->cache_element[table_cache_manager.cache_index(this)];
if (!el)
{
/*
If TABLE_SHARE doesn't have pointer
to
the element representing
table
in
this cache, the element
for
the
table
must be absent
from
table
the
cache.
Allocate new Table_cache_element object
and
add
it
to
the cache
and
array
in
TABLE_SHARE.
*/
DBUG_ASSERT(! my_hash_search(&m_cache,
(uchar*)
table
->s->table_cache_key.str,
table
->s->table_cache_key.length));
if (!(el= new Table_cache_element(
table
->s)))
return
true
;
if (my_hash_insert(&m_cache, (uchar*)el))
{
delete
el;
return
true
;
}
table
->s->cache_element[table_cache_manager.cache_index(this)]= el;
}
/*
Add
table
to
the used tables list */
el->used_tables.push_front(
table
);
m_table_count++; free_unused_tables_if_necessary(thd);
return
false
;
}
2、每次add_used_table会调用Table_cache::free_unused_tables_if_necessary函数,当满足m_table_count > table_cache_size_per_instance &&m_unused_tables时,执行remove_table,清除m_unused_tables列表中多余的cache。其中table_cache_size_per_instance= table_cache_size / table_cache_instances,MySQL5.6的默认配置是2000/1=2000,当m_table_count值大于2000并且m_unused_tables非空时就执行remove_table,将m_unused_tables中的table cache清空。这样m_table_count就是Open_tables的值正常会维持在2000上下。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
void Table_cache::free_unused_tables_if_necessary(THD *thd)
{
/*
We have too many
TABLE
instances around let us try
to
get rid
of
them.
Note that we might need
to
free
more than one
TABLE
object,
and
thus
need the below loop,
in
case
when
table_cache_size
is
changed dynamically,
at
server run
time
.
*/
if (m_table_count > table_cache_size_per_instance && m_unused_tables)
{
mysql_mutex_lock(&LOCK_open);
while (m_table_count > table_cache_size_per_instance &&
m_unused_tables)
{
TABLE
*table_to_free= m_unused_tables;
remove_table(table_to_free);
intern_close_table(table_to_free);
thd->status_var.table_open_cache_overflows++;
}
mysql_mutex_unlock(&LOCK_open);
}
}
3、增大table_cache_instances为32,当Open_tables超过(2000/32=62)时,就会满足条件,加速上述逻辑中m_unused_tables的清理,使得table cache中数量进一步减少,会导致Table_open_cache_overflows升高。
4、当table_open_cache_instances从1增大到32时,1个LOCK_open锁分散到32个m_lock的mutex上,大大降低了锁的争用。
1
2
3
4
void lock() { mysql_mutex_lock(&m_lock); }
void unlock() { mysql_mutex_unlock(&m_lock); }
解决问题
我们生产环境同时采取下面优化措施,问题得以解决: 1、 读写分离,增加read节点,分散master库的压力; 2、 调整table_open_cache_instances=16; 3、 调整table_open_cache=6000;
总结
当出现Opening tables等待问题时, 1、建议找出打开表频繁的SQL语句,优化该SQL,降低单句SQL查询表的数量或大幅降低该SQL的并发访问频率。
2、设置合适的table cache,同时增大table_open_cache_instances和 table_open_cache参数的值。
以上就是MySQL线程处于Opening tables的问题解决(附示例) 的详细内容,更多文章请关注木庄网络博客 !
相关阅读 >>
mysql 实现字符串截取的图文教程
mysql binlog怎么看
如何使用mysql 表连接
ddl语句的实例详解
mysql 学习之数据库检索语句dql大全小白篇
mysql ddl语句的使用
mac安装mysql 图形化工具?
在cnetos7上搭建mysql 主从服务
mysql 外键约束怎么写
django 修改mysql 数据
更多相关阅读请进入《mysql 》频道 >>
¥41.1元 机械工业出版社
本书主要讲述了数据模型、基于对象的数据库和XML、数据存储和查询、事务管理、体系结构等方面的内容。
转载请注明出处:木庄网络博客 » MySQL线程处于Opening tables的问题解决(附示例)