浅谈SQL Server中统计对于查询的影响分析


本文整理自网络,侵删。

而每次查询分析器寻找路径时,并不会每一次都去统计索引中包含的行数,值的范围等,而是根据一定条件创建和更新这些信息后保存到数据库中,这也就是所谓的统计信息。

如何查看统计信息
查看SQL Server的统计信息非常简单,使用如下指令:
DBCC SHOW_STATISTICS('表名','索引名')

所得到的结果如图1所示。

   

    图1.统计信息

统计信息如何影响查询

    下面我们通过一个简单的例子来看统计信息是如何影响查询分析器。我建立一个测试表,有两个INT值的列,其中id为自增,ref上建立非聚集索引,插入100条数据,从1到100,再插入9900条等于100的数据。图1中的统计信息就是示例数据的统计信息。

    此时,我where后使用ref值作为查询条件,但是给定不同的值,我们可以看出根据统计信息,查询分析器做出了不同的选择,如图2所示。

   

     图2.根据不同的谓词,查询优化器做了不同的选择

     其实,对于查询分析器来说,柱状图对于直接可以确定的谓词非常管用,这些谓词比如:

    where date = getdate()
    where id= 12345
    where monthly_sales < 10000 / 12
    where name like “Careyson” + “%”

    但是对于比如

    where price = @vari
    where total_sales > (select sum(qty) from sales)
    where a.id =b.ref_id

    where col1 =1 and col2=2

    这类在运行时才能知道值的查询,采样步长就明显不是那么好用了。另外,上面第四行如果谓词是两个查询条件,使用采样步长也并不好用。因为无论索引有多少列,采样步长仅仅存储索引的第一列。当柱状图不再好用时,SQL Server使用密度来确定最佳的查询路线。

    密度的公式是:1/表中唯一值的 个数。当密度越小时,索引越容易被选中。比如图1中的第二个表,我们可以通过如下公式来计算一下密度:

   

    图3.某一列的密度

    根据公式可以推断,当表中的数据量逐渐增大时,密度会越来越小。

    对于那些不能根据采样步长做出选择的查询,查询分析器使用密度来估计行数,这个公式为:估计的行数=表中的行数*密度

    那么,根据这个公式,如果我做查询时,估计的行数就会为如图4所示的数字。

   

    图4.估计的行数

阅读剩余部分

相关阅读 >>

mybatis中mapper.xml文件的常用属性及标签讲解

sql server 2008中的代码安全(八)透明加密(tde)

sql优化经验总结

navicat怎么执行sql

sql server中常用截取字符串函数介绍

sql点滴24 监测表的变化

sql创建表后如何输入数据

sql数据库删除数据如何恢复

简述mysql explain 命令

sql server 怎么创建数据库?

更多相关阅读请进入《sql》频道 >>


数据库系统概念 第6版
书籍

数据库系统概念 第6版

机械工业出版社

本书主要讲述了数据模型、基于对象的数据库和XML、数据存储和查询、事务管理、体系结构等方面的内容。



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...