microsoft? sql server? 2000 收集关于存储在数据库中的索引和列数据的统计信息。sql server 查询优化器使用这些统计信息来选择用于执行 insert、select、delete 或 update 查询的最有效方案。本文说明了收集的数据类型、数据的存储位置以及用于创建、更新与删除统计的命令。默认情况下,sql server 2000 会自动创建和更新统计(当此类操作有用时)。本文也概括介绍了如何在不同的级别(索引、表和数据库)上更改这些默认值。
sql server 2000 既收集关于单个列的统计信息(单列统计),也收集关于成组的列的统计信息(多列统计)。关于一个统计对象的所有信息存储在 sysindexes 表中一行的多个列中。计算列以及数据类型为 ntext、text 或 image 的列不能被指定为统计列。组成一个统计集的所有列的总宽度不能超过 900 字节。
注意: 直方图是给定列的最多 200 个值的集合。给定列中的所有值(如果通过抽样来收集统计信息,则为选定的值)会被排序;排序后序列最多会划分为 199 个间隔,以便得到最有效的统计。一般,这些间距的大小并不相等。以下数值与直方图的每个步长存储在一起。
表 1:直方图的值
| range_hi_key | 键值 |
| eq_rows | 指定与 range_hi_key 精确相等的行数。 |
| range_rows | 指定区间中的行数。(这些行小于这个 range_hi_key,但大于上一个较小的区间键值)。 |
| density | 指定 1/n,其中 n 表示区间中互不相同的值的数目。 |
使用 dbcc show_statistics 命令时显示的是两个导出值而不是 density 信息。
表 2:用两个导出值显示 dbcc show_statistics 的直方图
| distinct_range_rows | 指定此区间中互不相同的行的数目(不算 range_hi_key 值本身);distinct_range_rows = 1 / density。 |
| avg_range_rows | 区间中每个特定值的平均行数;avg_range_rows = density * range_rows。 |
sql server 2000 中的直方图只用于单个列、多列统计中的第一列或者索引。
sql server 2000 按照三个步骤从排序后的列值集合生成直方图。第一步,最多收集 200 个 range_hi_key、eq_rows、range_rows 和 distinc_range_rows 的值。第二步,对每个其他的列值进行处理:该值或者被添加到上一个区间中(对值进行排序),或者创建一个新区间。如果是创建一个新区间,则两个现有的相邻区间会合并到一个区间中。sql server 2000 通过密度信息来选择要合并的区间,使密度最接近的两个相邻区间被合并,从而将信息的损失降到最低程度。第三步,合并更多的密度接近的区间。因此,即使列中的唯一值个数超过 200,直方图的步数也可能会小于 200。
如果通过抽样来生成直方图,那么 range_rows、eq_rows、distinct_range_rows 和 avg_range_rows 的值将为估计值,因此它们不必都是整数。
密度是关于给定列或列的组合中重复项数目的信息,其计算公式为 1/(互不相同的值的数目)。如果在相等条件判断表达式中使用了某个列,则会使用从直方图导出的密度来估算符合条件的行数。直方图通常用于估算不等条件判断表达式。
注意: dbcc show_statistics 的第一行中会显示一个单独的密度值,但 sql server 2000 中的优化器不使用该值。
一个列集合的多列统计包括以下信息:统计定义中第一个列的直方图,第一个列的密度值,以及每个列的前缀组合(单独包括第一个列)的密度值。每个统计集(一个直方图加上两个或多个密度值)都存储在 sysindexes 表的一行中,同一行中还包括上次更新统计的时间戳、用于生成统计信息的抽样行数、直方图的步数和平均键数。sql server 2000 只为编号为 0 或 1 的索引(堆索引或群集索引)维护行数的值(rowcnt 列),并在表中的所有索引中复制该值。同样,sql server 2000 也为每个表和索引维护 dpages。如果收集统计信息时表中没有任何行,则该表的统计信息为空。
使用 sp_helpindex 和 sp_helpstats 可以显示给定表中所有可用统计的列表,sp_helpindex 列出了表中的所有索引,而 sp_helpstats 则列出了表中的所有统计。每个索引都带有其中列的统计信息。在相同的列中,使用 create statistics 命令创建的统计信息与使用 create index 命令生成的统计信息等价。唯一的差别在于,create statistics 命令默认采用抽样方式,而 create index 命令则由于必须处理索引的所有行,因而使用 fullscan 收集统计信息。
下面是罗斯文数据库中 order details 表的所有索引和统计的示例。因为最初无索引的列上没有任何统计信息,所以在连接到罗斯文数据库后,请先运行 sp_createstats。
表 3:罗斯文数据库中的 order details 表
sp_helpindex [order details]
| index_name | index_description | index_keys |
| orderid | primary 上的非群集索引 | orderid |
| pk_order_details | primary 上群集的唯一主键 | orderid、productid |
| productid | primary 上的非群集索引 | productid |
sp_helpstats [order details]
| statistics_name | statistics_keys |
| discount | discount |
| quantity | quantity |
| unitprice | unitprice |
也可以象下面这样使用 dbcc show_statistics 命令来显示统计信息:
dbcc show_statistics ([order details],pk_order_details)如果没有返回任何信息,则表明上次已经更新了统计,或在表中没有任何行时就创建了索引。要更新 order details 表的统计,请运行 update statistics [order details];要更新罗斯文数据库中所有表的统计,请运行 sp_updatestats。
注意: 该命令的输出已经增强了可读性。
Java Asp PHP .Net XML C/C++ CGI VB Jsp J2ee J2se J2me EJB Servlet Tomcat Resin Struts Weblogic Eclipse ANT GUI JMS Web servise IDEA Webphere Hibernate Spring Jboss Applet Swing Socket Javamail Perl Ajax P2P 安全 模式 框架 测试 开源 游戏
Windows XP Windows 2000 Windows 2003 Windows Me Windows 9.x Linux UNIX 注册表 操作系统 服务器 应用服务器