本文介绍了有关“如何在sql server中使用文件组和分区”的知识。很多人在实际案件操作中都会遇到这样的困难。接下来,让边肖带领大家学习如何应对这些情况!希望大家认真阅读,学点东西!
1.对于表分区和文件组的概念,基础知识还不是很清楚。今天,我们将通过具体的例子了解什么是文件组和分区以及它们的功能。
1.1通过文件组管理文件的特性从用户的角度来看,文件组中只需要为创建的对象存储三种类型的数据对象:表、索引和大对象(LOB)。
使用文件组可以隔离用户和文件,这样用户就可以为文件组而不是实际磁盘中的文件构建表和索引。也就是说,您可以指定表和索引存储在不同的文件中。
使用文件组管理文件可以使同一文件组中的不同文件分布在不同的硬盘上,大大提高了IO性能。
SQL SERVER将根据每个文件的初始大小和增长情况自动分配新添加的空间。假设同一个文件组中文件A的大小是文件B的两倍,新增加的数据占用三个pages,则两个Pages分配给文件A,一个Pages按比例分配给文件B。
1.2文件分类
第一个文件:是必须的,只能有一个文件。该文件还存储其他文件的位置等信息。分机是。mdf。
辅助文件:可以根据不同的目的,根据您的需要构建任意多个文件。分机是。ndf,用于存储数据而不是日志。
日志文件:使用存储日志。ldf扩展。
在SQL SERVER 2008之后,添加了文件流数据文件和全文索引文件。
我们可以通过view sys.database_files :查看数据库中的文件。
双击代码全选。
1从sys.database _ files中选择*
1.3创建文件组并在指定的文件组中创建索引。您可以通过TSQL语句或SSMS创建文件组,这将在后面提到。这里就不重复了。让我们专注于如何在指定的文件组中创建索引,而不是将其与数据放在一起。首先,我们来看看我创建的文件组,看看这些文件组对应的文件,如下图所示:
然后我们用下面的TSQL语句测试它。
双击代码全选。
一个
2
三
四
五
六
七
八
九
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28使用TESTDB
-第一步。插入数据
从AdventureWorks2008R2中选择*进入订单明细。销售。销售订单明细
- step2:检查表的索引信息,发现所有页面都在pagefid=1以上,indexid为0。因为在创建聚集索引之前有一个堆表。
dbcc ind (TESTDB,[dbo。OrderDetail],-1)
- step3:在分区上创建聚集索引。不要将聚集索引放在IndexStorage的文件组中,因为聚集索引是一个数字。
据本身。 --如果将聚集索引on IndexStorage的话,那么所有数据都将会在IndexStorage这个filegroup所对应的文件上
create
clustered
index
idx_c_SSalesOrderDetailID
on
OrderDetail(SalesOrderDetailID)
--step4:此时发现原先indexid=0的都变成了index=1
dbcc ind ( TESTDB, [dbo.OrderDetail], -1)
--step5:在IndexStorage这个file group上面创建非聚集索引
CREATE
NONCLUSTERED
INDEX
idx_nc_SalesOrderID
ON
dbo.OrderDetail(SalesOrderID)
on
IndexStorage
CREATE
NONCLUSTERED
INDEX
idx_nc_CarrierTrackingNumber
ON
dbo.OrderDetail(CarrierTrackingNumber)
on
IndexStorage
CREATE
NONCLUSTERED
INDEX
idx_nc_UnitPrice
ON
dbo.OrderDetail(UnitPrice)
on
IndexStorage
--step6:再次查看页信息我们发现只有indexid=1的pagefid=1,也就是说聚集索引都在TESTDB.MDF这个文件上,
--而indexid=2,3,4所对应的pagefid=3,表明已经将索引建立到IndexStorage这个filegroup上面去了,对应的是IndexStorage.ndf这个文件。
dbcc ind ( TESTDB, [dbo.OrderDetail], -1)
--step7:创建复合索引,
CREATE
NONCLUSTERED
INDEX
idx_nc_com
ON
dbo.OrderDetail(SalesOrderID,CarrierTrackingNumber,UnitPrice)
--step8:默认情况下会使用Primary这个filegroup,filefid=1.
dbcc ind ( TESTDB, [dbo.OrderDetail], -1)
总结:
-
在分区上创建聚集索引,聚集索引不要放在IndexStorage这个filegroup当中,因为聚集索引就是数据本身。如果将聚集索引on IndexStorage的话,那么所有数据都将会在IndexStorage这个filegroup所对应的文件上。
-
在创建非聚集索引的时候,通过在创建索引语句的最后加上 on [filegroup]指定需要将这个索引放在哪一个filegroup当中,如果不加的话会使用默认filegroup,我们这里的默认filegroup是priamry。
1.4使用多个文件的好处
使用多个文件分布数据到多个硬盘中可以极大的提高IO性能.放在一个磁盘中基本没有效果。
场景描述
应用程序发来大量的并发语句在修改同一张表格里的记录,而表格架构设计以及用户业务逻辑使得这些修改都集中在同一个页面,或者数量不多的几个页面上。这些页面有的时候也被称为Hot Page。这样的瓶颈通常只会发生在并发用户比较多的、典型的OLTP系统上。这种瓶颈是无法通过提高硬件配置解决的,只有通过修改表格设计或者业务逻辑,让修改分散到尽可能多的页面上,才能提高并发性能。
在现实环境里,可以试想下面的情形。一个股票交易系统,每一笔交易都会有一个流水号,是递增且不可重复的。而客户发过来的交易请求,都要存储在同一张交易表里。每一个新的交易,都要插入一条新记录。如果设计者选择在流水号上建聚集索引(这也是很自然的),就容易遇到Hot Page的PAGELATCH资源瓶颈。在同一时间,只能有一个用户插入一笔交易。
怎样才能解决或者缓解这种瓶颈呢?
-
最简单的方法,是换一个数据列建聚集索引,而不要建在Identity的字段上。这样表格里的数据就按照其他方式排序,同一时间的插入就有机会分散在不同的页面上。
-
如果实在是一定要在Identity的字段上建聚集索引,建议根据其他某个数据列在表格上建立若干个分区(Partition)。把一个表格分成若干个分区,可以使得接受新数据的页面数目增加。
还是以上面那个股票交易系统为例子。不同的股票属于不同的行业。开发者可以根据股票的行业属性,将一张交易表分成若干个分区。在SQL Server里,已分区表(Partitioned Table)的每个分区都是一个独立的存储单位。分属不同分区的数据行是严格分开存储的。所以同一个时间发生的交易记录,因其行业不同,也会被分别保存在不同的分区里。这样,在同一个时间点,可以插入不同行业的交易记录。每个分区上的Hot Page(接受新数据插入的page)就不那么hot了。
在我的事例中,是有一张SalesOrderDetail表,其数据量很大,我希望按照UnitPrice这个字段进行分区。下面来看具体步骤。
step1:创建filegroup
在sql server中好像没有create filegroup的说法,只是在现成的数据库中添加filegroup而已。下面的代码中首先创建数据库,然后添加四个filegroup,tsql代码如下所示:
1 2 3 4 5 6 7 8 9 10 11 12 |
--step1------ --创建数据库 create database TEST USE MASTER GO --40万行分成5个文件组,PRIMARY加下面四个文件组, --命名规则:FG_数据库名_表名_字段名_流水号 ALTER DATABASE TEST ADD FILEGROUP FG_TEST_SalesOrderDetail_UnitPrice_1; ALTER DATABASE TEST ADD FILEGROUP FG_TEST_SalesOrderDetail_UnitPrice_2; ALTER DATABASE TEST ADD FILEGROUP FG_TEST_SalesOrderDetail_UnitPrice_3; ALTER DATABASE TEST ADD FILEGROUP FG_TEST_SalesOrderDetail_UnitPrice_4; GO |
“sql server中filegroup与partition怎么使用”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注网站,小编将为大家输出更多高质量的实用文章!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/140989.html