本文解釋了SQL Server用于訪問和存儲(chǔ)數(shù)據(jù)的BLOB數(shù)據(jù)類型,解析了SQL Server BLOB數(shù)據(jù)存儲(chǔ),訪問的方法以及如果降低你的SQL Server BLOB存儲(chǔ)的每個(gè)字節(jié)的總成本。
BLOB數(shù)據(jù)是一個(gè)每條記錄都擁有大量數(shù)據(jù)的字段。這個(gè)數(shù)據(jù)可以是文本格式的或二進(jìn)制格式的。當(dāng)在SQL Server中使用BLOB數(shù)據(jù)時(shí),每條記錄的數(shù)據(jù)量一般都遠(yuǎn)遠(yuǎn)超過了一個(gè)單獨(dú)記錄的8K的限制。
有多種數(shù)據(jù)類型用于存儲(chǔ)BLOB數(shù)據(jù),并且它們隨著時(shí)間已有所改變。可用于BLOB存儲(chǔ)的數(shù)據(jù)類型很多年都沒有變,但是在SQL Server 2005中,微軟推出了許多新的數(shù)據(jù)類型。在SQL Server 2008中,微軟甚至計(jì)劃推出更多的數(shù)據(jù)類型,不過到目前為止,他們還沒有在CTP版本中推出這些數(shù)據(jù)類型。
在SQL Server 2000和更早的版本中,我們被限制于TEXT、NTEXT和IMAGE數(shù)據(jù)類型。TEXT數(shù)據(jù)類型是用于存儲(chǔ)非Unicode的BLOB數(shù)據(jù),而NTEXT數(shù)據(jù)類型是用于存儲(chǔ)Unicode 的BLOB數(shù)據(jù)。IMAGE數(shù)據(jù)類型是用于存儲(chǔ)二進(jìn)制BLOB數(shù)據(jù)的。你可以使用IMAGE數(shù)據(jù)類型來(lái)存儲(chǔ)任何二進(jìn)制數(shù)據(jù),例如圖片、office文檔、壓縮數(shù)據(jù)等等。因?yàn)閿?shù)據(jù)是二進(jìn)制格式的,所以它可以是Unicode的也可以是非Unicode的。
SQL Server 2005數(shù)據(jù)類型是基于VARCHAR、NVARCHAR、VARBINARY和XML的。在使用這些數(shù)據(jù)類型時(shí),一般你會(huì)指定要存儲(chǔ)的數(shù)據(jù)的最大規(guī)模。為了在這些字段里存儲(chǔ)BLOB數(shù)據(jù),你要指定字段的最大規(guī)模。這些數(shù)據(jù)類型允許你在每條記錄里最大存儲(chǔ)2GB的數(shù)據(jù)(對(duì)于字符和二進(jìn)制數(shù)據(jù)是2^31位,對(duì)于Unicode數(shù)據(jù)是2^30)。微軟計(jì)劃在未來(lái)的微軟SQL Server版本中刪除TEXT、NTEXT和IMAGE數(shù)據(jù)類型,它們的使用將會(huì)被轉(zhuǎn)換到新的VARCHAR(MAX)、NVARCHAR(MAX)、VARBINARY(MAX)和XML數(shù)據(jù)類型上。
CREATE TABLE BlobData
(ID int PRIMARY KEY,
FirstName nvarchar(30),
LastName nvarchar(30),
EmailAddress varchar(255),
[Resume] nvarchar(MAX))
在SQL Server 2008中,傳說我們會(huì)得到一個(gè)叫做FILESTREAM的新的數(shù)據(jù)類型,它可以將二進(jìn)制數(shù)據(jù)例如office文檔存儲(chǔ)到和普通的數(shù)據(jù)庫(kù)文件不同的地方。通過將這個(gè)數(shù)據(jù)存儲(chǔ)到和普通的MDF和NDF數(shù)據(jù)文件不同的地方,我們可以將它存儲(chǔ)到單獨(dú)的硬盤上來(lái)將訪問BLOB數(shù)據(jù)對(duì)數(shù)據(jù)庫(kù)中其余內(nèi)容造成的性能影響降到最低。
SQL Server BLOB數(shù)據(jù)怎么存儲(chǔ)和訪問?
在使用TEXT、NTEXT和IMAGE數(shù)據(jù)類型時(shí),數(shù)據(jù)是不和普通數(shù)據(jù)存儲(chǔ)在一起的。一個(gè)被稱作指針的很小的二進(jìn)制值,和普通數(shù)據(jù)存儲(chǔ)在一起。這個(gè)二進(jìn)制值指向數(shù)據(jù)文件里的數(shù)據(jù)實(shí)際存儲(chǔ)的位置。
當(dāng)存儲(chǔ)VARCHAR(MAX)、NVARCHAR(MAX)、VARBINARY(MAX)和XML數(shù)據(jù)類型的數(shù)據(jù)時(shí),如果數(shù)據(jù)小于一行數(shù)據(jù)8K的最大限制,那么這個(gè)數(shù)據(jù)被存儲(chǔ)到這個(gè)頁(yè)面內(nèi)。但是如果這個(gè)數(shù)據(jù)比一行數(shù)據(jù)8K的最大限制大的話,它會(huì)以和存儲(chǔ)遺留數(shù)據(jù)類型一樣的存儲(chǔ)方式來(lái)存儲(chǔ),并且它會(huì)通過一個(gè)二進(jìn)制指針的值被訪問。
注意:這個(gè)二進(jìn)制值和位置都是在后臺(tái)處理的,對(duì)于用戶是不可見的。
為了以TEXT、NTEXT和IMAGE數(shù)據(jù)類型讀取數(shù)據(jù),需要使用READTEXT命令。這個(gè)命令接受一個(gè)列名還有一個(gè)16位的二進(jìn)制指針,要讀取的第一個(gè)字符和要讀取的字符數(shù)目。它使用TEXTPTR函數(shù)來(lái)獲得正確的二進(jìn)制指針,這個(gè)二進(jìn)制指針是用于定位物理文件中的數(shù)據(jù)的:
DECLARE @ptr varbinary(16);
SELECT @ptr = TEXTPTR(LongText)
FROM TextDataExample
where TextID = 1
READTEXT TextDataExample.LongText @ptr 1 50;
與READTEXT命令類似的,還有一個(gè)WRITETEXT命令用于將數(shù)據(jù)插入到記錄中去。和READTEXT命令一樣,WRITETEXT命令使用TEXTPTR函數(shù)來(lái)定位物理文件中的數(shù)據(jù):
DECLARE @ptr varbinary(16);
SELECT @ptr = TEXTPTR(LongText)
FROM TextDataExample
where TextID = 1
READTEXT TextDataExample.LongText @ptr 'Sample data';
這些新的數(shù)據(jù)類型,不像他們之前的那些數(shù)據(jù)類型,它們可以不使用READTEXT 和WRITETEXT命令就可以很容易的被訪問到。這些新的數(shù)據(jù)類型能夠這么快就這么流行的一部分原因是因?yàn)橐褂盟麄儾恍枰~外的命令。你可以用我們平常操縱數(shù)據(jù)所使用的普通的SELECT、INSERT和UPDATE DML來(lái)使用這些數(shù)據(jù)類型。不幸的是,因?yàn)檫@個(gè)FILESTREAM數(shù)據(jù)類型還沒有發(fā)布,沒有關(guān)于怎樣使用它的示例代碼可以公布。
隨著分層存儲(chǔ)而出現(xiàn)的成本效率
使用一個(gè)叫做分層存儲(chǔ)的存儲(chǔ)設(shè)計(jì)是一個(gè)降低你的SQL Server BLOB存儲(chǔ)的每個(gè)字節(jié)的總成本的簡(jiǎn)單方法。有了分層存儲(chǔ)技術(shù),高訪問的數(shù)據(jù)被放置在更快,更貴的存儲(chǔ)器里。不是經(jīng)常訪問的數(shù)據(jù)放在慢一些、較便宜的存儲(chǔ)器上。通常情況下,BLOB數(shù)據(jù)被頻繁的訪問,而由于存儲(chǔ)在BLOB數(shù)據(jù)列中的信息數(shù)量,使用分層存儲(chǔ)通常是成本最有效的存儲(chǔ)方法。當(dāng)創(chuàng)建一個(gè)較便宜的存儲(chǔ)層時(shí),更大的、較慢的硬盤被用來(lái)創(chuàng)建第二個(gè)RAID數(shù)組,而這個(gè)RAID數(shù)組是用來(lái)存放第二個(gè)文件組的,該文件組存儲(chǔ)BLOB數(shù)據(jù)。
分層存儲(chǔ)是通過告訴SQL Server在一個(gè)獨(dú)立于行數(shù)據(jù)的文件組里存儲(chǔ)BLOB數(shù)據(jù)來(lái)使用的。這個(gè)指派發(fā)生在CREATE TABLE命令使用TEXTIMAGE_ON參數(shù)創(chuàng)建了這個(gè)表的時(shí)候。一個(gè)SQL Server表里的所有BLOB數(shù)據(jù)存儲(chǔ)在一個(gè)單獨(dú)的文件組里。如果你想在兩個(gè)文件間分離BLOB數(shù)據(jù),你必須同時(shí)將你的表分割為兩個(gè)表,并通過TEXTIMAGE_ON參數(shù)為每一個(gè)表指定一個(gè)不同的組:
CREATE TABLE TextDataExample
(TextID int IDENTITY(1,1),
TextDescription varchar(25),
LongText TEXT)
ON [PRIMARY] TEXTIMAGE_ON [TextDataFileGroup]
不幸的是,一旦表被創(chuàng)建了就沒有簡(jiǎn)單的方法來(lái)改變包含BLOB數(shù)據(jù)的文件組。移動(dòng)BLOB數(shù)據(jù)到另一個(gè)文件組的唯一方法是創(chuàng)建一個(gè)新的表,將數(shù)據(jù)復(fù)制到新的表里,刪除舊的表,然后將新的表重命名為正確的名稱。
假設(shè)你有一個(gè)用這個(gè)定義創(chuàng)建的表:
CREATE TABLE TextDataExample
(TextID int IDENTITY(1,1) PRIMARY KEY,
TextDescription varchar(25),
LongText TEXT)
ON [PRIMARY]
并且你想轉(zhuǎn)移數(shù)據(jù)到用這個(gè)定義創(chuàng)建的表上:
CREATE TABLE TextDataExample
(TextID int IDENTITY(1,1) PRIMARY KEY,
TextDescription varchar(25),
LongText TEXT)
ON [PRIMARY] TEXTIMAGE_ON [TextDataFileGroup]
那你要用一個(gè)與這個(gè)類似的腳本:
CREATE TABLE TextDataExample_Temp
(TextID int IDENTITY(1,1) PRIMARY KEY,
TextDescription varchar(25),
LongText TEXT)
ON [PRIMARY] TEXTIMAGE_ON [TextDataFileGroup]
SET IDENTITY_INSERT TextDataExample_Temp ON
INSERT INTO TextDataExample_Temp
(TextID, TextDescription, LongText)
SELECT TextID, TextDescription, LongText
FROM TextDataExample WITH (TABLOCK)
SET IDENTITY_INSERT TextDataExample_Temp OFF
DROP TABLE TextDataExample
exec sp_rename 'TextDataExample_Temp',
'TextDataExample', 'object'
在這個(gè)過程中要確保在刪除舊表以后在新的表上重新創(chuàng)建所有需要的索引。這些索引應(yīng)該在舊表被刪除之后創(chuàng)建,以便萬(wàn)一任何腳本或存儲(chǔ)過程要求唯一的索引名稱才是有效的,那這樣相同的索引名稱就可以使用了。
既然SQL Server支持BLOB數(shù)據(jù),你在存儲(chǔ)BLOB數(shù)據(jù)到SQL Server中時(shí),一定要謹(jǐn)慎。存儲(chǔ)大量BLOB數(shù)據(jù)到你的數(shù)據(jù)庫(kù)中會(huì)影響你的數(shù)據(jù)庫(kù)性能。雖然有一些方法可以在性能方面給你些幫助,但是它通常最終導(dǎo)致將BLOB數(shù)據(jù)移出SQL Server數(shù)據(jù)庫(kù)存入文件系統(tǒng)。雖然這時(shí)把BLOB數(shù)據(jù)存放在數(shù)據(jù)庫(kù)里看起來(lái)是一個(gè)簡(jiǎn)單的解決方案,但它會(huì)導(dǎo)致后來(lái)隨著系統(tǒng)發(fā)展而來(lái)的性能問題。這個(gè)文件系統(tǒng)對(duì)于BLOB數(shù)據(jù)來(lái)說通常是最好的存放地址,但是如果你選擇存放到數(shù)據(jù)庫(kù)中,一定要確保小心使用。
安徽新華電腦學(xué)校專業(yè)職業(yè)規(guī)劃師為你提供更多幫助【在線咨詢】
解析SQL Server的數(shù)據(jù)類型 BLOB
2010-01-17 10:50:16 作者: 來(lái)源:
相關(guān)熱詞搜索:類型 數(shù)據(jù)