想象一下,你擁有一個(gè)存儲(chǔ)出租倉(cāng)庫(kù),并雇人為你管理倉(cāng)庫(kù)。管理人員開始創(chuàng)建了一份電子表格,列明了所有租戶。幾個(gè)月過去了,一些租戶需要更多空間,另一些租戶則需要更少空間。租戶搬進(jìn)搬出。
又過了幾個(gè)月,這個(gè)電子表格已經(jīng)沒有更新,你不知道找誰收租或者誰租了哪個(gè)空間。你的租戶開始利用這個(gè)情況,由于你的收租過程并不準(zhǔn)確,他們就可以趁機(jī)在不交額外費(fèi)用的情況下使用更多空間。再進(jìn)一步想象,你在世界各地都有倉(cāng)庫(kù)…
對(duì)于非結(jié)構(gòu)化數(shù)據(jù),企業(yè)都面臨相同的問題。在企業(yè)內(nèi),人們進(jìn)來或離開,新部門需要訪問數(shù)據(jù),而一些部門已經(jīng)不再需要訪問權(quán)。這種“數(shù)據(jù)管理”大部分都是以電子表格來管理的,導(dǎo)致了大量時(shí)間密集型書面工作,如果信息不更新的話,電子表格就沒用了。
更大的問題是扣款模式并不是不存在或者沒有部署,而是沒有強(qiáng)制執(zhí)行。由于用戶并不需要對(duì)他們?cè)诰W(wǎng)絡(luò)附加存儲(chǔ)(NAS)控制器上使用的空間負(fù)責(zé),于是他們將所有信息都存儲(chǔ)在這些控制器上,而不知道這對(duì)企業(yè)成本造成的影響。當(dāng)你考慮一些這些數(shù)據(jù)將被復(fù)制以用于災(zāi)難恢復(fù)(DR)、快照和備份到磁帶(虛擬的、物理的,或者兩者皆有)等目的時(shí),這種成本將難以估計(jì)。
有幾個(gè)問題需要考慮。首先,大多數(shù)NAS廠商并不能處理大量企業(yè)級(jí)非結(jié)構(gòu)化數(shù)據(jù)。兩個(gè)最大NAS廠商(NetApp和EMC)都沒有解決全球命名空間問題或者讓其硬件根據(jù)需要向外擴(kuò)展,因?yàn)榛A(chǔ)設(shè)施由數(shù)據(jù)孤島組成,關(guān)聯(lián)一個(gè)數(shù)據(jù)孤島和另一個(gè)孤島并不存在簡(jiǎn)單的方法。在大多數(shù)情況下,NAS設(shè)備將數(shù)據(jù)作為工作組來處理,而不是全球客戶的單一大型scale-out(向外擴(kuò)展)NAS解決方案。
例如,微軟使用Active Directory(AD)解決了單一大型scale-out目錄服務(wù)。AD是單一數(shù)據(jù)庫(kù),對(duì)于跨國(guó)性企業(yè),AD物理分布在各地辦事處(如紐約、倫敦、新加坡、東京和法蘭克福等),AD主要處理復(fù)制。當(dāng)你查詢AD時(shí),你可以查找任何對(duì)象信息。如果用戶在紐約,他可以查詢?cè)跂|京的對(duì)象。但NAS并不能做到這一點(diǎn)。
因此,非結(jié)構(gòu)化數(shù)據(jù)只能從工作組級(jí)或者信息孤島來看待。要查詢NAS設(shè)備上的數(shù)據(jù),你需要登錄到一臺(tái)設(shè)備,然后登錄到另一臺(tái)來查詢另一臺(tái)NAS設(shè)備上的信息。NAS并不能像用戶使用AD那樣在整個(gè)企業(yè)內(nèi)查詢信息或者運(yùn)行報(bào)告。
其次,由于基于網(wǎng)絡(luò)文件共享(NFS)和CIFS的安全性從本質(zhì)上來看非常不同,真正多協(xié)議訪問可能造成失去安全控制或者不兼容問題。因?yàn)镃IFS是一項(xiàng)微軟的技術(shù),用戶賬戶信息存儲(chǔ)在AD中。使用Unix為基礎(chǔ)的NFS的公司使用NIS作為他們NFS的主要賬戶存儲(chǔ)庫(kù)。
這兩個(gè)獨(dú)立的賬戶存儲(chǔ)庫(kù)讓企業(yè)很難從單個(gè)應(yīng)用程序來管理全球數(shù)據(jù)。如果沒有堅(jiān)實(shí)的扣款機(jī)制(大部分企業(yè)沒有執(zhí)行),非結(jié)構(gòu)化數(shù)據(jù)的使用將無法問責(zé)。除非部署物理限制,再加上一個(gè)良好的扣款程序,用戶才會(huì)保存所有他們?cè)贜AS存儲(chǔ)上寫入和讀取的信息,非常像一個(gè)亂七八糟的衣柜。
非結(jié)構(gòu)化數(shù)據(jù)的管理對(duì)于企業(yè)來說是非常艱巨的任務(wù),而日常管理員需要對(duì)非結(jié)構(gòu)化數(shù)據(jù)有某種可視性。這個(gè)意味著需要一個(gè)解決方案,允許管理員從全球整體來查看他們的非結(jié)構(gòu)化數(shù)據(jù)。
有一次,作為美國(guó)最大銀行之一的全球NAS實(shí)驗(yàn)室的管理人員,我需要將一個(gè)NAS設(shè)備返還給廠商。首先,我需要安排設(shè)備清理。我花了很長(zhǎng)時(shí)間才弄清楚哪些人使用過這個(gè)NAS設(shè)備,最后,只能靠猜測(cè)。關(guān)于非結(jié)構(gòu)數(shù)據(jù)的基本問題都是很難回答的。誰訪問過NAS設(shè)備?這方面部署了怎樣的安全策略?如果我想要分層存儲(chǔ),哪些政策最有意義?
如果應(yīng)用程序可以將所有這些信息生成到一份報(bào)告中,那么中層管理人員就可以解釋為什么分層能夠?yàn)槠髽I(yè)節(jié)省成本,以及哪些分層政策最有意義。此外,IT安全人員將能夠查看和加強(qiáng)安全部署方法來解決數(shù)據(jù)安全方面的問題。操作人員可以監(jiān)控延遲情況,快速找出是誰造成NAS設(shè)備的延遲性。當(dāng)試圖從快照恢復(fù)虛擬機(jī)時(shí),如果一個(gè)應(yīng)用程序可以作為全球目錄,并追蹤文件存儲(chǔ)位置,以及提供日期和時(shí)間戳,基于磁盤備份的文件恢復(fù)將更快且更簡(jiǎn)單。
簡(jiǎn)而言之,目前的非結(jié)構(gòu)化數(shù)據(jù)的管理并不存在或者很糟糕。市場(chǎng)迫切地需要一個(gè)應(yīng)用程序能夠提供對(duì)非結(jié)構(gòu)化數(shù)據(jù)的真正可視性,這些非結(jié)構(gòu)化數(shù)據(jù)正呈直線上升,變得越來越難以管理。
原文鏈接:http://storage.it168.com/a2012/0118/1303/000001303623.shtml


