大數(shù)據(jù)往往來自全新的數(shù)據(jù)源,其中非結(jié)構(gòu)化數(shù)據(jù)是絕對的主力軍。非結(jié)構(gòu)化數(shù)據(jù)是指那些不方便使用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù),包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報(bào)表、圖像和音頻/視頻信息等。IDC報(bào)告指出,全球數(shù)據(jù)量每18個月就要翻一番,每年全球產(chǎn)生的數(shù)據(jù)量已經(jīng)高達(dá)40EB(1EB=1000PB),而這些瘋狂增長的數(shù)據(jù)則主要來自于非結(jié)構(gòu)化數(shù)據(jù)。
隨著大數(shù)據(jù)研究的不斷深入,非結(jié)構(gòu)化數(shù)據(jù)的作用日益凸顯。據(jù)凱捷咨詢與《經(jīng)濟(jì)學(xué)人》信息部聯(lián)合研究顯示,有58%的高管人員依賴非結(jié)構(gòu)化數(shù)據(jù)分析做出業(yè)務(wù)決策。然而,非結(jié)構(gòu)化數(shù)據(jù)早已超出傳統(tǒng)數(shù)據(jù)庫的存儲和處理極限,目前很多廠商將其作為單獨(dú)的技術(shù)挑戰(zhàn)來對待。
為了進(jìn)一步幫助企業(yè)處理不斷增長的非結(jié)構(gòu)化數(shù)據(jù),全球最大的開源技術(shù)廠商紅帽公司,面向非結(jié)構(gòu)化數(shù)據(jù)推出開源存儲軟件解決方案——Red Hat Storage Server 2.0,也稱紅帽存儲2.0。
紅帽存儲2.0:大數(shù)據(jù)管理利器
紅帽是全球知名的開源解決方案提供商,使用社區(qū)驅(qū)動的方式提供可靠和高性能的云、虛擬化、存儲、Linux和中間件技術(shù)。作為第一家收入突破10億美元的開源廠商,紅帽認(rèn)為開源的商業(yè)模式具有無限潛力。紅帽公司總裁兼首席執(zhí)行官衛(wèi)赫士在去年訪華時曾表示,紅帽在未來五年內(nèi)銷售收入將突破30億美元。
紅帽最受歡迎的產(chǎn)品當(dāng)屬紅帽企業(yè)Linux,這是全球應(yīng)用最廣的Linux產(chǎn)品,也是造就紅帽影響力的巔峰之作。然而紅帽的發(fā)展不限于此,其產(chǎn)品策略緊隨IT趨勢不斷發(fā)生著變革。近幾年,隨著云計(jì)算產(chǎn)業(yè)的不斷深入,紅帽提出以云計(jì)算為突破口,以虛擬化為著力點(diǎn),構(gòu)建混合云生態(tài)系統(tǒng)的產(chǎn)品策略。伴隨2013大數(shù)據(jù)元年的到來,紅帽的產(chǎn)品策略也似乎開始向大數(shù)據(jù)傾斜,據(jù)衛(wèi)赫士預(yù)測,在未來的20年里,大數(shù)據(jù)將會成為主流技術(shù),將改變很多企業(yè)的核心價值。
存儲2.0就是紅帽進(jìn)軍大數(shù)據(jù)的突破口。紅帽存儲2.0是一款可向外擴(kuò)容的開源存儲軟件解決方案,主要用于海量非結(jié)構(gòu)化數(shù)據(jù)的管理,是行業(yè)中首個能和對象存儲輕松整合在一起的文件存儲解決方案,有效擴(kuò)展以滿足非結(jié)構(gòu)化數(shù)據(jù)暴增的需求。它可以配置在預(yù)設(shè)平臺中,也可以配置在私有云、公有云或者混合云環(huán)境中,用來優(yōu)化存儲密集型企業(yè)級工作負(fù)載。
追本溯源,這款開源存儲軟件來自于紅帽2011年10月收購的Gluster——這是一家專注于橫向擴(kuò)展存儲的開源軟件初創(chuàng)公司,其開發(fā)的GlusterFS開源文件系統(tǒng)和Gluster存儲平臺軟件堆棧作為核心技術(shù),為大數(shù)據(jù)的存儲管理與訪問提供支持。其中,GlusterFS開源文件系統(tǒng)是一套可擴(kuò)展的開源集群文件系統(tǒng),并能夠輕松為客戶提供全局命名空間、分布式前端以及高達(dá)數(shù)百PB級別的擴(kuò)展性。
GlusterFS類似于Hadoop中的HDFS,但其相較于HDFS的最大優(yōu)勢在于:它通過使用其自有的彈性Hash算法,實(shí)現(xiàn)了網(wǎng)絡(luò)附加存儲的大規(guī)模擴(kuò)展,而沒有借助元數(shù)據(jù)實(shí)現(xiàn)這一過程。元數(shù)據(jù)是用來描述數(shù)據(jù)的數(shù)據(jù),在某些情況下可能成為HDFS失敗的元兇,抑或線性可擴(kuò)展性的阻礙。GlusterFS的這一特點(diǎn)極大的提升了數(shù)據(jù)尋址訪問的速度,同時消除了其他大數(shù)據(jù)系統(tǒng)常見的單點(diǎn)故障,數(shù)據(jù)冗余負(fù)荷與無限擴(kuò)展的瓶頸。
此外,紅帽存儲2.0還能夠與Apache Hadoop完美兼容,存儲2.0提供大數(shù)據(jù)的存儲管理與訪問,Hadoop提供技術(shù)框架。GlusterFS既可以Hadoop HDFS整合在一起,也可以作為HDFS的替代產(chǎn)品,實(shí)現(xiàn)更加快速的文件訪問。紅帽存儲的Hadoop插件為企業(yè)提供了一種全新的存儲選擇,在為用戶提供企業(yè)級存儲特性的同時,還能保證API兼容和本地?cái)?shù)據(jù)對Hadoop的訪問。

紅帽大數(shù)據(jù)解決方案:將開源做到極致
紅帽存儲2.0在大數(shù)據(jù)的存儲管理和數(shù)據(jù)訪問層面為用戶提供高性能和可擴(kuò)展的解決方案。除了存儲,紅帽的大數(shù)據(jù)解決方案還包括Linux、JBoss中間件、企業(yè)虛擬化等產(chǎn)品家族,并通過開放式混合云模式來滿足用戶對企業(yè)級大數(shù)據(jù)的需求。具體來說,包括以下解決方案:
• 紅帽企業(yè)Linux:作為紅帽的旗艦產(chǎn)品,企業(yè)Linux是管理大數(shù)據(jù)最佳平臺。由于紅帽企業(yè)Linux擅長利用分布式體系解決大數(shù)據(jù)的關(guān)鍵需求,用戶可以將紅帽存儲構(gòu)建在企業(yè)Linux系統(tǒng)上,獲得經(jīng)濟(jì)劃算的、高可擴(kuò)展的、高可用性的配置。與此同時,基于紅帽企業(yè)Linux還能開發(fā)出各種安全可靠、易于擴(kuò)展的大數(shù)據(jù)應(yīng)用,有理由將數(shù)據(jù)進(jìn)一步轉(zhuǎn)化為商業(yè)價值。
• 紅帽企業(yè)虛擬化:紅帽企業(yè)虛擬化(RHEV)是一款針對服務(wù)器和桌面虛擬化的完整虛擬化管理解決方案,是第一個成熟的、完全開源的企業(yè)虛擬化平臺。RHEV較之專有虛擬化供應(yīng)商,為尋求更佳總體擁有成本、更快投資回報(bào)率、迅速收支平衡和避免供應(yīng)商鎖定的企業(yè)提供了真正的策略虛擬化替代方案。企業(yè)虛擬化與存儲的結(jié)合,能夠使用戶更加安全的訪問由紅帽存儲管理的共享存儲池,還能夠?yàn)槠髽I(yè)降低運(yùn)營成本、提高可擴(kuò)展性和可用性,以及更高的性能。
• 紅帽開放混合云:開放混合云是紅帽的云計(jì)算產(chǎn)品策略,能夠?qū)崿F(xiàn)大數(shù)據(jù)工作負(fù)載在公有云和私有云之間的輕松遷移。云計(jì)算和大數(shù)據(jù)兩者關(guān)系緊密,云計(jì)算為大數(shù)據(jù)的存儲和處理提供了良好的平臺,可以在短時間內(nèi)調(diào)動眾多資源處理大數(shù)據(jù);大數(shù)據(jù)處理將更多的應(yīng)用帶到云上,也在推動云計(jì)算市場的發(fā)展。
• 紅帽JBoss中間件:紅帽JBoss中間件是一款適用于面向服務(wù)架構(gòu)(SOA)的開源平臺,為創(chuàng)建和部署新的大數(shù)據(jù)應(yīng)用提供強(qiáng)大技術(shù)支持,并能夠與Hadoop、MongoDB等大數(shù)據(jù)技術(shù)進(jìn)行互動和整合,幫助企業(yè)抓住大數(shù)據(jù)機(jī)遇,應(yīng)對大數(shù)據(jù)帶來的挑戰(zhàn)。
紅帽存儲結(jié)合企業(yè)Linux、企業(yè)虛擬化、JBoss中間件和開放混合云組成完整的大數(shù)據(jù)生態(tài)系統(tǒng),為用戶提供靈活、安全的大數(shù)據(jù)解決方案,以滿足企業(yè)現(xiàn)在和未來對大數(shù)據(jù)的需求。
總結(jié)
總的來說,紅帽產(chǎn)品的最大特點(diǎn)就是“開源”,并將開源做到極致。開源是大數(shù)據(jù)的靈魂,憑借開源優(yōu)勢,紅帽大數(shù)據(jù)解決方案發(fā)揮著巨大的潛力。未來,隨著紅帽在大數(shù)據(jù)領(lǐng)域的發(fā)展不斷深入,以紅帽存儲為主的生態(tài)系統(tǒng),將提供一站式的大數(shù)據(jù)解決方案。屆時,紅帽云計(jì)算和大數(shù)據(jù)產(chǎn)品策略將雙管齊下、相輔相成,共同打造開源技術(shù)創(chuàng)新平臺。