国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關(guān)注微信公眾號

大數(shù)據(jù)時代來臨 Hadoop有所為有所不為
2012-06-19    51CTO.com

使用大數(shù)據(jù)技術(shù)有著強烈的吸引力,而如今沒有比Apache Hadoop更誘人的大數(shù)據(jù)技術(shù)了,這種可擴展的數(shù)據(jù)存儲平臺是許多大數(shù)據(jù)解決方案的核心。

hadoop

但是盡管Hadoop頗具吸引力,想了解Hadoop能夠為企業(yè)扮演什么角色、如何最有效地部署它,仍要面臨一條很陡的學(xué)習(xí)曲線。換句話說,學(xué)起來很費勁。

只有明白了Hadoop的有所為而有所不為,你才能更清楚地了解如何才能最有效地把它部署到你自己的數(shù)據(jù)中心或云環(huán)境。然后,才可以為部署的Hadoop落實最佳實踐。

Hadoop的有所不為

我們不打算花大量的時間來解釋何謂Hadoop,因為許多技術(shù)文檔和媒體報道已對此作了深入介紹。一言以蔽之,知道Hadoop的兩個主要組件很重要:一個是用于存儲的Hadoop分布式文件系統(tǒng)(HDFS),另一個是MapReduce框架,讓你可以對Hadoop里面存儲的任何數(shù)據(jù)執(zhí)行批量分析任務(wù)。值得一提的是,這種數(shù)據(jù)不一定是結(jié)構(gòu)化數(shù)據(jù),這使得Hadoop非常適合分析和處理來自社交媒體、文檔和圖形等來源的數(shù)據(jù):即并不容易適用于行和列的任何數(shù)據(jù)。

這倒不是說,你無法將Hadoop用于結(jié)構(gòu)化數(shù)據(jù)。實際上,市面上有許多解決方案可以充分利用Hadoop的這個優(yōu)點:每TB比較低的存儲開支,以便將結(jié)構(gòu)化數(shù)據(jù)存儲在Hadoop中,以取代關(guān)系數(shù)據(jù)庫系統(tǒng)(RDBMS)。但是如果你的存儲需求不是那么大,那么在Hadoop和RDBMS之間來回轉(zhuǎn)移數(shù)據(jù)毫無必要。

你不想使用Hadoop的一個方面是事務(wù)型數(shù)據(jù)。顧名思義,事務(wù)型數(shù)據(jù)異常復(fù)雜,因為電子商務(wù)網(wǎng)站上的交易事務(wù)會生成許多步驟,而這些步驟都必須迅速加以實現(xiàn)。這種場景根本就不適合使用Hadoop。

Hadoop也不適合用于要求延遲時間極短的結(jié)構(gòu)化數(shù)據(jù)集,比如當(dāng)網(wǎng)頁由典型的LAMP堆棧中的MySQL數(shù)據(jù)庫來呈現(xiàn)時。這需要速度快,而Hadoop很難滿足這樣的要求。

Hadoop的有所為

由于批量處理功能,Hadoop應(yīng)該部署在這些場合:索引編制、模式識別、推薦引擎建立和情緒分析;在所有這些場合下,數(shù)據(jù)大量生成,存儲在Hadoop中,然后最終使用MapReduce函數(shù)來進行查詢。

但是這并不意味著,Hadoop會取代你數(shù)據(jù)中心里面目前的組件。恰恰相反,Hadoop會集成到你現(xiàn)有的IT基礎(chǔ)設(shè)施里面,以便充分利用進入到貴企業(yè)的海量數(shù)據(jù)。

比如說,設(shè)想一個相當(dāng)?shù)湫偷姆荋adoop企業(yè)網(wǎng)站在處理商業(yè)交易。據(jù)Cloudera的教育服務(wù)主管Sarah Sproehnle聲稱,來自其一個客戶的流行網(wǎng)站的日志每天晚上都要經(jīng)歷抽取、轉(zhuǎn)換和加載(ETL)的過程——這個過程可能最多耗時3小時,然后把數(shù)據(jù)存儲到數(shù)據(jù)倉庫中。這時,存儲過程將被啟動,另外過兩小時后,被清理的數(shù)據(jù)將駐留在數(shù)據(jù)倉庫中。不過,最終的數(shù)據(jù)集將只有原始大小的五分之一——這意味著,就算可以從整個原始數(shù)據(jù)集獲取什么價值,現(xiàn)在這個價值也蕩然無存了。

Hadoop集成到這家企業(yè)后,情況大為改觀:節(jié)省了時間和精力。來自Web服務(wù)器的日志數(shù)據(jù)不用經(jīng)歷ETL操作,而是直接被完整地發(fā)送到了Hadoop里面的HDFS。然后,對日志數(shù)據(jù)執(zhí)行同樣的清理過程,現(xiàn)在只使用MapReduce任務(wù)。一旦數(shù)據(jù)清理完畢,隨后被發(fā)送到數(shù)據(jù)倉庫。但是這個操作要迅速得多,這歸因于省去了ETL這一步,加上MapReduce操作速度快。而且,所有數(shù)據(jù)仍然保存在Hadoop里面,準(zhǔn)備回答網(wǎng)站操作人員之后可能提出來的任何額外問題。

想了解Hadoop,有必要明白這個重要的一點:千萬不要把它看作是取代你現(xiàn)有的基礎(chǔ)設(shè)施,而是補充數(shù)據(jù)管理和存儲功能的一種工具。使用Apache Flume或Apache Sqoop之類的工具,你就能把現(xiàn)有系統(tǒng)與Hadoop聯(lián)系起來,并且對你的數(shù)據(jù)進行處理——不管數(shù)據(jù)有多大。Apache Flume可以將數(shù)據(jù)從RDBMS獲取到Hadoop,并將數(shù)據(jù)從Hadoop獲取到RDBMS;Apache Sqoop則可以將系統(tǒng)日志實時抽取到Hadoop。你只要為Hadoop添加節(jié)點,就可以執(zhí)行數(shù)據(jù)存儲和處理任務(wù)。

所需的硬件和成本

那么,我們又需要多少的硬件呢?

估計Hadoop所需的硬件有點不一樣,這取決于你是在問哪家廠商。Cloudera的清單詳細地列出了Hadoop的典型從屬節(jié)點應(yīng)該有怎樣的硬件配置:

中檔處理器

4GB至32 GB內(nèi)存

每個節(jié)點連接至千兆以太網(wǎng),并配備一只萬兆以太網(wǎng)架頂式交換機

專用的交換基礎(chǔ)設(shè)施,以避免Hadoop擁塞網(wǎng)絡(luò)

每個機器4至12個驅(qū)動器,非RAID配置方式

另一家Hadoop經(jīng)銷商Hortonworks的硬件規(guī)格大同小異,不過網(wǎng)絡(luò)方面的信息來得模糊一點,那是由于任何某家企業(yè)添加到Hadoop實例的工作負載可能不一樣。

Hortonworks的首席技術(shù)官Eric Baldeschwieler寫道:“一條經(jīng)驗法則就是,要關(guān)注網(wǎng)絡(luò)成本與計算機成本之比,網(wǎng)絡(luò)成本盡量控制在總成本的20%左右。網(wǎng)絡(luò)成本應(yīng)包括你的整個網(wǎng)絡(luò)、核心交換機、機架交換機和所需的任何網(wǎng)卡等。”

至于Cloudera,它估計每個節(jié)點所需的成本在3000美元至7000美元之間,具體取決于你確定每個節(jié)點有什么樣的硬件規(guī)格。

Sproehnle也概述了一條很容易遵守的經(jīng)驗法則,幫助你規(guī)劃Hadoop容量。由于Hadoop具有線性擴展的特性,你只要添加一個節(jié)點,就可以增加存儲和處理能力。這使得規(guī)劃起來簡單直觀。

比如說,要是你的數(shù)據(jù)每個月增加1TB,那么規(guī)劃方法如下:Hadoop將數(shù)據(jù)復(fù)制三次,所以你需要3TB的原始存儲空間才能容納新增加的1TB數(shù)據(jù)。留出一點額外空間(Sproehnle估計要預(yù)留30%),以便處理數(shù)據(jù)操作;這樣一來,每個月實際需要的存儲空間是4TB。如果你使用4個1 TB驅(qū)動器的機器作為節(jié)點,每個月就需要一個新的節(jié)點。

好就好在,所有新的節(jié)點一旦連接上,就可以立即投入使用,從而讓你的處理和存儲能力增強X倍,其中X指節(jié)點的數(shù)量。

不過,安裝和管理Hadoop節(jié)點其實并非易事,但是市面上有許多工具可以助你一臂之力。Cloudera 管理器、Apache Ambari(這是Hortonworks用于其管理系統(tǒng)的工具)和MapR控制系統(tǒng)都是同樣卓有成效的Hadoop集群管理工具。如果你使用一套“純粹”的Apache Hadoop解決方案,還可以關(guān)注Platform Symphony MapReduce、StackIQ Rocks + Big Data和Zettaset Data Platform等第三方Hadoop管理系統(tǒng)。

當(dāng)然,說到為貴企業(yè)部署一款Hadoop解決方案,本文介紹的這些內(nèi)容只是皮毛而已。也許最寶貴的心得在于明白這一點:Hadoop并非旨在取代你目前的數(shù)據(jù)基礎(chǔ)設(shè)施,而是只是起到互補作用。

一旦弄清楚了這個重要的區(qū)別,就比較容易開始考慮Hadoop可以如何幫助貴企業(yè),沒必要對你現(xiàn)有的數(shù)據(jù)流程進行大刀闊斧的改動。

 原文鏈接:http://os.51cto.com/art/201206/343299.htm

原文: What Hadoop can, and can't do

熱詞搜索:

上一篇:科技部將從六方面促進科技型中小企業(yè)發(fā)展
下一篇:VMware烽火連城 大數(shù)據(jù)蓄勢待發(fā)

分享到: 收藏
国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区
91精品欧美一区二区三区综合在 | 久久久久久免费网| 国产精品原创巨作av| 亚洲蜜臀av乱码久久精品蜜桃| 91精品国产手机| 99麻豆久久久国产精品免费| 男男成人高潮片免费网站| 国产精品你懂的在线欣赏| 欧美一区二区视频在线观看 | 欧美在线观看一区| 国产精品一区专区| 秋霞电影网一区二区| 亚洲靠逼com| 欧美极品美女视频| 日韩欧美区一区二| 91国偷自产一区二区三区成为亚洲经典| 肉肉av福利一精品导航| 欧美高清在线精品一区| 日韩视频在线永久播放| av网站一区二区三区| 蜜臀av性久久久久蜜臀aⅴ四虎| 亚洲欧美日韩在线不卡| 欧美日本在线播放| 99re这里只有精品视频首页| 亚洲欧美激情一区二区| 欧美一区二区三区免费| 国产精品夜夜嗨| 亚洲一本大道在线| 国产日韩综合av| 欧美日韩精品电影| 成人v精品蜜桃久久一区| 蜜桃av一区二区在线观看 | 久久综合九色综合久久久精品综合| 波多野结衣在线aⅴ中文字幕不卡| 裸体一区二区三区| 亚洲成av人片在线| 中文字幕在线观看不卡| 久久综合五月天婷婷伊人| 欧美精品免费视频| 一本色道久久综合亚洲aⅴ蜜桃| 国产成人在线视频免费播放| 青青草原综合久久大伊人精品 | 亚洲综合一区在线| 国产精品女上位| 国产欧美日韩另类一区| 欧美mv日韩mv| 欧美成人国产一区二区| 欧美精品国产精品| 欧美日韩国产高清一区二区| 91高清在线观看| 91麻豆蜜桃一区二区三区| 成人中文字幕电影| 日韩一区二区三区高清免费看看| 99久久伊人精品| 国产成人精品综合在线观看| 久久国产欧美日韩精品| 无码av中文一区二区三区桃花岛| 亚洲欧美日韩国产综合| 亚洲色图欧洲色图婷婷| 国产精品激情偷乱一区二区∴| 国产三级精品三级在线专区| 欧美—级在线免费片| 欧美激情综合在线| 中文字幕在线一区| 日韩理论片中文av| 亚洲乱码国产乱码精品精的特点| 日韩一区欧美小说| 亚洲永久免费视频| 午夜视黄欧洲亚洲| 免费高清在线一区| 精彩视频一区二区三区| 国产真实乱对白精彩久久| 国产中文一区二区三区| 国产成人午夜电影网| 成人性生交大合| 一本一本大道香蕉久在线精品| 91精品1区2区| 色婷婷国产精品久久包臀| 99视频国产精品| aa级大片欧美| 成人精品gif动图一区| 99九九99九九九视频精品| gogo大胆日本视频一区| 欧美主播一区二区三区| 日韩一区二区在线看| 久久中文字幕电影| 18欧美亚洲精品| 亚洲高清一区二区三区| 麻豆91精品91久久久的内涵| 成人一道本在线| 欧美在线|欧美| 欧美喷潮久久久xxxxx| 精品国产污污免费网站入口| 国产精品天美传媒沈樵| 亚洲成人免费观看| 国产精品一区在线观看乱码| 99国产精品久久久久久久久久| 欧美日韩日日骚| 久久久久久麻豆| 亚洲人成在线播放网站岛国| 日韩中文字幕一区二区三区| 国产中文字幕精品| 91搞黄在线观看| 欧美成人精品1314www| 亚洲日本护士毛茸茸| 免费av网站大全久久| 99久久精品免费看国产| 日韩欧美精品在线| 亚洲激情男女视频| 看电影不卡的网站| 色噜噜夜夜夜综合网| 精品视频一区 二区 三区| 久久久久久麻豆| 性做久久久久久| av亚洲产国偷v产偷v自拍| 欧美特级限制片免费在线观看| 久久老女人爱爱| 亚洲一区二区欧美| 风间由美一区二区av101| 欧美一区二区免费| 国产精品理论片| 国产乱码精品一区二区三区忘忧草 | 精品电影一区二区| 亚洲一区二区在线播放相泽| 成人精品视频一区二区三区尤物| 欧美一区永久视频免费观看| 综合久久久久综合| 国产精品综合二区| 欧美一区二区观看视频| 亚洲一区国产视频| 91香蕉视频在线| 国产日韩欧美麻豆| 免费xxxx性欧美18vr| 欧美日韩国产三级| 一区二区三区在线视频免费| 成人激情开心网| 欧美一区二区三区免费视频 | 国产精品一区二区黑丝| 欧美绝品在线观看成人午夜影视| 亚洲免费观看高清完整版在线观看 | 精品国内片67194| 一区二区在线观看免费视频播放| 国产综合久久久久久鬼色| 欧美视频一区在线| 国产精品青草综合久久久久99| 久久精品国产一区二区三区免费看| 在线视频你懂得一区| 亚洲国产精品成人综合 | 日韩一级二级三级精品视频| 亚洲一二三四区不卡| 日本韩国精品一区二区在线观看| 国产精品天干天干在线综合| 国产91在线看| 国产精品嫩草影院com| 国产成人免费网站| 欧美国产精品中文字幕| 国产成人综合亚洲91猫咪| 日韩免费高清av| 日本欧美一区二区三区乱码| 欧美精品视频www在线观看| 日韩1区2区3区| 91精品国产一区二区三区蜜臀 | 一区二区三区在线免费视频| 在线精品视频一区二区三四| 亚洲欧美另类久久久精品2019| 91亚洲永久精品| 亚洲自拍偷拍av| 欧美日韩国产欧美日美国产精品| 香蕉加勒比综合久久| 在线播放视频一区| 精品午夜久久福利影院| 久久久久成人黄色影片| 成人av在线看| 亚洲精品久久7777| 欧美日韩专区在线| 日本视频免费一区| 欧美mv日韩mv国产网站app| 国产寡妇亲子伦一区二区| 日韩av中文字幕一区二区三区| 日韩免费在线观看| 丁香天五香天堂综合| 亚洲视频网在线直播| 9191精品国产综合久久久久久| 精品一区二区三区香蕉蜜桃| 国产精品久久久久一区二区三区| 在线免费观看日本一区| 日本免费新一区视频| 国产无人区一区二区三区| 91亚洲国产成人精品一区二区三| 亚洲国产精品欧美一二99| 亚洲精品在线观| 色老汉一区二区三区| 免费人成精品欧美精品 | 国产精品久久午夜夜伦鲁鲁| 欧美主播一区二区三区| 黑人精品欧美一区二区蜜桃| 亚洲精品综合在线| 日韩亚洲欧美一区| 91性感美女视频| 老司机免费视频一区二区 |