国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区

掃一掃
關(guān)注微信公眾號

NoSQL領(lǐng)銜大數(shù)據(jù)時代的新技術(shù)
2012-09-07   網(wǎng)絡(luò)

大數(shù)據(jù)應用到數(shù)據(jù)集,其大小超出了常用軟件工具所能捕捉、管理和在可承受的時間內(nèi)處理數(shù)據(jù)的能力。Big Data的規(guī)模在不斷變化,單一數(shù)據(jù)集的規(guī)模從幾十個TB漲到多個PB。

IDC估計到2011年數(shù)據(jù)約達到1.8ZB。

ZB有多大?答案是10億個TB。目前世界人口有7億也就是說,如果給每個人250G硬盤存儲空間仍然是不夠用的。

這次的數(shù)據(jù)洪流有諸多來源:

1. 紐約證券交易所每天產(chǎn)生1TB的新交易數(shù)據(jù);

2. Facebook主機存儲100億張照片會占用1PB空間;

3. Ancestry.com,家譜網(wǎng),存儲約2.5PB數(shù)據(jù);

4. 互聯(lián)網(wǎng)檔案館存儲約2PB數(shù)據(jù),并以每月約20TB的速度增長;

5. Geneva附近的Large Harden Colider每年將產(chǎn)生15PB的數(shù)據(jù);

6. 人們每天從傳感器、移動設(shè)備、網(wǎng)上交易和社交網(wǎng)絡(luò)創(chuàng)造相當于2.5萬億字節(jié)的數(shù)據(jù)。

Facebook、Yahoo和Google發(fā)現(xiàn)他們以空前的規(guī)模匯集數(shù)據(jù)。他們是第一批從上百萬用戶中匯集數(shù)據(jù)的大公司。

這些數(shù)據(jù)迅速淹沒了傳統(tǒng)的例如Oracle和MySQL等的數(shù)據(jù)系統(tǒng)。即便是最好的、最昂貴的供應商使用最大規(guī)模的硬件也只能勉強跟上,無法給他們有力的工具來分析數(shù)據(jù)的涌入。

在2000年初,開發(fā)諸如MapReduce、BigTable、Google File System的新技術(shù)來處理大數(shù)據(jù)。最初,這些技術(shù)是專有的。但隨后人們注意到公開的概念會更有利-因為越來越多的人會有助于此,并且他們雇傭的畢業(yè)生在加入他們之前對此也會有一個良好的理解。

在2004-2005年度,F(xiàn)acebook、Yahoo和Google開始共享描述他們大數(shù)據(jù)技術(shù)的研究論文。

2004年,Google發(fā)表題為“MapReduce:在大型集群上簡化數(shù)據(jù)處理(MapReduce: Simplified Data Processing on Large Clusters)”的論文。

MapReduce

是一個編程模型,同時也是一個處理和生成大型數(shù)據(jù)的工具。用戶指定映射函數(shù)來處理一對key-value以生成一個中間key-value的集合,指定reduce函數(shù)合并相同的中間鍵關(guān)聯(lián)的所有的中間值。正如這篇文章所寫,現(xiàn)實世界的許多工作都可以在這個模型中得以表達。

以此功能所編寫的程序自動并行,而且能在商品機大型集群上執(zhí)行。系統(tǒng)處理分割輸入數(shù)據(jù)的細節(jié),跨機器調(diào)度程序執(zhí)行,處理機器故障,管理所需的機器間的通訊。這樣使得沒有任何操作并行和分布式系統(tǒng)經(jīng)驗的程序員同樣可以輕松地利用大型分布式系統(tǒng)的資源。Google基于MapReduce實現(xiàn)在大型集群的商品機上運行并且這是高度可伸縮的。

一個典型的MapReduce在成百上千臺機器上處理大量的數(shù)據(jù)。設(shè)計器和系統(tǒng)是很容易使用的。數(shù)以百計的MapReduce程序已經(jīng)實施并且每天有超過一千的MapReduce工作在Google集群執(zhí)行。

Nutch

是一個開源的搜索技術(shù),現(xiàn)在由Apache Software Foundation管理,而為其工作的Doug Cutting閱讀了由Google發(fā)表的此文和由Google分布式文件系統(tǒng)[GFS]發(fā)表的另一篇文章,指出GFS可以解決他們的存儲要求,MapReduce也會解決Nuth和實施MapReduce及GFS的縮放問題。他們把為Nutch實施的GFS命名為Nutch Distributed Filesystem[NDFS]。

NDFS和Nutch的MapReduce的實現(xiàn)超出了搜索領(lǐng)域,并于2006年2月遷移出Nutch構(gòu)建成一個名為Hadoop和NDFS的獨立的Lucene子項目,成為HDFS[Hadoop分布式文件系統(tǒng)],這是一個GFS的實現(xiàn)。與此同時,Yahoo延長了他們對Hadoop的支持并雇傭了Doug Cutting。

在HDFS的工作層面,有一個300MB的文件[Hadoop的PB級和TB級文件非常好]。HDFS所需做的第一件事就是將它分割為若干塊。HDFS上的默認塊的大小為128MB。一旦把他們分割成塊,我們將得到分別為128MB和44MB的兩個部分。現(xiàn)在,HDFS將"n"["n"即是配置]作為每個塊的拷貝/副本的一部分。HDFS將這些副本存儲在集群的不同數(shù)據(jù)節(jié)點上。我們也有單一的保持著副本和數(shù)據(jù)節(jié)點路徑的數(shù)據(jù)NameNode。NameNode清楚副本在什么位置-每當它檢測到有副本損壞[DataNode一直在副本上進行校驗]或者相應的HDFS變?yōu)閐own,它將會尋找集群中該副本的其他副本,并告訴其他節(jié)點復制該副本的"n"。NameNode是一個單點故障-兩個點就會避免出現(xiàn)這種情況,我們會有與主要NameNode同步的次要NameNode-當主的變?yōu)閐own-從的將會起控制作用。Hadoop項目目前工作在分布式的NameNodes上。

Google在2006年又發(fā)表了一篇名為“Bigtable:一個結(jié)構(gòu)化數(shù)據(jù)的分布式存儲系統(tǒng)(Bigtable: A Distributed Storage System for Structured Data)”的文章。

Bigtable

是一個管理結(jié)構(gòu)化數(shù)據(jù)的分布式存儲系統(tǒng),它的設(shè)計擴展到一個非常大的規(guī)模,跨越了成千上萬服務器的PB級數(shù)據(jù)。Google許多項目的數(shù)據(jù)都存儲在Bigtable中,其中包括網(wǎng)頁索引、Google Earth和Google Finance。這些在Bigtable中的應用有不同的需求,不僅是在數(shù)據(jù)大小方面(從網(wǎng)頁地址到衛(wèi)星圖像)還有在延遲要求方面(從后臺數(shù)據(jù)處理到實時數(shù)據(jù)服務)。盡管這些需求不同,Bigtable為Google的產(chǎn)品提供了一個柔性的、高性能的解決方案。本文介紹了Bigtable中提供的簡單的數(shù)據(jù)模型,Bigtable使得客戶可以對數(shù)據(jù)的布局和格式進行動態(tài)控制,并且描述了Bigtable的設(shè)計和實施。

Bigtable映射任意兩個字符串值(行值和列值)和時間戳(三維映射)關(guān)聯(lián)的任意字節(jié)數(shù)組。這并不是個關(guān)系型數(shù)據(jù)庫,更應該定義為sparse,分布式多維分類映射。

Bigtable基本上討論了怎樣在GFS上建立分布式數(shù)據(jù)存儲。

由Hadoop所生成的HBase是一個BigTable的實現(xiàn)。HBase

是一個分布式、列導向的、利用HDFS為其底層存儲同時支持使用MapReduce和點查詢的批量計算的數(shù)據(jù)庫。

Amazon,在2007年出版了“Dynamo:亞馬遜高度可用Key-value存儲(Dynamo: Amazon"s Highly Available Key-value Store)”的文章。

Dynamo

是一個高度可用的Key-value存儲系統(tǒng),Amazon的核心服務提供一個“always-on”的技巧。Apache Cassandra匯集了Dynamo的完全分布式設(shè)計和BigTable的數(shù)據(jù)模型,用Java進行編寫,由Facebook發(fā)布的開源系統(tǒng)。這是個NoSQL的解決方案,最初由Facebook開發(fā),直到2010年底,增強他們的收件箱搜索功能。事實上,Cassandra最初的開發(fā)工作是由兩個由Facebook從Amazon招募的Dynamo工程師進行的。但是在2010年底當Facebook建立了基于HBase的信息平臺后便放棄了Cassandra。

此外,除了使用BigTable的建模方法,它具有類似于最終一致性的屬性,Gossip協(xié)議,master-master方式的讀服務和Amazon Dynamo產(chǎn)生的寫請求。最終一致性是其中一個重要的屬性,意味著在一段足夠長的時間內(nèi)沒有發(fā)送更改信息,所有的更新都可以預期,最終系統(tǒng)和所有副本也將保持一致。

再說到Cassandra

時,使用了“NoSQL”一詞。NoSQL(有時候解釋為not only SQL)是數(shù)據(jù)庫管理系統(tǒng)的一個寬泛類,在一些重大方面,它不同于典型的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS)。這些數(shù)據(jù)存儲不需要固定的表模式,通常能夠避免連接操作,可以進行橫向擴展。

“NoSQL”這個名字最初是由Carlo Strozzi在1998年提出的,作為由他開發(fā)的基于文件的數(shù)據(jù)庫的名稱。具有諷刺意味的是,它僅僅是個沒有SQL接口的關(guān)系型數(shù)據(jù)庫而已。當Eric Evans在2009年用它來命名非關(guān)系型數(shù)據(jù)庫的流沖擊(current surge)的時候,這個名字重新復出水面。

NoSQL數(shù)據(jù)庫有四個類別:

1. Key-value stores:基于Amazon的Dynamo文件;

2. ColumnFamily / BigTable clones:例如HBase、Cassandra;

3. Document Databases:例如CouchDB、MongoDB;

4. Graph Database:例如AllegroGrapgh、Neo4j。

正如Marin Dimitrov所言,以下是NoSQL數(shù)據(jù)庫的使用場合,換句話說,是關(guān)系型數(shù)據(jù)庫不適合執(zhí)行的情況。

1. 龐大的數(shù)據(jù)量;

2. 極端的查詢量;

3. 模式演化。

我們從NoSQL上可以得到高可擴展性、高可用性、低成本(與同等規(guī)模的解決方案相比)、可預見的彈性和架構(gòu)靈活性的優(yōu)勢。

對于應用程序來說關(guān)系型數(shù)據(jù)庫和Cassandra的主要區(qū)別在于基于BigTable的數(shù)據(jù)模型。Cassandra數(shù)據(jù)模型是專為大規(guī)模的分布式數(shù)據(jù)所設(shè)計的。在性能、可用性和運算管理遵從慣有的優(yōu)勢。

熱詞搜索:

上一篇:虛擬化是IT架構(gòu)未來
下一篇:100%云計算服務是企業(yè)業(yè)務發(fā)展趨勢

分享到: 收藏
国产一级一区二区_segui88久久综合9999_97久久夜色精品国产_欧美色网一区二区
色综合天天综合网天天看片| 日日嗨av一区二区三区四区| 午夜精品一区二区三区电影天堂| 国产精品亚洲а∨天堂免在线| 亚洲综合区在线| 亚洲国产精品久久久久秋霞影院 | 免费的成人av| www.视频一区| 亚洲精品免费播放| 99久久国产综合精品女不卡| 亚洲男人的天堂在线aⅴ视频| 欧美另类变人与禽xxxxx| 日韩高清不卡一区二区| 一本大道av一区二区在线播放| 亚洲欧美在线另类| 蜜臀av在线播放一区二区三区| 男女激情视频一区| 国内精品写真在线观看| 欧美在线制服丝袜| 久久久亚洲国产美女国产盗摄| 精品国产伦一区二区三区免费 | 欧美色视频在线观看| 日本欧美久久久久免费播放网| 欧美激情综合在线| 一区二区高清免费观看影视大全| 中文字幕中文字幕在线一区| 懂色中文一区二区在线播放| 国产精品久久久一本精品| 亚洲一区二区影院| 亚洲一区二区中文在线| 韩国一区二区在线观看| 久久人人爽人人爽| 成人免费看黄yyy456| 亚洲第一电影网| 国产欧美一区二区精品性色| 强制捆绑调教一区二区| 成人性生交大合| 亚洲成人一区二区在线观看| 精品999久久久| 欧美一区二区久久久| 色一情一乱一乱一91av| 国产精品1区2区| 免费在线观看不卡| 亚洲精品福利视频网站| 国产精品天天看| 国产精品久久久一区麻豆最新章节| 99久久精品免费看| 亚洲在线中文字幕| 日韩亚洲欧美一区二区三区| 国产精品初高中害羞小美女文| 国产精品小仙女| 日韩女优av电影| 精品亚洲欧美一区| 亚洲激情欧美激情| 欧美伊人久久久久久午夜久久久久| 久久久亚洲高清| 乱中年女人伦av一区二区| 99视频一区二区三区| 一本到不卡精品视频在线观看| 日韩一级黄色片| 全国精品久久少妇| 国产精品久久看| 8v天堂国产在线一区二区| 国产成人午夜精品5599| 亚洲综合色视频| 中文字幕成人av| 日韩欧美在线一区二区三区| 91亚洲大成网污www| 国产精品自拍三区| 乱一区二区av| 五月开心婷婷久久| 亚洲男人的天堂av| 中文一区二区完整视频在线观看 | 不卡影院免费观看| 蜜臀va亚洲va欧美va天堂| 成人欧美一区二区三区在线播放| 欧美成人免费网站| 欧美日韩免费高清一区色橹橹| av成人免费在线| 成人永久看片免费视频天堂| 婷婷丁香久久五月婷婷| 亚洲日本在线观看| 亚洲三级电影全部在线观看高清| 国产欧美一区二区精品仙草咪| 91精品国产麻豆| 欧美一级xxx| 欧美日本在线播放| 91亚洲精品久久久蜜桃网站| 波多野结衣一区二区三区| 韩国av一区二区三区在线观看| 亚洲自拍偷拍欧美| 亚洲免费观看高清完整版在线观看 | 欧美成人一区二区三区在线观看| 4438x亚洲最大成人网| 91精品国产91热久久久做人人| 欧美网站大全在线观看| 欧美日韩免费观看一区二区三区| 欧美日韩视频在线第一区| 欧美日韩电影在线播放| 91精品国产入口| 日韩欧美国产高清| 精品国产乱码久久久久久久久| 久久精品在这里| 亚洲国产精品成人综合| 亚洲视频精选在线| 亚洲一卡二卡三卡四卡无卡久久| 婷婷综合久久一区二区三区| 琪琪久久久久日韩精品| 国产成人鲁色资源国产91色综| 成人福利视频在线| 在线影视一区二区三区| 欧美精选一区二区| 国产亚洲精品福利| 亚洲桃色在线一区| 一区二区三区在线影院| 日韩制服丝袜av| 国内精品嫩模私拍在线| aaa国产一区| 欧美精品高清视频| 国产欧美一区在线| 亚洲免费三区一区二区| 麻豆精品新av中文字幕| 国产69精品久久久久777| 成人精品gif动图一区| 欧美性受xxxx黑人xyx| 精品国产一区二区三区忘忧草| 国产精品久久久久婷婷| 日韩二区三区四区| 国产成人激情av| 日本道色综合久久| 精品国产sm最大网站免费看| 亚洲精品久久嫩草网站秘色| 麻豆91在线观看| 欧美系列一区二区| 欧美激情一区二区在线| 亚洲成av人影院| 福利一区二区在线| 在线不卡中文字幕| 亚洲精品伦理在线| 国产成人久久精品77777最新版本| 欧美性极品少妇| 中文字幕亚洲电影| 国产美女精品人人做人人爽| 欧美天堂亚洲电影院在线播放| 久久先锋影音av鲁色资源| 性做久久久久久免费观看欧美| 国产成人免费在线| 精品国产91久久久久久久妲己 | 成人激情校园春色| 欧美精品一区二区三区在线| 亚洲1区2区3区4区| 91国产丝袜在线播放| 欧美激情艳妇裸体舞| 日韩va欧美va亚洲va久久| 欧洲在线/亚洲| 亚洲欧美激情在线| 91原创在线视频| 欧美极品少妇xxxxⅹ高跟鞋| 精品一区二区三区av| 欧美日韩精品欧美日韩精品一| 国产精品伦理一区二区| 国产一区二区主播在线| 久久婷婷国产综合国色天香| 美腿丝袜在线亚洲一区 | 看电影不卡的网站| 日韩一区二区免费在线观看| 亚洲成av人综合在线观看| 91福利资源站| 一区二区三区中文字幕| 在线观看网站黄不卡| 亚洲欧美一区二区不卡| 色综合一个色综合| 亚洲嫩草精品久久| 色呦呦日韩精品| 亚洲制服丝袜一区| 欧美日韩成人在线| 视频一区中文字幕| 日韩一区二区三区在线| 蜜臀av性久久久久蜜臀av麻豆 | 免费在线观看一区| xfplay精品久久| 国产suv精品一区二区883| 中文字幕 久热精品 视频在线 | 中文字幕一区二区视频| 99国产精品久久久| 亚洲aaa精品| 欧美成人一区二区三区片免费| 国产精品一区二区三区网站| 国产精品乱子久久久久| 欧美性感一区二区三区| 精品中文字幕一区二区小辣椒| 精品国产麻豆免费人成网站| 国产黑丝在线一区二区三区| 国产精品国产三级国产专播品爱网| 91蜜桃免费观看视频| 首页国产丝袜综合| 欧美激情一区二区三区蜜桃视频| 色婷婷av一区二区三区大白胸| 日本91福利区| 国产精品国产馆在线真实露脸|