NOAA (國家海洋暨大氣總署)國家氣象局
NOAA的大數(shù)據(jù)業(yè)務(wù)已有50個年頭。如今,NOAA管理的年數(shù)據(jù)量高達(dá)30 PB,每日能從衛(wèi)星,船只,飛機(jī),浮標(biāo),以及它處傳感器收集超過35億份觀察資料。收集完畢后,NOAA會匯總大氣數(shù)據(jù),海洋數(shù)據(jù),以及地質(zhì)數(shù)據(jù),進(jìn)行直接測定,繪制出復(fù)雜的高保真預(yù)測模型,將其提供給NWS(國家氣象局)。每日,NWS的模型會生成成千上萬的數(shù)據(jù)——私營或公有部門(包括國防部,或宇航局)的氣象預(yù)報員播報的氣象警報,以及氣象預(yù)報。
AM生物技術(shù)DNA序列分析解決方案
美國休斯頓是全國AM生物技術(shù)重鎮(zhèn)。AM生物技術(shù)的工作重心,在于開發(fā)一項(xiàng)新技術(shù)專利:制造適配子(經(jīng)化學(xué)改性,基于DNA的分子物質(zhì))。從特定血樣分析的定量診斷,到人體特定部位的定向藥物分配,適配子的用途十分廣泛。若要制造適配子,需要進(jìn)行億萬次DNA短鏈分析。分析產(chǎn)生的數(shù)據(jù)量極其驚人,需要使用CD-HIT ,以及Galaxy公司的網(wǎng)絡(luò)大數(shù)據(jù)分析工具才能處理。
NARA電子檔案存檔
NARA (國家檔案記錄管理機(jī)構(gòu))是美國的官方記錄管理機(jī)構(gòu)。NARA 管理的信息量高達(dá)142TB(這個數(shù)字仍呈上升趨勢),對象多達(dá)70億, 記錄范圍涵蓋:聯(lián)邦機(jī)構(gòu)生態(tài)系統(tǒng),國會,以及各總統(tǒng)圖書館。這些記錄經(jīng)過數(shù)字化,以不同格式進(jìn)行存儲,存儲格式多達(dá)4800種。同時,NARA正著手另一項(xiàng)進(jìn)程:將400多萬立方英尺德館藏檔案數(shù)字化。最遲至2016,NARA 95%的電子檔案信息都會對研究者開放。NARA 建立了ERA(電子檔案存檔),將其作為“系統(tǒng)體系”,在不同的法律框架下,執(zhí)行各類存檔功能,并實(shí)行記錄管理。
Vestas風(fēng)能發(fā)電配置與維護(hù)
Vestas是一家丹麥風(fēng)力公司,Vestas通過使用超級計算機(jī),以及大數(shù)據(jù)模型解決方案,來精確定位其風(fēng)力發(fā)電機(jī),以達(dá)到最大發(fā)電量,并減少能源成本。公司將從全球天氣系統(tǒng)中收集的數(shù)據(jù),與公司現(xiàn)有發(fā)電機(jī)的數(shù)據(jù)結(jié)合,存儲于風(fēng)庫中。目前,Vestas風(fēng)庫存有近2.8 PB數(shù)據(jù)。現(xiàn)有參數(shù)范圍包括:地面至300英尺高空的氣溫,氣壓,空氣濕度,空氣沉淀物,風(fēng)向,風(fēng)速;以及公司的歷史數(shù)據(jù)記錄。Vestas還計劃添加以下數(shù)據(jù):全球森林砍伐追蹤圖,衛(wèi)星圖像,地理數(shù)據(jù),以及月相與潮汐數(shù)據(jù)。
IRS順從性數(shù)據(jù)倉庫
1996年,, IRS (美國國稅局)啟動了一項(xiàng)計劃,計劃上傳一年納稅數(shù)據(jù),以作分析使用。這項(xiàng)計劃發(fā)起后,CDW(順從性數(shù)據(jù)倉庫)應(yīng)運(yùn)而生,CDW 能夠容納的信息量超過1 PB 。多數(shù)舊數(shù)據(jù)都已經(jīng)過結(jié)構(gòu)化,然而,新數(shù)據(jù)都為半結(jié)構(gòu),或未結(jié)構(gòu)化格式:電子納稅申請,國際稅務(wù)合作,第三方XML(可擴(kuò)展標(biāo)示語言),或其它格式。從估算國家稅收缺口,至身份盜竊預(yù)測,從納稅人稅率測定,至政策變更對公民納稅的影響,IRS 研究小組會對各類職業(yè)數(shù)據(jù)進(jìn)行分析。
UOIT(安大略大學(xué)理工學(xué)院)醫(yī)療監(jiān)測
UOIT攜手IBM,開展了Artemis計劃, 希望提升醫(yī)學(xué)監(jiān)測技術(shù),在生命體征達(dá)臨界值之前,監(jiān)測器能察覺出危險跡象,并發(fā)出警示——如院內(nèi)感染癥狀。對于早產(chǎn)兒而言,院內(nèi)感染具有高致命性,初發(fā)癥狀為:嬰兒脈搏跳動異常,雖在安全范圍內(nèi),但時快時慢不符常規(guī)。數(shù)據(jù)流分析軟件是Artemis計劃的基礎(chǔ)所在, 其信息處理架構(gòu)能基于連續(xù)數(shù)據(jù)流分析,提供第一手決策支持。
TerraEchos公司Perimeter入侵檢測
TerraEchos 是一家技術(shù)公司,專營關(guān)鍵基礎(chǔ)架構(gòu)防護(hù),以及監(jiān)控技術(shù)。美國能源部實(shí)驗(yàn)室就是公司的客戶之一,實(shí)驗(yàn)室的科學(xué)數(shù)據(jù),技術(shù),以及研究資源依賴于TerraEchos 的保護(hù)。實(shí)驗(yàn)室需要一項(xiàng)技術(shù)解決方案,以檢測,分類,查找,并追蹤潛在(機(jī)器及生化)威脅 ——能察覺千里之外的風(fēng)吹草動。為達(dá)到這一目的,解決方案使用了傳感器,分析軟件,以及高性能計算技術(shù),以持續(xù)應(yīng)對從的海量流動數(shù)據(jù),并對這些范圍囊括人與動物活動,至大氣條件的數(shù)據(jù)進(jìn)行大量分析。
NASA人類航天影像收集,存檔,以及管理
NASA JSC(約翰遜航天中心)是美國宇航員培訓(xùn)中心,以及ISS(國際空間站)任務(wù)操作的中樞所在。從1959年至今,JSC已收集400多萬靜態(tài)圖像,總達(dá)950萬英尺的16毫米膠卷,85000卷錄像磁帶,以及總時長81616小時的視頻模擬及數(shù)碼檔案。這些收藏可用于媒體,以及科學(xué)與工程范疇。NASA開發(fā)了一項(xiàng)應(yīng)用,將其命名為IO(在線影像),IO 能夠?qū)⒂跋裎募c所有相關(guān)元數(shù)據(jù)連接。然而,JSC 依然面臨一大難題:如何將初始資源,以及自然資源向公眾開發(fā),以及如何對這些資源進(jìn)行代碼轉(zhuǎn)換,使其空間占用更小,可利用率更高。


