和很多新的信息技術(shù)一樣,大數(shù)據(jù)可能會(huì)大幅度降低成本,減少完成一項(xiàng)計(jì)算任務(wù)、推出一款新產(chǎn)品或者新服務(wù)所需的執(zhí)行時(shí)間。你希望得到哪些好處呢?大數(shù)據(jù)背后的技術(shù)和理念讓組織能夠?qū)崿F(xiàn)很多種目標(biāo),但是你不太可能獲得所有可能的好處。明確你的組織希望從大數(shù)據(jù)中得到什么是你應(yīng)該解決的一個(gè)重大問題。對(duì)這個(gè)問題的答案不僅影響者大數(shù)據(jù)的產(chǎn)出,還影響著整個(gè)過程——誰領(lǐng)導(dǎo)這個(gè)計(jì)劃,它需要同你的組織中的哪些部分結(jié)合以及你應(yīng)當(dāng)如何管理這個(gè)項(xiàng)目等。
如果你希望降低成本,那么你可能已經(jīng)意識(shí)到處理結(jié)構(gòu)化數(shù)據(jù)的MIPS和TB級(jí)的存儲(chǔ)由于Hadoop集群之類大數(shù)據(jù)技術(shù)的出現(xiàn)已經(jīng)便宜很多了。例如,一家公司進(jìn)行了成本對(duì)比,該公司估計(jì)是用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫存儲(chǔ)1TB的數(shù)據(jù)每年大約需要花費(fèi)37000美元,使用數(shù)據(jù)設(shè)備大約需要花費(fèi)5000美元,如果使用Hadoop集群的話則只需要花費(fèi)2000美元。當(dāng)然,這些數(shù)據(jù)并不完全是直接的對(duì)比,使用傳統(tǒng)的技術(shù)可能會(huì)更為可靠而且更加易于管理。
如果你主要關(guān)心的是降低成本,那么你就要考慮用相對(duì)簡(jiǎn)單的方式使用大數(shù)據(jù)工具。這種項(xiàng)目基本是由IT部門主要根據(jù)技術(shù)和經(jīng)濟(jì)條件完成。你可能會(huì)希望讓你的一些用戶和發(fā)起者也參與到討論這種存儲(chǔ)方式在數(shù)據(jù)管理方面的優(yōu)勢(shì)和劣勢(shì)之中,大概就是這樣了。
大數(shù)據(jù)工具的第二個(gè)重要的好處是縮短時(shí)間。Macy’s Inc.的定價(jià)機(jī)制優(yōu)化應(yīng)用提供了一個(gè)典型的縮短時(shí)間的例子,這個(gè)應(yīng)用將復(fù)雜或大規(guī)模的分析計(jì)劃所需要的時(shí)間減少了幾個(gè)小時(shí)、甚至是幾天,把整個(gè)過程壓縮到幾分鐘甚至幾秒之內(nèi)。這家連鎖商店現(xiàn)在已經(jīng)能夠把優(yōu)化7300萬件商品的價(jià)格的時(shí)間從超過27小時(shí)壓縮到不到1小時(shí)。軟件廠商SAS將其稱為“高性能分析”,或者是HPA,HPA讓Macy’s能夠更加頻繁地根據(jù)零售市場(chǎng)情況的變化調(diào)整商品的售價(jià)。這種HPA應(yīng)用并沒有使用Hadoop集群,但是它確實(shí)利用了并行計(jì)算和駐留內(nèi)存軟件架構(gòu)。Macy’s還表示該公司將軟件成本降低了70%。
如果你的公司感興趣的主要是縮短時(shí)間,你就需要同相關(guān)企業(yè)的老板緊密配合。關(guān)鍵的問題是你想用流程中節(jié)省下來的時(shí)間干什么。好的答案包括:
• 我們將能夠更頻繁地調(diào)整、修改模式,以便得到更好的解決方案;
• 我們將使用更多的變量和更多的數(shù)據(jù)進(jìn)行計(jì)算,為我們的客戶提供實(shí)時(shí)的推薦;
• 我們將能夠?qū)τ诃h(huán)境中的意外事件更快地做出響應(yīng)。
壞的答案(至少從嚴(yán)格的商業(yè)角度來看)包括能夠省出更多的時(shí)間玩高爾夫、喝更多的咖啡或者終于有足夠的時(shí)間吃“三杯馬提尼酒”的午餐了。
企業(yè)通過大數(shù)據(jù)能夠做的最好的事情就是開發(fā)新產(chǎn)品和新服務(wù)。在這方面做的最好的公司可能是LinkedIn Corp.,這家公司利用大數(shù)據(jù)和數(shù)據(jù)專家開發(fā)了大量的產(chǎn)品和功能,包括“你可能認(rèn)識(shí)的人”、“你可能喜歡的群組”、“你可能感興趣的工作”、“誰看了你的資料”等。通用電氣在多個(gè)目標(biāo)中,更側(cè)重于利用大數(shù)據(jù)提高服務(wù)水平,優(yōu)化服務(wù)合同并保持工業(yè)產(chǎn)品的間隔;還有很多其他的例子:谷歌公司當(dāng)然利用大數(shù)據(jù)來完善其核心的搜索及廣告服務(wù)算法;Zynga公司利用大數(shù)據(jù)為客戶定位游戲和游戲相關(guān)產(chǎn)品;Netflix公司為能夠幫助該公司優(yōu)化為客戶推薦電影功能的數(shù)據(jù)科學(xué)團(tuán)隊(duì)提供了著名的Netflix獎(jiǎng)。測(cè)試企業(yè)Kaplan利用大數(shù)據(jù)為客戶提供有效學(xué)習(xí)和測(cè)試準(zhǔn)備策略的建議。這些公司的大數(shù)據(jù)應(yīng)用都直接聚焦于產(chǎn)品、服務(wù)和客戶的。
事實(shí)上,這些都非常有意義。當(dāng)然,是對(duì)于利用大數(shù)據(jù)和整個(gè)過程推動(dòng)新產(chǎn)品開發(fā)的組織來說。顯然,你需要同產(chǎn)品開發(fā)團(tuán)隊(duì)緊密合作,也許還需要和市場(chǎng)營(yíng)銷部門密切配合。也許這些項(xiàng)目是由企業(yè)領(lǐng)導(dǎo)者而不是技術(shù)人員或者數(shù)據(jù)專家發(fā)起的。你可能不會(huì)節(jié)省大量的金錢或時(shí)間,但是你可能會(huì)讓你的公司的營(yíng)收出現(xiàn)明顯的增長(zhǎng)。
現(xiàn)在能夠認(rèn)同明確你希望通過大數(shù)據(jù)得到什么是你首先應(yīng)該利用資源去做的、最重要的事情。


