2012年6月25日,全球領(lǐng)先的獨(dú)立企業(yè)數(shù)據(jù)集成軟件提供商Informatica公司(納斯達(dá)克代碼:INFA)近日宣布,其為Hadoop所優(yōu)化的首個數(shù)據(jù)轉(zhuǎn)換環(huán)境Informatica HParser現(xiàn)已通過Amazon Web Services(AWS)以云方式提供給客戶。
Amazon Elastic MapReduce(EMR)總經(jīng)理Peter Sirota說:“在當(dāng)今的分析工作流程中,客戶面對各式各樣不同的數(shù)據(jù)格式,因此我們對Amazon Elastic MapReduce與Informatica HParser的集成很興奮。客戶現(xiàn)在可以在一個易于使用的環(huán)境中處理復(fù)雜數(shù)據(jù),并可在AWS上的任何環(huán)境中對這些數(shù)據(jù)提出問題。”
所有Amazon EMR客戶現(xiàn)在都可以使用Informatica HParser。Informatica HParser提供了對數(shù)據(jù)解析、分層數(shù)據(jù)映射和轉(zhuǎn)換工具的及時訪問,該工具旨在:利用現(xiàn)今所擁有的技能和資源,企業(yè)可以很輕松地發(fā)現(xiàn)其數(shù)據(jù)的價值。憑借在Amazon EMR上的Hadoop框架能力,客戶可以快速地配置用于其分析管道所需的資源,而無需大量的資本投入或復(fù)雜的軟件配置,只需支付他們所消耗的資源。
Amazon EMR的HParser使得待分析的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)變得更加容易快速,成本也更低。它通過在一個可視化的“按例構(gòu)建”環(huán)境訪問所有的數(shù)據(jù)格式和結(jié)構(gòu),對日志和二進(jìn)制格式提供現(xiàn)有的支持,并用行業(yè)標(biāo)準(zhǔn)格式包裝數(shù)據(jù)轉(zhuǎn)換,包括ACORD、FIX、SWIFT、HL7和EDI。
在EMR上的HParser獨(dú)特優(yōu)勢包括:
·來自企業(yè)數(shù)據(jù)集成領(lǐng)導(dǎo)者的、對解析和轉(zhuǎn)換數(shù)據(jù)的商業(yè)化支持。
·采用在云中的Hadoop能夠處理復(fù)雜數(shù)據(jù)集和轉(zhuǎn)換。
·用于測試現(xiàn)有的解析器和開發(fā)定制解析器的可視化的IDE。
·快速構(gòu)建、測試和配置Hadoop數(shù)據(jù)處理管道。
·通過使用樣本數(shù)據(jù)集,Amazon EMR上HParser的無風(fēng)險試驗(yàn)。
Informatica公司執(zhí)行副總裁兼首席產(chǎn)品官Girish Pancha說:“我們期待著繼續(xù)和AWS合作,為客戶提供最大化的數(shù)據(jù)投資回報。Amazon EMR為在Hadoop上的大數(shù)據(jù)處理提供了一個出色的途徑,并且HParser帶給它企業(yè)級的復(fù)雜數(shù)據(jù)集解析和映射能力,例如日志、文件、分層數(shù)據(jù)和其他工業(yè)標(biāo)準(zhǔn)格式。Amazon EMR上的HParser將幫助我們的客戶更容易、快速和低成本地進(jìn)行數(shù)據(jù)集成和分析。”