發(fā)布:2014/12/6 9:38:38
作者:
來源:光波網
如果2014年是Apache的Hadoop引發(fā)了大數(shù)據(jù)革命的一年,那么2015年可能是Apache Spark取代Hadoop以其卓越的能力和更豐富更及時的分析功能。柯特莫納什的IT分析公司負責人表示稱,有一個強大的行業(yè)共識,即Spark有很多的路需要走。
Spark是一個引擎,主要是用于分析存儲在整個計算機集群的數(shù)據(jù)。類似Hadoop,Spark可用于檢查那些太大裝配到傳統(tǒng)的數(shù)據(jù)倉庫或關系數(shù)據(jù)庫中的數(shù)據(jù)集。另外像Hadoop,Spark可以在非結構化數(shù)據(jù),如事件日志,還沒有被格式化成數(shù)據(jù)庫表的工作。
Spark超出了Hadoop的可以很容易做到的,因為它可以分析流數(shù)據(jù)。因此它可以作為一個更快的更換,以Hadoop的MapReduce框架進行數(shù)據(jù)分析。在每年的代托納灰排序挑戰(zhàn),其中基準數(shù)據(jù)分析系統(tǒng)的速度。
相關資訊
企業(yè)資訊
供應
企業(yè)
更多熱點聚焦
更多國內要聞
更多國內要聞
更多國際動態(tài)
更多農業(yè)
更多