Hadoop是一個(gè)流行的靈活的且費(fèi)效比高的框架,可用來(lái)分析非結(jié)構(gòu)化數(shù)據(jù)。2012年全球Hadoop市場(chǎng)的價(jià)值有15億美元,估計(jì)到2020年會(huì)有500億美元。企業(yè)現(xiàn)在可以選擇部署Hadoop集群到物理的服務(wù)器環(huán)境、私有云環(huán)境或者是公有云環(huán)境。在這一增長(zhǎng)期內(nèi),我們還看不出哪種模式會(huì)占據(jù)優(yōu)勢(shì),不過(guò)私有云環(huán)境所具有的高安全性和細(xì)粒度的控制也許能讓這一模式在大中型企業(yè)中成為主流。與其他模式相比, 私有云里的Hadoop集群有以下獨(dú)特的好處:
? 幾分鐘內(nèi)就可以搭建一個(gè)集群。
? 各種類(lèi)型的硬件(DAS、SAN、NAS)可以靈活地使用。
? 費(fèi)效比高,比物理機(jī)器部署的模式的投資要少,比公有云部署模式的運(yùn)維成本低。
? 簡(jiǎn)化的管理工具可以降低初始配置和維護(hù)的復(fù)雜性。
? 高可靠性和容錯(cuò)性能可增加系統(tǒng)在線(xiàn)時(shí)間。
本報(bào)告檢視了在私有云環(huán)境或匯聚模式(基于容器)下部署Hadoop的好處,并給出了最大化性能的最佳實(shí)踐的概覽。

