鑒于現(xiàn)如今的企業(yè)都在開始積極的挖掘并分析大數(shù)據(jù),目前已然有了一些變化的征兆正在形成。
這一次,似乎是HPC(高性能計算)的硬件供應商們在進行一些反思:到底哪些硬件設備能夠為大數(shù)據(jù)的有效載荷提供最佳的處理,以便能夠滿足對大數(shù)據(jù)盡快處理和分析的需求。
大數(shù)據(jù)的HPC遺產(chǎn)扎根于高校和科研院所,以其超大的碳排放量和運作成本維持著超級計算。但是,一般的大型企業(yè)和中小企業(yè)并不適合運營這樣的空間。相反,這些企業(yè)希望獲得的是他們負擔得起的、且可擴展的強大計算能力。這樣,大數(shù)據(jù)可以作為他們數(shù)據(jù)中心的預算。除非這些企業(yè)選擇采用云服務提供商的托管服務,并讓云服務提供商來替他們運行大數(shù)據(jù)的處理和分析工作,否則,他們也需要尋找真正的(而非虛擬化)HPC平臺,因為高性能計算和大數(shù)據(jù)在虛擬化環(huán)境中的表現(xiàn)并非良好。
到目前為止,大型企業(yè)在其企業(yè)級數(shù)據(jù)中心所選擇的大數(shù)據(jù)處理平臺所采用的均為x86服務器。部分的原因是緣于這些服務器在大數(shù)據(jù)處理集群的易擴展性,方便了企業(yè)擴大他們的大數(shù)據(jù)處理能力。另一個原因是x86級服務器比較符合一般企業(yè)的經(jīng)濟承受能力。即使如此,這些服務器也必須進行特殊的配置,以便滿足HPC的并行處理以及操作大數(shù)據(jù)分析。
在x86硬件架構中,大數(shù)據(jù)可以并行處理,但每臺服務器只能有兩個線程。相比之下,在一個RISC(精簡指令集計算機)芯片環(huán)境,習慣上運行Unix的計算機,可以并行處理四個線程,每臺服務器提高了一倍。
大數(shù)據(jù)解決方案供應商們是如何應對這一現(xiàn)象的呢?
IBM在早在幾年前就推出了其基于RISC的電力系統(tǒng)。具備擴展能力,能夠為大數(shù)據(jù)的HPC運行Linux和Unix(AIX)集群。為了與之抗衡,甲骨文則在2013年第一季度末推出了其SPARCT5處理器。
而伴隨著這一系列新產(chǎn)品紛紛上市的一個有趣的背景是基于RISC的Unix計算機市場實際上一直在萎縮下降。故而業(yè)內對于供應商們?yōu)槭裁磿谶@方面做出重大投資或多或少的存在著某些不理解。
而當我們意識到未來的大數(shù)據(jù)處理可能會超越基于x86的計算平臺說能夠提供的能力之后,上述疑惑的答案就變得簡單了。今天的基于RISC的服務器也可以運行Linux和Unix,這是非常有益的,因為企業(yè)的IT部門往往有充足的Linux人才,但Unix人才卻不一定。
所以,當您的企業(yè)需要繼續(xù)在數(shù)據(jù)中心部署大數(shù)據(jù)分析項目時,您會怎么做呢?如下,是我們給您的一些建議,供您參考借鑒:
1、重新考慮你企業(yè)的資產(chǎn)規(guī)劃
許多企業(yè)的數(shù)據(jù)中心站點已經(jīng)在考慮實施在x86級服務器上部署大數(shù)據(jù)處理集群了。但是,現(xiàn)在就考慮采用基于RISC的系統(tǒng)還為時尚早,畢竟這些是未來才會用到的。朝著這方面考慮的話,不僅需要消耗大量的資金,同時還需要進行IT基礎設施的整合,滿足適當?shù)膶嵤l件,因為大數(shù)據(jù)處理需要“真正的”硬件。(除非你的企業(yè)將自己的大數(shù)據(jù)工作外包給云服務提供商)
2、評估IT部門員工技能
基于RISC的平臺能夠運行Linux,但他們仍然代表了一個不同的硬件架構,即使是最好的自動化也無法完全呈現(xiàn)透明。所以,您的IT部門的員工們可能需要掌握新的IT系統(tǒng)和管理技能。
3、與您的供應商積極的溝通
始終與你的大數(shù)據(jù)供應商保持積極的對話。這不僅僅是要了解他們當前所銷售的產(chǎn)品,同時,更重要的是你必須還應該清楚他們的技術路線圖,他們的產(chǎn)品的發(fā)展方向。如果他們的目標是轉向RISC,而他們向您的企業(yè)出售的產(chǎn)品則是基于x86的,那么,是時候坐下來和他們好好談談一下您所關注的問題了。畢竟,您的企業(yè)是他們的客戶。如果他們想要滿足您企業(yè)的需求,那么,為您企業(yè)提供遷移路徑、針對您的企業(yè)提供相關的培訓和產(chǎn)品折扣也是他們的責任。(作者:litao984lt編譯)