亞馬遜Web服務(wù)近年來(lái)頻繁變動(dòng),從價(jià)格削減到緊密整合私有數(shù)據(jù)中心,再到調(diào)整企業(yè)市場(chǎng),而且不斷擴(kuò)展其原來(lái)的開(kāi)發(fā)者和創(chuàng)業(yè)公司客戶。
在眾多執(zhí)行者中一馬當(dāng)先的就是Matt Wood,他是亞馬遜Web服務(wù)(AWS)的數(shù)據(jù)科學(xué)總經(jīng)理。SearchCloudComputing本周在AWS峰會(huì)上和他探討了企業(yè)客戶的熱點(diǎn)問(wèn)題。這里我們將談?wù)勗苾r(jià)格、云聯(lián)盟、法規(guī)以及數(shù)據(jù)定位。
TechTarget云計(jì)算:云價(jià)格是當(dāng)下的熱點(diǎn)話題,谷歌和亞馬遜都在本周大幅降價(jià)。在每個(gè)人都可以免費(fèi)得到一切之前價(jià)格究竟會(huì)有多低?
Matt Wood:我們一直都知道, 和我們的零售業(yè)務(wù)有一點(diǎn)像,云計(jì)算是一種大容量、低利潤(rùn)的游戲,而且這是一種我們非常適應(yīng)的業(yè)務(wù)模式。
如果你回顧過(guò)去的八年,我們降價(jià)42次,這樣做并沒(méi)有任何真正的競(jìng)爭(zhēng)壓力。降價(jià)只是我們所做的一部分,是我們的組織發(fā)展的脈搏的而一部分,而且我們處于良性循環(huán)中……有越多客戶采納這個(gè)平臺(tái)的地方,他們就使用得更多,而且因?yàn)槲覀兡茏叱鋈ズ臀覀兊膹S商進(jìn)行客制交易,我們走出去,并且利用規(guī)模經(jīng)濟(jì),總體上我們最終是節(jié)省了成本。我們還可以從中獲利。這也是一種合情合理的事情。但是我們選擇將這些成本節(jié)省回饋給客戶……我們一直在做這些事情,而且未來(lái)我們還會(huì)這樣做。
TechTarget云計(jì)算:你的專長(zhǎng)領(lǐng)域是數(shù)據(jù)科學(xué)和大數(shù)據(jù)分析。在這個(gè)領(lǐng)域里你是否看到了一些新的趨勢(shì)?
Wood: 最大的趨勢(shì)之一就是增益,而非取代,但是傳統(tǒng)商業(yè)智能的增益則伴隨更加實(shí)時(shí)的服務(wù)。而且是二者同時(shí)變得更加強(qiáng)大。
芬蘭游戲公司Supercell就是個(gè)很好的例子……他們運(yùn)作流行移動(dòng)游戲,比如部落戰(zhàn)爭(zhēng)(COC),而且他們一天中有八百萬(wàn)人在ios上玩這個(gè)游戲。理想上,如果你是個(gè)游戲公司,你希望盡可能地捕捉價(jià)值。你想知道人們?nèi)绾瓮螒蚴澜缃换。你想知道你的游戲?jìng)技表現(xiàn)如何。你想知道誰(shuí)買(mǎi)了什么,以及誰(shuí)和誰(shuí)進(jìn)行了對(duì)話,在什么情況下退出了游戲。你可以利用這些信息改善游戲。
通過(guò)收集所有數(shù)據(jù)有些已經(jīng)實(shí)現(xiàn)了。你收集什么并沒(méi)有限制,使用亞馬遜實(shí)施管理流服務(wù)Kinesis,就是一種實(shí)現(xiàn)途徑,你可以將數(shù)據(jù)丟進(jìn)去,并且以不同的樣本率連接傳感器,,用同樣的數(shù)據(jù)流可以做不同的事情。
TechTarget云計(jì)算:亞馬遜將自己描述為“客戶導(dǎo)向”。那么哪些特性和服務(wù)是客戶目前尋求的呢?
Wood:他們會(huì)詢問(wèn)類(lèi)似這樣的事情,‘是否易于訪問(wèn)高價(jià)值、公共數(shù)據(jù)集?’這就要求我們要做很多。因?yàn)橛泻芏鄶?shù)據(jù)。我們花費(fèi)大量的時(shí)間識(shí)別,且同公共的可用數(shù)據(jù)工作,并且使其易于使用。
Common Crawl就是個(gè)很好的例子,它會(huì)定期更新,是一個(gè)非常大的Web集,Web上的每一頁(yè)、下載和預(yù)計(jì)算,放到一個(gè)主頁(yè)上,這就讓Hadoop很容易運(yùn)行。你不必自己來(lái)抓取,必須將原素材進(jìn)行預(yù)計(jì)算所有的標(biāo)簽,并且移除HTML和類(lèi)似的東西,這些都已經(jīng)做好了。
你所得到的就是格式化的數(shù)據(jù),易于用分布式的方式使用。你可以在冷啟動(dòng)中在不到十分鐘的時(shí)間里查詢數(shù)十億網(wǎng)頁(yè)。我們存儲(chǔ)且托管這個(gè)數(shù)據(jù)是免費(fèi)的,因?yàn)閷?duì)于整個(gè)社區(qū)是有益的,然后我們確保其遵循了最佳的簡(jiǎn)單對(duì)象存儲(chǔ)(S3)訪問(wèn)實(shí)踐,所以這也很容易加速大型Hadoop集群,并且運(yùn)行查詢。
TechTarget云計(jì)算:我們接觸的一些客戶認(rèn)為云聯(lián)盟很有前途,亞馬遜如何看待這個(gè)問(wèn)題呢?
Wood: 我們目前還沒(méi)從客戶那里聽(tīng)到這樣的說(shuō)法,但是這并不代表未來(lái)這不重要。
我們從一些更大企業(yè)機(jī)構(gòu)那里聽(tīng)到就是已經(jīng)在基礎(chǔ)架構(gòu)上進(jìn)行了大量投資。他們已經(jīng)有了藍(lán)圖。我們和這些人談?wù)摰臅r(shí)候,我們嘗試引導(dǎo)他們并非一種選擇,可以本地運(yùn)行或者是在AWS上運(yùn)行一切。
我們過(guò)去的十八個(gè)月都在構(gòu)建集成點(diǎn),使其更易于讓用戶在有意義的地方運(yùn)行工作負(fù)載。我們?cè)谒麄兊臄?shù)據(jù)中心和我們的數(shù)據(jù)中心之間構(gòu)建了直接的鏈接,我們提供私有存儲(chǔ)選擇,我們也有私有計(jì)算選擇,我們識(shí)別了聯(lián)合選擇以及類(lèi)似于WorkSpaces這樣的事物,這是一種在后端同活動(dòng)目錄集成的事物。所有的這些集成點(diǎn)都幫助客戶在其工作負(fù)載上做出正確的選擇。
TechTarget云計(jì)算:一些客戶處于法規(guī)遵從原因需要將數(shù)據(jù)保存在某個(gè)特性區(qū)域,亞馬遜能夠簽署法定協(xié)議,保證客戶的數(shù)據(jù)不會(huì)離開(kāi)具體的可用區(qū)或者具體的區(qū)域嗎?
Wood: 實(shí)際上,你如果不選擇數(shù)據(jù)存在哪里是沒(méi)辦法使用我們的平臺(tái)的?蛻舯仨氉龀鲋(jǐn)慎的決定,確定其數(shù)據(jù)將會(huì)存在的區(qū)域。我們有這樣的特定區(qū)域,每一個(gè)區(qū)域都有多種可用區(qū),而且可用區(qū)內(nèi)部都有數(shù)據(jù)中心。以S3服務(wù)為例,我們通過(guò)可用去得到鏡像數(shù)據(jù),但是我們不會(huì)在區(qū)域間做鏡像數(shù)據(jù)。