2013(第四屆)中國物聯(lián)網(wǎng)大會在北京國際會議中心隆重開幕。本次大會由中國電子學(xué)會主辦,中國電子物聯(lián)網(wǎng)專家委員會承辦。中國工程院院士鄔賀銓出席大會并以《物聯(lián)網(wǎng)與大數(shù)據(jù)》為題作了主題報告。
以下是文字實錄:
尊敬的各位院士專家來賓早上好,很高興來參加今天大會,高興看到這么多領(lǐng)導(dǎo)專家參加,說明大家非常關(guān)注物聯(lián)網(wǎng),今天以物聯(lián)網(wǎng)大數(shù)據(jù)跟大家分享,主要講三個方面內(nèi)容:一個是物聯(lián)感知,物聯(lián)網(wǎng)通過感知幫助我們進(jìn)行決策。ITU的物聯(lián)網(wǎng)定義是物理和虛擬的,我們過去理解物聯(lián)網(wǎng)都認(rèn)為物聯(lián)網(wǎng)對象一定是物理的,實際上ITU認(rèn)為虛擬也是物聯(lián)網(wǎng)對象,其中虛擬物件是指什么,是指存儲處理結(jié)構(gòu)內(nèi)容,利用多媒體內(nèi)容和應(yīng)用軟件,物聯(lián)網(wǎng)提供滿足安全要求,物聯(lián)網(wǎng)中的實物和虛擬相聯(lián)合的。
實物有類,一是身份識別,比如說條碼,還有非身份識別類,需要識別,你可以ID進(jìn)去,對這個物體我們不是靠ID識別,是需要物體的實體體征和屬性。
物聯(lián)網(wǎng)所需要感受的物件對象范圍非常之寬,物聯(lián)網(wǎng)收集數(shù)據(jù),我們剛剛說虛擬東西也是物聯(lián)網(wǎng)對象,我們看很多東西收集,如瀏覽器、搜索引擎、智能終端、游戲終端、GPS等,他通過大家日常網(wǎng)絡(luò)留下痕跡和腳印獲取大量的數(shù)據(jù)。
物聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù)。美國人前幾年醫(yī)院一年產(chǎn)生500個數(shù)據(jù),IMT1。4TB數(shù)據(jù)等各種的數(shù)據(jù)通過傳感器產(chǎn)生,也有在網(wǎng)上直接產(chǎn)生的,我們現(xiàn)在處于大數(shù)據(jù)時代,物聯(lián)網(wǎng)一分鐘可以產(chǎn)生非常多的東西,蘋果下載2萬余次,一分鐘會上傳10萬條新微博,全世界物聯(lián)網(wǎng)上虛擬網(wǎng)絡(luò)上,產(chǎn)生了大量的數(shù)據(jù)。
國外的這些公司數(shù)據(jù)量不一定有中國大,中國淘寶網(wǎng)在雙十一一天創(chuàng)收10。5億,新浪微博晚上有100萬以上的響應(yīng)請求,中國聯(lián)通也進(jìn)行大數(shù)據(jù)搜集,他們以前給用戶每一個月發(fā)一個帳單,很多用戶認(rèn)為我沒有上這么多,中國聯(lián)通改制就詳細(xì)記錄客戶的上網(wǎng)記錄一秒鐘83萬條。
虛擬運行管理產(chǎn)生數(shù)據(jù)量更大,這個比較是美國,每天是80個,發(fā)動機引擎收據(jù)588,企業(yè)資源管理客戶關(guān)系管理等現(xiàn)在是大數(shù)據(jù),企業(yè)本身也是每時每刻產(chǎn)生大量數(shù)據(jù)。
2012年IDC公司指出在2005年由機器產(chǎn)生的數(shù)據(jù)占到數(shù)據(jù)總量的11%,2020增加到42%。比如說醫(yī)療,現(xiàn)在到醫(yī)院看病都要CT,清晰度很高300多兆,一個病人CT影響往往多大兩千幅,數(shù)據(jù)量已經(jīng)到了幾十個GB,如今中國大城市的醫(yī)院每天門診上完人,全國每年住院已經(jīng)達(dá)到了兩億人次,按照醫(yī)療行業(yè)的相關(guān)規(guī)定,一個患者的數(shù)據(jù)通常需要保留50年以上。
物聯(lián)網(wǎng)數(shù)據(jù)類型這是澳大利亞一個大學(xué),他計算機科室研究,量很大,從2010年到2015年漲五倍,以及產(chǎn)業(yè)還有實業(yè)、物流,這是公共設(shè)施以及我們汽車,智慧城市發(fā)展智慧醫(yī)療、家具等,都會帶動物聯(lián)網(wǎng)發(fā)展。
物聯(lián)網(wǎng)產(chǎn)生的大數(shù)據(jù)與一般的大數(shù)據(jù)有不同的特點。物聯(lián)網(wǎng)的數(shù)據(jù)是異構(gòu)的、多樣性的、非結(jié)構(gòu)和有噪聲的,更大的不同是它的高增長率。物聯(lián)網(wǎng)的數(shù)據(jù)有明顯的顆粒性,其數(shù)據(jù)通常帶有時間、位置、環(huán)境和行為等信息。物聯(lián)網(wǎng)數(shù)據(jù)可以說也是社交數(shù)據(jù),但不是人與人的交往信息,而是物與物,物與人的社會合作信息。
物聯(lián)網(wǎng)的混搭將使物聯(lián)網(wǎng)的數(shù)據(jù)變得更有用,將物聯(lián)網(wǎng)感知的數(shù)據(jù)與通過社會媒體獲得的數(shù)據(jù)結(jié)合,也就是人跟機器的社會聯(lián)網(wǎng),將使決策更科學(xué)。
與隱私與法律有關(guān)的特殊性,誰是物聯(lián)網(wǎng)數(shù)據(jù)的擁有者,通過物聯(lián)網(wǎng)可以控制家用電器。
最后,大數(shù)據(jù)助力物聯(lián)網(wǎng),不僅僅是收集傳感性的數(shù)據(jù),實物跟虛擬物要結(jié)合起來。今天北京交通堵塞,但是并不知道堵塞原因,如果政府發(fā)布消息和市民微博發(fā)布消息結(jié)合起來就知道發(fā)生什么事,物聯(lián)網(wǎng)要過濾,過濾要有一定模式。
決策的時候還要考慮發(fā)布什么東西,會帶來什么影響,最近有地震,他能預(yù)測60%地震,總有一天會說準(zhǔn)。
物聯(lián)網(wǎng)數(shù)據(jù)挖掘涉及到數(shù)據(jù)存儲,從實物虛擬物獲取存儲,然后進(jìn)行一些虛擬化和找出數(shù)據(jù)摘要,是要加標(biāo)簽的。
數(shù)據(jù)挖掘模式,合并壓縮、清洗過濾、格式轉(zhuǎn)換,法階段數(shù)據(jù)分析、知識發(fā)現(xiàn)、可視化、數(shù)據(jù)階段,關(guān)聯(lián)規(guī)則,分類、聚類、序列、路徑。因此后面工作更大更重要而且更難。
我舉例子泥石流,最近發(fā)生蘆山和寶興地震,很容易發(fā)生泥石流,把這些數(shù)據(jù)收集,收集完了根據(jù)已有的數(shù)據(jù)模式進(jìn)行分析
最近大家關(guān)注PM2。5,另外云南西北邊、西川西南邊干旱容易發(fā)生火災(zāi),利用雷達(dá)、飛機可以搜集數(shù)據(jù),也需要進(jìn)行分析,然后產(chǎn)生判斷。
在水面取樣,通過衛(wèi)星發(fā)出去,利用云計算、中心數(shù)據(jù)挖掘,河流的環(huán)境污染,數(shù)字化的模式,我們可以發(fā)現(xiàn)有的地方有環(huán)境污染,所污染本身需要異源數(shù)據(jù),除了傳感器、物聯(lián)網(wǎng)數(shù)據(jù)有噪聲的不干凈的,所以需要多種數(shù)據(jù)的結(jié)合,歷史數(shù)據(jù)的挖掘,然后進(jìn)行分析預(yù)感、預(yù)警,所以數(shù)據(jù)后面的處理,食品現(xiàn)在也是大家所關(guān)注的,手機拍下來食品到后臺去查,是哪個公司的食品,在什么地方生產(chǎn),食品生產(chǎn)日期等等,包括食品安全不安全,營養(yǎng)成分怎么樣,食品監(jiān)控,運用后臺數(shù)據(jù)等等。最近禽流感流行,怎么去監(jiān)測,凡是產(chǎn)生流感病人在網(wǎng)上尋找,吃什么藥好,哪個地方看病好,或者微博交流。
智能交通虛擬化和可視化。交通管理中心再大,也裝不上所有的視頻,因此10秒鐘,這樣看上去每時每刻只有能夠監(jiān)控很小一部分內(nèi)容,通過軟件把整條路上變成一個視頻,再進(jìn)一步我把所有馬路都通過大數(shù)據(jù)軟件后臺分析組成圖象,這圖象像上海市領(lǐng)導(dǎo)人坐飛機俯視地面一樣。所以這些都是后臺數(shù)據(jù)分析。
大數(shù)據(jù)在社會管理上有很好的作用。