- 相關(guān)推薦
物聯(lián)網(wǎng)數(shù)據(jù)挖掘研究論文
摘要:當(dāng)前信息社會環(huán)境下,信息產(chǎn)業(yè)成為國民經(jīng)濟(jì)發(fā)展的基礎(chǔ)條件,其中物聯(lián)網(wǎng)是全新信息技術(shù)的重要構(gòu)成部分,是實(shí)現(xiàn)智能化的核心技術(shù)。物聯(lián)網(wǎng)中的數(shù)據(jù)挖掘是物聯(lián)網(wǎng)技術(shù)中較為重要的一個(gè)環(huán)節(jié),其價(jià)值體現(xiàn)在為物聯(lián)網(wǎng)應(yīng)用數(shù)據(jù)大量增長下提供強(qiáng)力補(bǔ)充。當(dāng)前基于海量數(shù)據(jù)的增加,物聯(lián)網(wǎng)數(shù)據(jù)挖掘正面臨著一定的挑戰(zhàn),而云計(jì)算的出現(xiàn)為其提供了一個(gè)全新的發(fā)展方向。該文以云計(jì)算、物聯(lián)網(wǎng)、數(shù)據(jù)挖掘技術(shù)特征與相互聯(lián)系為基礎(chǔ),分析基于云計(jì)算平臺的物聯(lián)網(wǎng)數(shù)據(jù)挖掘。
關(guān)鍵詞:云計(jì)算平臺;物聯(lián)網(wǎng);數(shù)據(jù)挖掘
物聯(lián)網(wǎng)是當(dāng)前智能化社會發(fā)展的一個(gè)重要顯示,近幾年隨著科研事業(yè)的快速進(jìn)展下,物聯(lián)網(wǎng)以及從一個(gè)概念存在逐漸融入到現(xiàn)實(shí)生活中。物聯(lián)網(wǎng)的出現(xiàn)實(shí)現(xiàn)了人們生活與工作的智能化,極大的改變的了生活與工作方式,提升了辦事效率。而物聯(lián)網(wǎng)的實(shí)現(xiàn)依靠中的技術(shù)的支持,其中數(shù)據(jù)挖掘技術(shù)便是其中一個(gè)重要支撐條件,數(shù)據(jù)挖掘?qū)崿F(xiàn)了海量信息的獲取與挖掘,而這種信息能夠支撐物聯(lián)網(wǎng)在實(shí)際操作中的智能化實(shí)現(xiàn)。文中在云計(jì)算平臺的基礎(chǔ)上分析物聯(lián)網(wǎng)數(shù)據(jù)挖掘的相關(guān)研究,其中包括物聯(lián)網(wǎng)數(shù)據(jù)挖掘所面臨的挑戰(zhàn)、在云計(jì)算平臺中物聯(lián)網(wǎng)數(shù)據(jù)挖掘的相關(guān)技術(shù)以及實(shí)際應(yīng)用。
1、云計(jì)算與物聯(lián)網(wǎng)理論基礎(chǔ)
1)云計(jì)算理論云計(jì)算是一種依賴于互聯(lián)網(wǎng)技術(shù),經(jīng)由互聯(lián)網(wǎng)服務(wù)為用戶提供依據(jù)需求而明確服務(wù)的計(jì)算方式。而云計(jì)算命名的由來是由于整個(gè)服務(wù)資源的選自源互聯(lián)網(wǎng)內(nèi)的數(shù)據(jù),且互聯(lián)網(wǎng)多會應(yīng)用云狀圖案對資源進(jìn)行顯示,因此被稱之為與計(jì)算。云計(jì)算基于其應(yīng)用技術(shù)的先進(jìn)性具備了以下幾大特征:
第一,規(guī)模大。云計(jì)算中的云所顯示的便是差大的規(guī)模,當(dāng)前就谷歌云計(jì)算來看已經(jīng)擁有了100多萬臺服務(wù)器,而其他較大型的搜索引擎也具備了數(shù)十萬臺服務(wù)器。
第二,虛擬化。云計(jì)算能夠支持用戶在任意位置或任意終端進(jìn)行服務(wù)器的登錄,所有操作在云空間進(jìn)行運(yùn)行,由此也便形成了虛擬性特征。
第三,可靠性。云計(jì)算應(yīng)用數(shù)據(jù)多副本絨促以及計(jì)算節(jié)點(diǎn)同構(gòu)可互換等措施來確保服務(wù)的可靠性。
第四,通用性。云計(jì)算不會針對特定的應(yīng)用,在云支持下能夠創(chuàng)造出海量的應(yīng)用。
第五,可延伸性。云計(jì)算的超大規(guī)模能夠支持其進(jìn)行動態(tài)的伸縮,由此滿足各類應(yīng)用與用戶規(guī)模的增長需求[1]。
。玻┪锫(lián)網(wǎng)理論物聯(lián)網(wǎng)屬于全新信息技術(shù)的主要構(gòu)成部分,同時(shí)也是信息化時(shí)代發(fā)展的重要階段。物聯(lián)網(wǎng)實(shí)際上所指的是經(jīng)由多種技術(shù)的應(yīng)用實(shí)現(xiàn)物與物之間的連接,而這種連接形成了一個(gè)局域網(wǎng)絡(luò),實(shí)現(xiàn)遠(yuǎn)程與集中操控。物聯(lián)網(wǎng)雛形的出現(xiàn)可追溯到1990年,后期隨著各項(xiàng)理論與技術(shù)的不斷研發(fā)下,在近幾年已經(jīng)能夠?qū)崿F(xiàn)在現(xiàn)實(shí)生活中,且被廣泛的應(yīng)用。其實(shí)際意義在于,經(jīng)由各項(xiàng)技術(shù)將多種物品與互聯(lián)網(wǎng)進(jìn)行連接,實(shí)現(xiàn)信息交換與通信,由此實(shí)現(xiàn)了物品的智能化,用戶可經(jīng)由遠(yuǎn)程終端進(jìn)行操控,便捷了人們的生活,同時(shí)也提升了各物品應(yīng)用的安全性。與互聯(lián)網(wǎng)對比物聯(lián)網(wǎng)具備了以下幾大特征:一方面表現(xiàn)在物聯(lián)網(wǎng)應(yīng)用到多種感知技術(shù);第二方面表現(xiàn)在物聯(lián)網(wǎng)屬于建立在互聯(lián)網(wǎng)基礎(chǔ)上的泛在網(wǎng)絡(luò);第三方面表現(xiàn)在物聯(lián)網(wǎng)的核心價(jià)值是提供不限定任何場合與時(shí)間的應(yīng)用場景與用戶的自由互換[2]。
。常┪锫(lián)網(wǎng)的建設(shè)物聯(lián)網(wǎng)在應(yīng)用過程中需要多個(gè)行業(yè)的參與,且需要政府方面所提供的支持,物聯(lián)網(wǎng)具備多種優(yōu)勢,可廣泛地應(yīng)用在社會各個(gè)領(lǐng)域中,但是在實(shí)際應(yīng)用過程中技術(shù)建設(shè)始終是一大難題。就常規(guī)上來講,物聯(lián)網(wǎng)的建設(shè)需要經(jīng)由以下幾個(gè)步驟:第一,對需要建設(shè)物聯(lián)網(wǎng)的物體屬性進(jìn)行識別,包括靜態(tài)與動態(tài)的屬性,其中靜態(tài)屬性可直接進(jìn)行存儲,而動態(tài)屬性則需要應(yīng)用傳感器進(jìn)行探測;第二,對識別完成后的物體屬性進(jìn)行讀取,將讀取信息轉(zhuǎn)換為網(wǎng)絡(luò)識別數(shù)據(jù);第三,將物體的信息經(jīng)由網(wǎng)絡(luò)傳輸至信息處理中心,由處理中心實(shí)現(xiàn)物體與互聯(lián)網(wǎng)之間的通信[3]。
2、數(shù)據(jù)挖掘技術(shù)界定與特征分析
2.1數(shù)據(jù)挖掘技術(shù)概念
數(shù)據(jù)挖掘技術(shù)出現(xiàn)在二十世紀(jì)后期,雖然其出現(xiàn)時(shí)間不長,但是對社會中各領(lǐng)域的發(fā)展形成了巨大的影響,也引起自有優(yōu)勢得到了廣泛的應(yīng)用。數(shù)據(jù)挖掘從廣泛意義上來講所指的是從大量數(shù)據(jù)中經(jīng)由可靠的算法搜索隱藏其中信息的整個(gè)過程。數(shù)據(jù)挖掘與計(jì)算機(jī)科學(xué)存在著緊密的聯(lián)系,利用計(jì)算機(jī)技術(shù)經(jīng)由統(tǒng)計(jì)、分析、情報(bào)檢索、機(jī)器學(xué)習(xí)等多種手段實(shí)現(xiàn)其實(shí)際價(jià)值。當(dāng)前數(shù)據(jù)挖掘在應(yīng)用到不同領(lǐng)域后,也被賦予了不同的概念。但就其應(yīng)用價(jià)值可從三個(gè)方面進(jìn)行概述,第一個(gè)方面為提供海量可靠信息;第二個(gè)方面為經(jīng)由數(shù)據(jù)挖掘所獲取的信息對人們具有較高的應(yīng)用價(jià)值;第三個(gè)方面為所獲取的信息能夠被人們理解與分析,并以此為根據(jù)做出決策[4]。
。玻矓(shù)據(jù)挖掘技術(shù)特征
數(shù)據(jù)挖掘技術(shù)具備了分布廣、規(guī)模大、節(jié)點(diǎn)資源有限、安全性復(fù)雜等特征。其中分布廣主要是數(shù)據(jù)挖掘是物聯(lián)網(wǎng)技術(shù)中的一個(gè)構(gòu)成部分,而物聯(lián)網(wǎng)本身就具備的分布廣泛的特點(diǎn),由此數(shù)據(jù)挖掘基于需要將數(shù)據(jù)存儲在不同的地方,也便具備了分布廣的特點(diǎn);規(guī)模大方面主要是物聯(lián)網(wǎng)中具有海量數(shù)據(jù)的傳輸與應(yīng)用,而數(shù)據(jù)挖掘作為數(shù)據(jù)分析與處理環(huán)節(jié)自然具備了規(guī)模大特點(diǎn);節(jié)點(diǎn)資源有限方面是給予物聯(lián)網(wǎng)較為龐大的數(shù)據(jù)鏈,需要設(shè)置多個(gè)傳感器節(jié)點(diǎn),因此需要有能夠快速解決處理數(shù)據(jù)的中央節(jié)點(diǎn),而節(jié)點(diǎn)資源并非無限,中央節(jié)點(diǎn)通常不需要所有的數(shù)據(jù),但需要數(shù)據(jù)參數(shù),由此對需求數(shù)據(jù)進(jìn)行輸出[5]。
3、物聯(lián)網(wǎng)數(shù)據(jù)挖掘面臨的挑戰(zhàn)
基于物聯(lián)網(wǎng)技術(shù)自身所具備的特征,在數(shù)據(jù)挖掘中也具備了一定的優(yōu)勢,但是新技術(shù)在數(shù)據(jù)挖掘中應(yīng)用較多,物聯(lián)網(wǎng)技術(shù)在數(shù)據(jù)挖掘中也面臨著一定的挑戰(zhàn),具體表現(xiàn)為以下幾個(gè)方面。第一,物聯(lián)網(wǎng)數(shù)據(jù)具有一定的規(guī)則,但是由于其規(guī)則過多也相對較為繁雜,經(jīng)由中央模式對分布式數(shù)據(jù)進(jìn)行挖掘的方式效果并不理想。第二,物聯(lián)網(wǎng)數(shù)據(jù)規(guī)模較大,需要及時(shí)給予可靠的處理,而當(dāng)前處理模式對硬件要求較高,若硬件不能夠符合要求則可能無法實(shí)現(xiàn)。第三,數(shù)據(jù)需求的節(jié)點(diǎn)不斷增加,需求與供給之間存在著一定的矛盾。第四,給予物聯(lián)網(wǎng)數(shù)據(jù)存在著諸多外在影響因素,包括數(shù)據(jù)傳輸安全性、數(shù)據(jù)傳輸?shù)碾[私性、法律約束等因素。將所有數(shù)據(jù)集中存儲在相同的數(shù)據(jù)倉庫中這一渠道顯然不具備可靠性;谏鲜鰩c(diǎn)問題充分顯示出,對物聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)挖掘過程中,當(dāng)前所具備的以及應(yīng)用的多種技術(shù)與手段存在著一定的弊端,針對此需要不斷地進(jìn)行更為深入的研究,以尋找到更為有效的解決方案。
4、基于云計(jì)算平臺的物聯(lián)網(wǎng)數(shù)據(jù)挖掘技術(shù)分析
4.1物聯(lián)網(wǎng)感知層
物聯(lián)網(wǎng)感知層也就是實(shí)現(xiàn)感知作用,具體是依賴于目標(biāo)區(qū)域范圍內(nèi)設(shè)置大量數(shù)據(jù)采集點(diǎn)予以實(shí)現(xiàn)。也就是說節(jié)點(diǎn)是經(jīng)由傳感器與攝像頭以及其他相關(guān)設(shè)備實(shí)現(xiàn)數(shù)據(jù)的采集,所采集到的數(shù)據(jù)需要依賴于物聯(lián)網(wǎng)感知層所具備的網(wǎng)絡(luò)通信設(shè)備進(jìn)行集中處理,將所需要的數(shù)據(jù)傳遞至各節(jié)點(diǎn),再經(jīng)由集中儲存后再次通過傳輸層傳遞至云計(jì)算平臺的數(shù)據(jù)處理中心,實(shí)現(xiàn)整個(gè)感知層的職能。
。矗参锫(lián)網(wǎng)傳輸層
物聯(lián)網(wǎng)傳輸層是所有數(shù)據(jù)傳遞的中間環(huán)節(jié),其中涵蓋著傳感器、無限網(wǎng)絡(luò)等設(shè)備與技術(shù),經(jīng)由多種網(wǎng)絡(luò)設(shè)備的連接,形成高效率無縫數(shù)據(jù)的傳輸系統(tǒng),能夠更為有效地將物聯(lián)網(wǎng)感知層所收集到的數(shù)據(jù)經(jīng)由網(wǎng)絡(luò)傳輸?shù)綌?shù)據(jù)處理中心,由此實(shí)現(xiàn)全方位的互通互聯(lián)目標(biāo)。就其實(shí)際工作內(nèi)容來分析,所指向的是將多種屬性的監(jiān)測處理設(shè)備進(jìn)行聯(lián)網(wǎng),實(shí)現(xiàn)傳輸功效,對各設(shè)備與節(jié)點(diǎn)之間的數(shù)據(jù)信息進(jìn)行傳播。
。矗硵(shù)據(jù)層
數(shù)據(jù)層是物聯(lián)網(wǎng)云計(jì)算平臺中數(shù)據(jù)挖掘技術(shù)的核心環(huán)節(jié),物聯(lián)網(wǎng)自身具有一定的異構(gòu)性與海量性特點(diǎn),由此在數(shù)據(jù)層內(nèi)將物聯(lián)網(wǎng)設(shè)備所收集到的所有數(shù)據(jù)信息進(jìn)項(xiàng)儲存處理與分析的能力是基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘平臺的重點(diǎn)。數(shù)據(jù)層內(nèi)部涵蓋了數(shù)據(jù)源轉(zhuǎn)化與存儲兩個(gè)主要部分,其中數(shù)據(jù)源轉(zhuǎn)化所指的是對物聯(lián)網(wǎng)異構(gòu)性的數(shù)據(jù)化進(jìn)行轉(zhuǎn)化,存儲方面所指向的是應(yīng)用Hadoop所構(gòu)建的平臺中HDFS系統(tǒng)進(jìn)行分布式存儲,由此將物聯(lián)網(wǎng)中大量的數(shù)據(jù)能夠可靠的存儲在各個(gè)數(shù)據(jù)節(jié)點(diǎn)中。在物聯(lián)網(wǎng)平臺內(nèi)部,針對不同的目標(biāo)需要收集不同的數(shù)據(jù)類型對其進(jìn)行顯示,在特定環(huán)境下,同一種目標(biāo)同樣會選擇不同的數(shù)據(jù)類型進(jìn)行表現(xiàn),基于此數(shù)據(jù)源轉(zhuǎn)化的作用主要為表現(xiàn)保持?jǐn)?shù)據(jù)的完整性,同時(shí)避免異構(gòu)性的物聯(lián)網(wǎng)數(shù)據(jù)在轉(zhuǎn)化中基于其他不確定因素有所損壞,由此實(shí)現(xiàn)確保數(shù)據(jù)挖掘可靠性的目的。數(shù)據(jù)源轉(zhuǎn)化在整個(gè)系統(tǒng)中的價(jià)值主要是作為數(shù)據(jù)層與感知層之間的連接線角色存在,經(jīng)由數(shù)據(jù)包的解碼與轉(zhuǎn)換將不同屬性的數(shù)據(jù)轉(zhuǎn)換為所需要的數(shù)據(jù)類型,同時(shí)將其以分布式手段存儲在數(shù)據(jù)處理中心。
。矗磾(shù)據(jù)挖掘服務(wù)層
數(shù)據(jù)挖掘服務(wù)層內(nèi)部涵蓋數(shù)據(jù)準(zhǔn)備模塊、數(shù)據(jù)挖掘引擎模塊、用戶模塊幾個(gè)部分。其中數(shù)據(jù)準(zhǔn)備模塊中涵蓋著對數(shù)據(jù)的情況、轉(zhuǎn)變、數(shù)據(jù)規(guī)等環(huán)節(jié);數(shù)據(jù)挖掘引擎模塊中涵蓋著數(shù)據(jù)挖掘算法集、模式評估等環(huán)節(jié);用戶模塊中涵蓋著數(shù)據(jù)挖掘知識的可視化展現(xiàn)技術(shù)。基于知識挖掘類型的差異性,數(shù)據(jù)挖掘引擎模塊具備了區(qū)分、關(guān)聯(lián)、聚類、趨勢分析、偏差分析、類似性分析等特征。而提供以上所述的功能核心環(huán)節(jié)為數(shù)據(jù)挖掘模塊中的算法集所具備的多種功能算法,在Hadoop平臺中數(shù)據(jù)挖掘算法需要對傳統(tǒng)所應(yīng)用的數(shù)據(jù)挖掘算法進(jìn)行一定程度的調(diào)整,也就是實(shí)現(xiàn)算法并行化的處理。用戶模塊是應(yīng)用物聯(lián)網(wǎng)數(shù)據(jù)挖掘平臺用戶的直接接觸端,基于其擔(dān)負(fù)著將系統(tǒng)顯示轉(zhuǎn)化為用戶可識別顯示的重要責(zé)任,需要具備一定的友好性,也就是一定的人性化,使用戶能夠便捷的應(yīng)用用戶界面進(jìn)行操作,實(shí)現(xiàn)數(shù)據(jù)挖掘的目的,同時(shí)也能夠獲取到能夠理解的知識。為提升數(shù)據(jù)挖掘平臺的可移植性,在用戶服務(wù)底層模塊加入了一個(gè)開放接口模塊,由此能夠使得第三方調(diào)用物聯(lián)網(wǎng)數(shù)據(jù)挖掘平臺的功能,使物聯(lián)網(wǎng)具備更為豐富的應(yīng)用,同時(shí)提升其實(shí)際應(yīng)用價(jià)值。
5、結(jié)論
云計(jì)算與物聯(lián)網(wǎng)均屬于信息化社會的先進(jìn)產(chǎn)物,是社會發(fā)展的一大表現(xiàn),物聯(lián)網(wǎng)引起自身的多種優(yōu)勢被廣泛地應(yīng)用在社會各個(gè)領(lǐng)域中。但是,當(dāng)前物聯(lián)網(wǎng)在我國發(fā)展進(jìn)程較為緩慢,主要是由于物聯(lián)網(wǎng)的建設(shè)需要應(yīng)用到多種技術(shù),而技術(shù)建設(shè)始終是一個(gè)難題,為此,在本文中對基于云計(jì)算平臺的物聯(lián)網(wǎng)數(shù)據(jù)挖掘技術(shù)應(yīng)用與實(shí)現(xiàn)效果進(jìn)行了全面分析,為進(jìn)一步推動基于云計(jì)算基礎(chǔ)物聯(lián)網(wǎng)的建設(shè)提供理論參考。
參考文獻(xiàn):
。郏保輳埢ⅲ谠朴(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式的構(gòu)建[J].無線互聯(lián)科技,2016,2(20):50-51.
。郏玻蓐愡_(dá)峰.基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[J].中國新技術(shù)新產(chǎn)品,2014,5(23):20.
[3]李立,張玉州,江克勤.一種改進(jìn)的基于云平臺的物聯(lián)網(wǎng)數(shù)據(jù)挖掘算法[J].安慶師范學(xué)院學(xué)報(bào):自然科學(xué)版,2014,7(2):37-40.
。郏矗堇钫芮,周毅.基于云計(jì)算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式的構(gòu)建[J].信息與電腦,2013,1(6):122-123.
。郏担萸赜啦ǎ悧盍郑谠破脚_的物聯(lián)網(wǎng)數(shù)據(jù)挖掘算法的能量分析[J].成都信息工程學(xué)院學(xué)報(bào),2010,9(6):569-572.
【物聯(lián)網(wǎng)數(shù)據(jù)挖掘研究論文】相關(guān)文章:
數(shù)據(jù)挖掘論文04-29
物聯(lián)網(wǎng)應(yīng)用論文09-14
飛機(jī)實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)挖掘方法研究04-27
數(shù)據(jù)挖掘04-29
工程教育下物聯(lián)網(wǎng)專業(yè)實(shí)踐教學(xué)研究論文04-30
淺談數(shù)據(jù)挖掘05-02
數(shù)據(jù)挖掘技術(shù)在遼河水文預(yù)報(bào)中的研究04-30