大數據自動(dòng)分析與數據挖掘探討的論文
近些年來(lái),信息科技和網(wǎng)絡(luò )的通信技術(shù)已經(jīng)得到了飛速的發(fā)展,并且全國的信息基礎設施也得到了完善,在全球的數據已經(jīng)呈現出了極速增長(cháng)的模式狀態(tài)。在此種情況下,傳統的數據處理方式已經(jīng)滿(mǎn)足不了現代化的處理需求,因此需要利用大數據的自動(dòng)分析和數據挖掘來(lái)實(shí)現對數據的有效分享和利用。大數據科學(xué)已經(jīng)成為了一個(gè)橫跨信息科學(xué)、社會(huì )科學(xué)以及網(wǎng)絡(luò )科學(xué)的新型交叉學(xué)科,受到了學(xué)術(shù)界的廣泛關(guān)注。
一、遙感大數據的概述以及特征
在現代社會(huì )當中,遙感大數據已經(jīng)成為了大數據的重要代表,成為了科學(xué)研究方面的重點(diǎn)研究方面,但是在現階段當中還需要對其科學(xué)理論和方式進(jìn)行不斷的深入研究。遙感大數據具有大數據的特征,并且也具有自身獨特的特征。在外部特征方面,首先具有海量的特征。遙感大數據的數據具有海量的特點(diǎn),并且對著(zhù)遙感技術(shù)的不斷發(fā)展,在現階段當中的高分辨率和高動(dòng)態(tài)的新型衛星傳感器在單位時(shí)間之內可以捕獲到更多的數據量;其次還具有數據異構的特點(diǎn),也就是說(shuō)在數據生產(chǎn)過(guò)程當中所依賴(lài)到的業(yè)務(wù)系統之間會(huì )呈現出的不同狀態(tài),都需要由不同的數據中心來(lái)進(jìn)行提供的,并且在邏輯結構或者組織方式上也呈現出了不同的特點(diǎn);另外,還具有數據多源的特點(diǎn),集中體現在數據的來(lái)源和捕獲信息的手段方面,是可以擁有多種獲取形式的,包括全球的觀(guān)察網(wǎng)絡(luò )點(diǎn)接收到的實(shí)時(shí)信息,以及民眾手中的用戶(hù)端的個(gè)性化信息。在內部特征方面,首先具有高維度性的特點(diǎn),遙感大數據的數據類(lèi)型呈現出了多樣化的特點(diǎn),因此數據當中的維度也變得越來(lái)越高,集中體現在了空間維度、時(shí)間維度以及光譜維度等。其次還具有多尺度性的特點(diǎn),成為了遙感大數據的重要特點(diǎn),也就是說(shuō)在進(jìn)行數據的獲取過(guò)程當中,可以根據不同的遙感技術(shù)和相對應的技術(shù)水平,來(lái)進(jìn)行有效的劃分,在空間和時(shí)間上呈現出多尺度的特點(diǎn)。另外,還具有非平穩性的特點(diǎn),由于遙感大數據廣泛的獲取方式和物理意義,在信息理論的角度上來(lái)說(shuō),就屬于典型的非平穩信號,呈現出分布參數或者規律隨時(shí)發(fā)生變化的特點(diǎn)。
二、遙感大數據的自動(dòng)分析和數據挖掘
2.1自動(dòng)分析。首先,需要對遙感大數據的表達進(jìn)行了解,在這個(gè)過(guò)程當中需要抽取多元化的特征來(lái)進(jìn)行表示,從而建立起遙感大數據的目標一體化,在研究過(guò)程當中主要包括對遙感大數據的`多元離散特征的有效提取,形成在不同的傳感器當中的提取方式和方法。還要對若干大數據的多元特征進(jìn)行歸一化的表達,從而提升對大數據的處理能力和處理效率。其次就需要對遙感大數據進(jìn)行相關(guān)的檢索,在檢索過(guò)程當中,需要利用網(wǎng)絡(luò )化和集成化的方式進(jìn)行檢索,制定出基礎設施的計劃,提升對其數據的訪(fǎng)問(wèn)和檢索效率。并且針對海量的遙感大數據來(lái)會(huì )說(shuō),需要檢索出符合用戶(hù)需求和感興趣的內容和數據,就需要對數據內容進(jìn)行比對,從而判斷出用戶(hù)所需要的內容,從大量的數據當中進(jìn)行快速的檢索到目標。在檢索的過(guò)程當中,發(fā)展知識驅動(dòng)的遙感大數據的檢索方式是最有效的方式之一,可以分為場(chǎng)景檢索服務(wù)、多源海量復雜場(chǎng)景數據的智能檢索以及信息數據的檢索等。另外,就是對遙感大數據的理解的,通過(guò)遙感大數據的科學(xué),可以實(shí)現數據向知識的有效轉變,在這個(gè)過(guò)程當中就需要根據遙感大數據本身的特征和數據檢索的方式來(lái)對數據內容實(shí)現有效的提取。最后就是遙感大數據云的技術(shù),可以將各種方式的遙感信息資源進(jìn)行有效的整合,建立起遙感云服務(wù)的相關(guān)新型業(yè)務(wù)應用和服務(wù)模式,可以將在天空當中的傳感器所捕捉到的信息通過(guò)軟件的計算和整合來(lái)實(shí)現數據資源的有效存儲和處理,從而使得用戶(hù)可以在很快的時(shí)間之內獲取到有效的服務(wù)。
2.2數據挖掘。首先需要對遙感大數據的數據挖掘過(guò)程進(jìn)行了解,包括數據的獲取、存儲以及處理和整合等,在整個(gè)過(guò)程當中都具有大數據的特點(diǎn)。在進(jìn)行捕獲數據的過(guò)程當中可以從各種不同的傳感器當中進(jìn)行獲取,然后對數據進(jìn)行采樣和過(guò)濾,之后就可以對采集到的數據進(jìn)行處理和分析,最后將其數據用可視化的模式進(jìn)行顯示,方便了客戶(hù)的使用和利用。其次,就是遙感大數據和廣義的遙感大數據的綜合挖掘的過(guò)程,利用此種方式,一方面可以與其他的數據方式形成良好的互補關(guān)系,另外一方面也可以對其數據當中的變化規律以及其他信息進(jìn)行更好的挖掘和采集。在廣義的遙感時(shí)空大數據當中,存儲的費用是相當昂貴的,并且在數據的分析能力方面也存在嚴重不足的現象,因此在現代社會(huì )的智慧城市的建設過(guò)程當中發(fā)揮不了其巨大的作用,因此需要利用其他自動(dòng)化的數據智能處理和挖掘的方式來(lái)對其空間地理分布的數據進(jìn)行全新的挖掘和過(guò)濾。在時(shí)空分布的視頻數據挖掘過(guò)程當中,在對智能數據進(jìn)行處理和信息提取的同時(shí),還要通過(guò)時(shí)空當中所分布的視頻數據進(jìn)行自動(dòng)化的區分,來(lái)有效的區分正常和非正常的狀態(tài)。在對時(shí)空數據的挖掘過(guò)程當中,主要可以從時(shí)空數據當中進(jìn)行提取出隱藏的有用的信息知識,利用各種綜合性的方式和方法,比如統計法、聚類(lèi)法、歸納法以及云理論等。在遙感大數據的挖掘應用方面,可以適用于地球各種尺度和方位的變化,還可以在很大程度上對未知的信息進(jìn)行良好的篩選和挖掘,推動(dòng)國家的科學(xué)技術(shù)的發(fā)展,實(shí)現社會(huì )的可持續化發(fā)展。
綜上所述,在不斷的發(fā)展過(guò)程當中,我國的遙感數據的種類(lèi)和數量將呈現出飛速增長(cháng)的模式,在很多方面以及領(lǐng)域當中已經(jīng)開(kāi)展了遙感大數據的研究工作。值得注意的是,現階段當中需要將遙感大數據的理論知識進(jìn)行實(shí)踐化的轉變,從而實(shí)現遙感大數據的自動(dòng)分析和數據挖掘功能,推動(dòng)科學(xué)信息的不斷進(jìn)步。
參考文獻
[1]宋維靜,劉鵬,王力哲,等.遙感大數據的智能處理:現狀與挑戰[J].工程研究-跨學(xué)科視野中的工程,2014,(3):259-265.
【大數據自動(dòng)分析與數據挖掘探討的論文】相關(guān)文章:
《數據的分段整理》數學(xué)說(shuō)課稿06-29
《數據的分段整理》的數學(xué)教學(xué)反思07-14
《數據收集整理》教學(xué)設計11-04
《表格數據圖形化》說(shuō)課稿11-20