淺析基于云計算的分布式數據挖掘系統設計與實(shí)現論文
隨著(zhù)網(wǎng)絡(luò )大數據信息處理技術(shù)的發(fā)展,對數據處理的規模不斷增大,對數據信息處理的精度要求不斷提升,采用云計算進(jìn)行數據分布式網(wǎng)格計算,能提高數據的并行處理和調度性能,根本上提高數據的計算速度,因此,云計算成為未來(lái)大數據信息處理的主要趨勢。在云計算環(huán)境下進(jìn)行數據挖掘,是進(jìn)行大數據信息特征提取和數據開(kāi)采的基本技術(shù),相關(guān)的算法研究受到人們的重視。文獻采用云計算環(huán)境下分布式數據模糊C均值聚類(lèi)的挖掘算法,在受到較強的毗連特征干擾時(shí),數據挖掘的精度不高。針對上述問(wèn)題,本文提出一種基于分布式自適應特征調度和高階累積量后置聚焦的數據挖掘算法,并進(jìn)行了仿真實(shí)驗性能分析,得出了較好的數據挖掘效果的結論。
1 基于云計算的分布式數據挖掘算法設計
為了實(shí)現對基于云計算的分布式數據挖掘系統設計,其中,數據挖掘算法設計是關(guān)鍵,本文提出一種基于分布式自適應特征調度和高階累積量后置聚焦的數據挖掘算法,假設數據信息流為,數據信息流通過(guò)噪聲濾波,得到數據流聚類(lèi)相似性函數表示為,其是一組準平穩隨機的時(shí)間序列,對數據庫中的存儲信息流進(jìn)行能量譜密度特征提取,得到輸出數據x(t) 的第n 個(gè)寬頻帶分量,分布式自適應特征調度模型表示為:基于二元假設模型,構建數據庫存儲結構的.檢驗統計量,通過(guò)經(jīng)驗模態(tài)分解執行數據庫存儲結構的區域的自適應篩選和更新,得到:云計算環(huán)境下分布式數據的數據挖掘的本體結構為一個(gè)五元組,其中,C 為云計算環(huán)境下分布式數據的概念集,I 是云計算環(huán)境下分布式數據的字符串實(shí)例集,通過(guò)四階累積量切片進(jìn)行數據庫存儲結構的特征壓縮處理,降低存儲的特征維數和數據冗余,結合高階累積量后置聚焦,得到數據挖掘輸出特征的四階累積量切片:式中,表示存儲空間的頻譜特征伸縮尺度,可見(jiàn),采用高階累積量后置聚焦,有效提高了數據的精度。
2 嵌入式Linux的內核下數據挖掘系統設計描述
在上述進(jìn)行了算法設計的基礎上,進(jìn)行數據挖掘系統的軟件開(kāi)發(fā)設計,基于云計算的分布式數據挖掘系統總體模型中,采用ST 超低功耗 ARM CortexTM-M0 微控制器,系統建立在嵌入式Linux 的內核平臺上,系統包括程序加載模塊、數據存儲模塊、數據緩存調度模塊和數據通信傳輸模塊等,通過(guò)配置CAN_IMASK 寄存器,采用LabWindows/CVI 進(jìn)行數據遠程控制和信息通信,基于云計算的分布式數據挖掘系統給用戶(hù)提供一個(gè)簡(jiǎn)單、統一的系統調用接口,系統可配置4 路組聯(lián)合Cache,基于云計算的分布式數據挖掘系統的寄存器系統時(shí)鐘120 MHz。嵌入式Linux 的內核下數據挖掘系統通過(guò)VISA 軟件接口發(fā)送Flash 設備上的文件系統內核到HP E1562D/ESCSI 數據硬盤(pán)進(jìn)行數據存儲,調用s3c2440_adc_read() 函數,進(jìn)行程序加載和基于云計算的分布式數據挖掘系統的嵌入式控制,使用Qt/Embedded 作為GUI,利用開(kāi)源Linux 操作系統的豐富網(wǎng)絡(luò )資源,實(shí)現數據挖掘系統的遠程通信信息傳輸和控制。
3 仿真實(shí)驗
為了測試本文設計的基于云計算的分布式數據挖掘系統在實(shí)現數據挖掘中的優(yōu)越性能,進(jìn)行仿真實(shí)驗,分布式數據信息采樣的時(shí)寬為10 ms, 分布式數據的隨機采樣率為KHz,調控因子λ=0.25。根據上述仿真環(huán)境和參數設定,進(jìn)行基于云計算的分布式數據挖掘系統的數據挖掘和處理性能分析,首先進(jìn)行數據挖掘的輸出時(shí)域波形采樣,結果可見(jiàn),采用本文算法進(jìn)行數據挖掘的準確度較高,為了對比性能,采用本文方法和傳統方法,以數據挖掘的準確配準性為測試指標,得到對比結果。實(shí)驗結果表明,采用該方法進(jìn)行基于云計算的分布式數據挖掘,數據挖掘的準確配準性能較好,系統的可靠性較好。
4 結束語(yǔ)
本文提出一種基于分布式自適應特征調度和高階累積量后置聚焦的數據挖掘算法,并進(jìn)行了實(shí)驗分析。結果表明,采用該方法進(jìn)行數據挖掘,數據挖掘的準確配準性能較好,系統的可靠性較好,具有較好的應用價(jià)值。
【淺析基于云計算的分布式數據挖掘系統設計與實(shí)現論文】相關(guān)文章:
淺析基于云計算的網(wǎng)絡(luò )營(yíng)銷(xiāo)系統構建論文11-08
基于云計算技術(shù)的虛擬實(shí)訓室設計與實(shí)現論文11-14