淺談網(wǎng)絡(luò )傳播的大數據發(fā)展論文
摘要:隨著(zhù)計算機的普及,依托于計算機的網(wǎng)絡(luò )傳播成為了主要的信息傳播途徑,與此同時(shí),大數據也開(kāi)始發(fā)展,開(kāi)始急速的衍生和擴散,甚至可以說(shuō)大數據下的計算機網(wǎng)絡(luò )已經(jīng)成為帶動(dòng)國民經(jīng)濟發(fā)展的主體。但大數據應該如何理解、網(wǎng)絡(luò )傳播下大數據又將如何發(fā)展已成為新的研究趨勢。
關(guān)鍵詞:網(wǎng)絡(luò )傳播;大數據技術(shù);大數據應用
一、網(wǎng)絡(luò )傳播下的大數據的誕生
自2005年Hadoop項目誕生,大數據就進(jìn)入了人們的視野當中。大數據無(wú)疑是在網(wǎng)絡(luò )傳播的基礎上進(jìn)一步衍生出來(lái)的“新產(chǎn)品”,想要系統的認知大數據,就必須要全面而細致的分解它,應著(zhù)手從三個(gè)層面來(lái)展開(kāi):第一層面是理論,理論是認知的必經(jīng)途徑,也是被廣泛認同和傳播的基線(xiàn)。在這里從大數據的定義、特征、問(wèn)題等方面進(jìn)行剖析。第二層面是技術(shù),技術(shù)是大數據價(jià)值體現的手段和前進(jìn)的基石。這部分主要是從大數據的開(kāi)源、存儲、分析和展示技術(shù)進(jìn)行詳盡的分析。第三層面是實(shí)踐,實(shí)踐是大數據的最終價(jià)值體現。大數據目前已被廣泛采用到生活當中,此部分主要分析網(wǎng)絡(luò )中的大數據應用。
二、網(wǎng)絡(luò )傳播下的大數據的理論分析
。ㄒ唬┐髷祿拍罴疤攸c(diǎn)
“大數據”的概念最早由維克托邁爾舍恩伯格和肯尼斯庫克耶在編寫(xiě)《大數據時(shí)代》中提出,又稱(chēng)為巨量資料,指需要新處理模式才具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長(cháng)率和多樣化的信息資產(chǎn)。[1]在網(wǎng)絡(luò )傳播時(shí)代下,大數據主要呈現了以下四方面的特點(diǎn):1.數據體量巨大(Volume)。當前,典型個(gè)人計算機硬盤(pán)的容量為T(mén)B量級,而一些大企業(yè)的數據量已經(jīng)接近EB量級。[2]2.數據類(lèi)型繁多(Variety)。數據也分為結構化數據和非結構化數據。結構化的數據即以文字呈現的數據結構,非結構化的數據則包括網(wǎng)絡(luò )日志、音頻、視頻、圖片、地理位置信息等類(lèi)型。3.價(jià)值密度低(Value)。海量數據并不能充足證明其重要性,換句話(huà)說(shuō)就是,數據多并不代表價(jià)值高。4.處理速度快(Velocity)。這是大數據區分于傳統數據挖掘的最顯著(zhù)特征。
。ǘ┐髷祿畣(wèn)題所在
大數據、網(wǎng)絡(luò )傳播看似是一種簡(jiǎn)單的依附與被依附的關(guān)系,二者相互依存、相互發(fā)展,但隨著(zhù)這種關(guān)系的不斷行進(jìn)和演化,一些問(wèn)題也開(kāi)始顯露。1.表面化。盡管大數據能夠非常好地檢測相關(guān)性,但是它并不會(huì )告訴我們相關(guān)性是如何得出的、得出的合理性以及哪一種相關(guān)性是有意義的。2.輔助化。盡管大數據搜集的數據是龐大的,有一定的事實(shí)證明比例,其可以輔助科學(xué)調查,但不可能成功地被完全代替。3.理想化。如今的大數據為世人展現的都是其不可估量的大好前途,但大數據的數據缺失、情況偶然、不準確數據不斷地被循環(huán)利用導致了更多問(wèn)題的出現,會(huì )引發(fā)更多的以偏概全,會(huì )導致思維的引向,甚至結論的錯誤。
三、網(wǎng)絡(luò )傳播下大數據技術(shù)的分析
。ㄒ唬╅_(kāi)源框架
HadoopHDFS,即HadoopFileSystem,是一款典型的開(kāi)源文件系統,其主要面向大文件的文件系統,是分布式數據庫的基礎。在文件存取方面,HDFS用NameNode存放文件位置信息,用DataNode存放文件數據。[3]當HDFS中存入大量的`數據后,需要借助MapReduce完成工作分析。之后再從統計維度列出角度對統計值列出的數據進(jìn)行排序,最后通過(guò)聚合完成統計維度數據項的計算工作。
。ǘ┐髷祿鎯夹g(shù)
目前數據存儲技術(shù)主要包括以下兩種存儲技術(shù):1.分布式集群存儲技術(shù)。分布式集群存儲技術(shù)通常以大數據塊為單位,將數據切割存儲在多個(gè)節點(diǎn),為保證數據的可靠性,需要在不同的存儲節點(diǎn)中保存多個(gè)數據副本。在分布式數據庫設計時(shí),可以根據應用的特點(diǎn),采用分別處理增加、刪除、修改、查詢(xún)操作的方式進(jìn)行架構設計,既要保證事務(wù)操作的一致性,又要滿(mǎn)足海量數據存取的性能要求。2.關(guān)系型數據庫存儲技術(shù)。關(guān)系型數據庫的操作語(yǔ)言是結構化的查詢(xún)語(yǔ)言,包括數據定義語(yǔ)言和數據操作語(yǔ)言?xún)刹糠。DDL完成了數據對象和操作過(guò)程的定義,包括數據表、視圖、存儲過(guò)程、觸發(fā)器、主鍵、外鍵、索引、區分等,DML則完成了數據的操作功能,包括增加、刪除、修改、查詢(xún),也就是人們經(jīng)常聽(tīng)到的數據。
。ㄈ┐髷祿治黾夹g(shù)
對大數據進(jìn)行建模的目的是便于對數據進(jìn)行分析和利用,即對數據進(jìn)行多次ETL,經(jīng)過(guò)多次ETL之后的數據會(huì )變得越來(lái)越容易理解、使用和個(gè)性化,使得分析結果滿(mǎn)足特殊崗位甚至單個(gè)特定人的需求。
四、網(wǎng)絡(luò )傳播下的大數據應用
實(shí)踐是檢驗真理的唯一標準,大數據服務(wù)能否幫助企業(yè)取得成功,還需要在行業(yè)應用實(shí)踐中得到答案。
。ㄒ唬┐髷祿谏缃痪W(wǎng)絡(luò )領(lǐng)域的應用
1.SNS業(yè)務(wù)應用介紹。SNS體現了Web對于人類(lèi)社會(huì )需求的滿(mǎn)足,人們通過(guò)Web應用滿(mǎn)足了不同的心理需求。SNS不同于支持組織互動(dòng)和業(yè)務(wù)流程的傳統應用,其主要實(shí)現了人與人以及由人創(chuàng )建內容之間的協(xié)同與共享。2.大數據技術(shù)與SNS應用。不同的社交網(wǎng)絡(luò )應用的特點(diǎn)也是不同的,除了微博的熱點(diǎn)話(huà)題,商務(wù)人士在SNS上形成的社會(huì )關(guān)系以及留下的溝通、評論等記錄,用戶(hù)的通信行為也是反映擁護社會(huì )關(guān)系的重要數據基礎。
。ǘ┐髷祿陔娮由虅(wù)領(lǐng)域的應用
大數據對電子商務(wù)的主要作用是發(fā)現用戶(hù)行為,然后有針對性地為用戶(hù)提供產(chǎn)品和服務(wù)。大數據可以反映世界萬(wàn)事萬(wàn)物之間的聯(lián)系,對于當今的網(wǎng)絡(luò )十分重要。但如何利用大數據?大數據如何管理網(wǎng)絡(luò )的業(yè)務(wù)活動(dòng)?種種疑問(wèn)到目前為止還只是簡(jiǎn)單的分析描述,希望今后能夠有更多的仁人志士投身于大數據,挖掘其更大更廣的價(jià)值,造福于人類(lèi)和社會(huì )。
參考文獻:
。1]李金.快速充電站[J].人民公交,2016(3):108-109.
。2]王春研.大數據與計算機信息處理技術(shù)[J].黑龍江科技信息,2016(3):156.
。3]王魯俊,龍翔,吳興博,王雷.SFFS:低延遲的面向小文件的分布式文件系統[J].計算機科學(xué)與探索,2014(4):438-445..
【淺談網(wǎng)絡(luò )傳播的大數據發(fā)展論文】相關(guān)文章:
淺談網(wǎng)絡(luò )詩(shī)歌的傳播12-02
淺談手機傳播特性論文02-26
淺談網(wǎng)絡(luò )的發(fā)展作文08-04
探討網(wǎng)絡(luò )與數據通信的應用及發(fā)展論文05-30
淺談媒體傳播格局變化論文05-16