成人免费看黄网站无遮挡,caowo999,se94se欧美综合色,a级精品九九九大片免费看,欧美首页,波多野结衣一二三级,日韩亚洲欧美综合

跨媒體技術(shù)的發(fā)展和挑戰論文

時(shí)間:2021-02-08 11:58:48 論文 我要投稿

跨媒體技術(shù)的發(fā)展和挑戰論文

  隨著(zhù)移動(dòng)智能終端設備的廣泛應用和普及,大量的視頻、音頻、文本以及各種傳感數據構成了目前移動(dòng)互聯(lián)網(wǎng)領(lǐng)域中信息共享的主體內容。移動(dòng)化帶來(lái)的改變是信息的激增,人們正在借助移動(dòng)智能終端上的各種傳感器———時(shí)間、位置、麥克風(fēng)、攝像頭、溫度傳感和NFC(近場(chǎng)通訊)采集信息并重新繪制這個(gè)世界。然而,信息的爆炸式增長(cháng)給知識的獲取帶來(lái)了極大的難度,也因此造成了知識的相對匱乏。在此過(guò)程中,用戶(hù)對信息的采集和分享與傳統方式有著(zhù)顯著(zhù)的不同:首先,信息的采集帶有顯著(zhù)的時(shí)間特征和空間特征;其次,在數據分享過(guò)程中攜帶了用戶(hù)偏好信息;最后,完整分享這些數據對網(wǎng)絡(luò )帶寬和數據存儲服務(wù)提出了巨大的挑戰。目前,人們從移動(dòng)互聯(lián)網(wǎng)領(lǐng)域獲得知識的渠道主要還依賴(lài)于信息搜索,一種是以百度和谷歌為代表的傳統文本搜索的服務(wù),另一種是以蘋(píng)果的Siri為代表的新型跨媒體(聲音和文本)移動(dòng)搜索體驗。

跨媒體技術(shù)的發(fā)展和挑戰論文

  跨媒體技術(shù)發(fā)展現狀

  目前,為了實(shí)現同時(shí)對多種媒體類(lèi)型的信息檢索,國內外學(xué)者的研究工作主要集中在以下幾個(gè)領(lǐng)域:1)基于“詞袋”模型建立多媒體對象知識庫此類(lèi)方法大多通過(guò)對多媒體對象的語(yǔ)義信息進(jìn)行人工標注得到先驗知識,結合“詞袋”模型等為海量多媒體信息建立知識庫,從而借助知識庫的橋梁作用實(shí)現跨媒體檢索。顯然,此種方法很大程度上還是一種變相的基于關(guān)鍵字的檢索,需要人工標注大量的關(guān)鍵字訓練樣本集,雖然它在一定程度上避開(kāi)了特征向量異構和語(yǔ)義鴻溝的問(wèn)題,但是人工標注耗時(shí)耗力且缺乏統一性與客觀(guān)性,多媒體對象的語(yǔ)義信息往往不能夠得到恰當描述,因而檢索的準確性往往不盡如人意。2)基于文檔鏈接關(guān)系或Web鏈接關(guān)系建立多媒體對象之間的語(yǔ)義關(guān)系。此類(lèi)方法通過(guò)分析多媒體文檔之間的鏈接關(guān)系或者Web網(wǎng)頁(yè)中的鏈接跳轉關(guān)系建立多媒體對象之間的語(yǔ)義關(guān)系網(wǎng)(跨媒體關(guān)聯(lián)圖、交叉參照圖模型等)從而實(shí)現多媒體對象之間的相互檢索。該方法有效地避免了媒體對象之間的語(yǔ)義鴻溝,但是對鏈接關(guān)系的依賴(lài)性太強,不具有一般性。3)建立輔助空間解決特征向量異構問(wèn)題。此類(lèi)方法為解決不同類(lèi)型媒體對象之間特征向量異構的問(wèn)題,在計算特征向量和相似性的度量時(shí),一些方法是基于數據集中所有數據間的距離度量的,但是在實(shí)際跨媒體數據集中:一方面,計算和存儲所有對象間的距離尺度是不現實(shí)的;另一方面,距離度量不能有效解決現實(shí)生活中的問(wèn)題。因此,一些學(xué)者提出采用典型相關(guān)性分析(CCA)、主成分分析(PCA)、獨立成分分析(ICA)等技術(shù)對特征向量進(jìn)行降維處理,使得異構的特征向量在一個(gè)輔助空間中具有可比性,從而進(jìn)行多媒體對象之間的相似性度量。此種方法往往在對特征向量進(jìn)行降維處理的過(guò)程中產(chǎn)生“維度災難”。4)基于機器學(xué)習、神經(jīng)網(wǎng)絡(luò )等方法獲取多媒體對象間的語(yǔ)義關(guān)系。此類(lèi)方法主要是通過(guò)機器學(xué)習或神經(jīng)網(wǎng)絡(luò )領(lǐng)域的融合分析、流形學(xué)習、線(xiàn)性迭代與映射、概率模型、支持向量機、監督分類(lèi)、非監督分類(lèi)等方式對異構數據之間的關(guān)聯(lián)關(guān)系進(jìn)行挖掘,進(jìn)而實(shí)現不同模態(tài)多媒體數據之間的相互檢索?偟恼f(shuō)來(lái),該類(lèi)方法檢索效果不錯,但往往計算量比較大,實(shí)現過(guò)程比較復雜。5)索引。此類(lèi)方法一般是通過(guò)對多媒體數據進(jìn)行一定預處理得到相互之間的相似關(guān)系,進(jìn)而根據相似關(guān)系為海量多媒體對象建立索引,以提高檢索時(shí)的效率。這是一種輔助型的方法,更多的是關(guān)注如何有效地減少檢索所需要的時(shí)間,提高跨媒體檢索的效率,對多媒體對象之間的相似度度量未關(guān)注。6)基于Ontology的檢索。此類(lèi)方法是建立在基于內容檢索的基礎上,用Ontology存儲多媒體對象語(yǔ)義信息的新型檢索模式。檢索過(guò)程中結合多媒體對象的底層特征與On-tology表達的語(yǔ)義信息進(jìn)行跨媒體檢索。該方法對多媒體對象的語(yǔ)義信息及空間關(guān)系表達與處理具有強大的優(yōu)勢,同時(shí),Ontology模型能使檢索系統更加智能化與人性化。然而,現有的跨媒體信息檢索技術(shù)的研究對象主要是已采集好的各種媒體數據,較少考慮多用戶(hù)分享中的數據冗余、網(wǎng)絡(luò )帶寬約束等移動(dòng)互聯(lián)網(wǎng)環(huán)境下面臨的新問(wèn)題和挑戰。

  用戶(hù)標注和地理本體在跨媒體中的應用

  移動(dòng)終端能夠幫助人們以各種方式記錄現實(shí)世界,同時(shí)也造成了數據的異構性、語(yǔ)義的異質(zhì)性以及存儲、傳輸這些數據對網(wǎng)絡(luò )和硬件的挑戰。隨著(zhù)智能終端處理能力的不斷加強,目前已可以實(shí)現在智能終端上對采集的圖像和影音數據進(jìn)行編輯和特征提取。采用本地提取特征再進(jìn)行網(wǎng)絡(luò )分享的方法將大大降低網(wǎng)絡(luò )帶寬的使用。另一方面,由于不同用戶(hù)在對相同內容進(jìn)行記錄時(shí)可以選擇不同的媒體類(lèi)型作為載體,上傳并分享這些內容特別是影音圖像資源會(huì )占用較多的服務(wù)器存儲空間。因此,提取資源中的語(yǔ)義信息并通過(guò)簡(jiǎn)單推理進(jìn)行信息聚合,能夠較好地降低移動(dòng)互聯(lián)網(wǎng)環(huán)境下信息分享的數據冗余問(wèn)題。本體論作為語(yǔ)義模型的新方法,主要用于知識的共享、交互和重用方面,它具有良好的概念層次結構和邏輯推理。通過(guò)對領(lǐng)域知識的理解、描述和推理,能夠更好地實(shí)現信息共享和重用的目的。當運用到信息檢索領(lǐng)域時(shí),具有以下4個(gè)優(yōu)點(diǎn)[3]:(1)本體關(guān)于領(lǐng)域知識的共同理解和描述可以使得現代網(wǎng)絡(luò )中的信息組織形式從傳統的基于語(yǔ)法逐步轉向基于語(yǔ)義;(2)本體對于概念及其之間關(guān)系的精確描述可以極大地提高信息檢索時(shí)的查全率和查準率;(3)采用形式化的描述方式使其能被計算機所理解以及更好地滿(mǎn)足海量網(wǎng)絡(luò )信息組織的需要;(4)本體能夠很好地支持邏輯推理,使得信息檢索系統更加智能化和人性化。地理本體是將本體論引入到地理信息科學(xué)中,它除了具有本體所具有的優(yōu)點(diǎn)外,在處理對象空間位置及空間關(guān)系方面具有無(wú)法取代的獨特優(yōu)勢。隨著(zhù)以Web2.0技術(shù)為代表的社交網(wǎng)絡(luò )的發(fā)展,用戶(hù)的需求從簡(jiǎn)單的、被動(dòng)的信息獲取逐步升級為主動(dòng)參與到信息管理、信息交互的過(guò)程中。用戶(hù)期待一種不需要精確的預定義的集成框架甚至不需要原始信息的本地副本,實(shí)現多維、海量信息的快速、低代價(jià)的獲取。用戶(hù)標注方法在特征提取和語(yǔ)義分析過(guò)程中借助人的認知過(guò)程,提取源數據中的知識,對信息檢索的準確率提升有著(zhù)至關(guān)重要的作用。而地理本體,作為一種半自動(dòng)化的語(yǔ)義推理模型,可以有效降低不同用戶(hù)標注帶來(lái)的差異性,同時(shí)更準確地描述移動(dòng)互聯(lián)網(wǎng)環(huán)境下信息的時(shí)間和空間特征。采用這2種方法相結合建立本地特征索引副本,能夠有效降低數據傳輸對網(wǎng)絡(luò )帶寬的需求和存放數據對存儲空間的需要。

  1用戶(hù)標注

  受限于移動(dòng)終端的大小、網(wǎng)絡(luò )通信能力有限,不適宜采用傳統的方式對采集的圖像、視頻等多媒體數據進(jìn)行完整上傳和統一計算。實(shí)現在本地的特征提取和用戶(hù)標注,可以大大減少網(wǎng)絡(luò )通信,節省用戶(hù)分享的代價(jià)。OpenCV作為傳統的視頻、圖像處理工具,目前已被廣泛應用在iOS和Android為代表的移動(dòng)終端上,并能獲得較好的特征提取速度和分析結果。另外,隨著(zhù)攝像頭、麥克風(fēng)、NFC等傳感器的發(fā)展,基于手機的增強現實(shí)技術(shù)也取得了長(cháng)足的進(jìn)步,為用戶(hù)的信息標注提供了新的手段和方法。采用用戶(hù)標注和特征提取等方法[4],結合移動(dòng)終端對現實(shí)世界的時(shí)間、位置感知,提交較少的描述信息或特征信息,降低了信息和內容分享的門(mén)檻。如圖1所示,采用增強現實(shí)和用戶(hù)標注[10]技術(shù)后,用戶(hù)僅需上傳簡(jiǎn)單的標注、位置信息和提取的語(yǔ)義、圖像內容特征即可實(shí)現內容的分享。對查詢(xún)用戶(hù)來(lái)說(shuō),需要檢索的信息仍然是充分的。

  2地理本體

  地理信息科學(xué)中的本體論研究是高度跨學(xué)科的交叉研究,與地理信息的認知、表達、互操作,尺度和不確定性密切相關(guān),其最重要的一點(diǎn)是研究空間信息的語(yǔ)義理論;诘乩肀倔w的語(yǔ)義檢索[5][6]是通過(guò)本體構建概念層次空間實(shí)現的檢索,它利用本體明確建立了研究對象的概念、屬性、空間位置等各種關(guān)系,并且可以通過(guò)邏輯推理發(fā)掘隱含在概念之間的不明確、非直接的信息,從而可以實(shí)現語(yǔ)義的智能信息檢索。在跨終端、跨媒體環(huán)境中,地理本體模型提供了一個(gè)統一的語(yǔ)義管理平臺。在移動(dòng)互聯(lián)網(wǎng)環(huán)境下,地理本體模型構建完成后,可以基于多種格式標準進(jìn)行發(fā)布,用戶(hù)本地采集的數據通過(guò)用戶(hù)標注、特征提取等方式按照層次、概念和推理結果向現有的本體模型中進(jìn)行映射,構建新的結點(diǎn)和數據內容。這樣,用戶(hù)采集的多媒體數據可以分布式地存放在各自的終端上,通過(guò)更新本體模型建立快速、有效的索引,提供統一的跨媒體、跨終端的服務(wù)標準,有效降低分享和檢索帶來(lái)的網(wǎng)絡(luò )資源消耗和源數據的冗余存放。為了幫助本體開(kāi)發(fā)人員和領(lǐng)域專(zhuān)家對領(lǐng)域知識進(jìn)行建模,斯坦福大學(xué)主導開(kāi)發(fā)了一個(gè)基于java的開(kāi)源本體編輯工具Protégé[13]。該工具使得構建本體知識庫的過(guò)程易于操作和管理,降低了本體構建的高昂成本和維護代價(jià)。它不但支持復雜的知識表示,還支持簡(jiǎn)單的邏輯推理。Protégé支持對多種推理引擎的調用,如Jena,Racer,FaCT,Pellet等,由于Protégé本身是在Jena的基礎上開(kāi)發(fā)的,ProtégéOWLAPI相當于對Jena的.包裝,為了支持推理,Protégé接口中包含了Jena的開(kāi)源開(kāi)發(fā)包,將Jena推理功能嵌入到了Protégé的API中。Jena提供了可擴展的類(lèi)包提供基于規則的推理機,包括RDF推理機,OWL推理機等,在基于規則的推理機中包含了一般的推理功能,這些方法都遵循W3C發(fā)布的標準。

  跨媒體技術(shù)的發(fā)展和挑戰

  1多模態(tài)信息檢索系統

  1)麻省理工學(xué)院“基于圖片的問(wèn)答系統”。該系統作為多模態(tài)、跨媒體檢索領(lǐng)域的先驅?zhuān)С钟脩?hù)以更加直接的方式檢索不同類(lèi)型媒體數據,以克服傳統搜索引擎依賴(lài)于文本匹配的檢索方式。整個(gè)系統通過(guò)3層架構實(shí)現對圖像和文本的交互檢索:(1)模版問(wèn)答(templatebased),根據圖像的預分類(lèi)信息進(jìn)行檢索;(2)歷史庫問(wèn)答(internalrepositorybased),根據內建的歷史問(wèn)答庫進(jìn)行檢索;(3)用戶(hù)指導問(wèn)答(humanbased),當檢索內容過(guò)于復雜時(shí)采用用戶(hù)指導的交互方式進(jìn)行檢索[7]。2)新加坡國立大學(xué)的“多媒體問(wèn)答系統”(mul-timediaquestion-answering)。該系統解決了網(wǎng)絡(luò )跨媒體搜索中的三個(gè)主要問(wèn)題:(1)大規模的可視化概念標注,用于區分一種媒體實(shí)體是否包含一個(gè)或多個(gè)預定義概念標簽的;(2)支持大規模KNN內容搜索的索引方法;(3)用戶(hù)反饋的交互檢索方法[8]。3)I-SEARCH項目。該項目有歐洲多個(gè)研究機構和包括Google,EMC2在內的多個(gè)IT領(lǐng)軍企業(yè)共同合作研發(fā)。該項目旨在研發(fā)一種針對多模態(tài)內容數據的通用框架提供索引、共享、查詢(xún)和檢索等功能。目前,該項目已經(jīng)取得較好的成果,能夠結合現實(shí)世界信息有效管理和利用多種類(lèi)型的媒體數據和多模態(tài)數據,包括文本、2D圖像、草圖、視頻、3D對象和音頻文件等。整個(gè)項目較好的解決了多媒體查詢(xún)和檢索、相關(guān)反饋、多模態(tài)交互、個(gè)性化設置和可視化分析等諸多方面的難題[11]。圖3為I-SEARCH系統原理架構圖、整個(gè)系統主要包括三層:描述符提取層、檢索交互層和可視化表現層。

  2跨媒體檢索面臨的挑戰

  多媒體檢索領(lǐng)域中面臨的挑戰可以歸結為“7個(gè)千年問(wèn)題”:語(yǔ)義鴻溝、機器學(xué)習、人機交互、多媒體水印、數據挖掘、性能評估以及基于互聯(lián)網(wǎng)的多媒體標注與檢索[12]。隨著(zhù)網(wǎng)絡(luò )技術(shù)的發(fā)展和智能終端的普及,跨媒體在移動(dòng)互聯(lián)網(wǎng)搜索領(lǐng)域將越來(lái)越重要。今后幾年值得關(guān)注的幾個(gè)問(wèn)題如下:1)在多媒體的語(yǔ)義理解過(guò)程中,結合地理本體在處理空間和語(yǔ)義推理方面的優(yōu)勢,提高語(yǔ)義理解的性能和檢索的精度。同時(shí),用戶(hù)的反饋和交互知識仍然起著(zhù)重要作用,是不可或缺的。2)實(shí)現移動(dòng)互聯(lián)網(wǎng)環(huán)境下的個(gè)性化檢索,通過(guò)手機用戶(hù)偏好和情景信息感知用戶(hù)意圖,提高檢索精度,目前,個(gè)性化檢索技術(shù)已成為下一代搜索引擎提供服務(wù)的突破所在[13]。3)多種媒體流的同步問(wèn)題。每種模態(tài)的多媒體信息有其自身的粒度級別,如視頻的幀級別、剪輯級別,圖像的像素級別、區域級別等。不同模態(tài)的媒體以其自身的粒度等級作為一個(gè)處理單元[14],因此在連續的跨媒體檢索中如何實(shí)現同步、同期化處理多模態(tài)數據而不丟失語(yǔ)義信息是一個(gè)新的研究領(lǐng)域。4)由于移動(dòng)智能終端的計算能力和網(wǎng)絡(luò )傳輸能力有限,多媒體數據的源數據只能是分布式的存放在不同用戶(hù)的終端上,能否建立快速、有效的索引,提供統一的跨媒體、跨終端的服務(wù)標準,將是制約移動(dòng)互聯(lián)網(wǎng)環(huán)境下跨媒體信息共享服務(wù)發(fā)展的瓶頸。

  結論

  本文對現有跨媒體數據的智能處理和信息檢索研究中的若干問(wèn)題進(jìn)行了綜述,并針對移動(dòng)互聯(lián)網(wǎng)環(huán)境這一典型應用領(lǐng)域進(jìn)行了討論分析,討論了基于用戶(hù)標注和地理本體的實(shí)現方法。最后分析了目前的典型應用系統并指出了未來(lái)研究的發(fā)展方向。(本文作者:張旭、羅詩(shī)妍、金京培、裴海英 單位:韓國仁荷大學(xué)數據庫實(shí)驗室、重慶郵電大學(xué)計算機科學(xué)與技術(shù)學(xué)院)

【跨媒體技術(shù)的發(fā)展和挑戰論文】相關(guān)文章:

淺談傳統出版的跨媒體融合發(fā)展的論文05-28

光纖通信系統技術(shù)的發(fā)展、挑戰與機遇論文05-20

農機技術(shù)的推廣和發(fā)展策略論文05-01

科學(xué)技術(shù)的倫理挑戰論文04-09

建筑工程檢測技術(shù)的發(fā)展和應用的論文06-14

智慧水利的發(fā)展和技術(shù)革新論文05-21

漫談當今媒體技術(shù)下黨刊發(fā)展應對的挑戰及其機遇論文05-12

以太網(wǎng)技術(shù)的發(fā)展和應用研究論文03-22

水利排水技術(shù)發(fā)展和控制措施論文05-29