鏈接分析法——情報學(xué)研究新方法論文
【內容提要】本文認為鏈接分析法是網(wǎng)絡(luò )信息計量學(xué)的重要研究方法,是情報學(xué)研究的新領(lǐng)域。它完善了情報學(xué)方法論體系,豐富了情報學(xué)理論,是情報學(xué)逐漸成熟的一個(gè)重要標志。文章簡(jiǎn)單介紹了網(wǎng)絡(luò )信息計量學(xué),并對鏈接分析法進(jìn)行了分析。
【摘要題】理論縱橫
【正文】
20世紀90年代以后,以數字化技術(shù)、多媒體技術(shù)、網(wǎng)絡(luò )通訊技術(shù)綜合而成的現代信息技術(shù),引發(fā)了人類(lèi)社會(huì )的第二次信息革命,人類(lèi)業(yè)已邁入知識經(jīng)濟時(shí)代。新的社會(huì )環(huán)境使包括情報學(xué)在內的學(xué)科研究發(fā)展面臨著(zhù)新的挑戰,我們需要新的理論和方法來(lái)加以研究和利用,情報學(xué)的傳統方法在面對新的問(wèn)題時(shí),就要進(jìn)行自身的轉化。如面對浩瀚的網(wǎng)絡(luò )信息資源,傳統的文獻計量學(xué)方法就顯得力不從心,相應地網(wǎng)絡(luò )信息計量學(xué)(WebmetricsorCybermetrics)就應運而生,用新的研究方法如鏈接分析法來(lái)描述和組織網(wǎng)絡(luò )信息世界。
1 網(wǎng)絡(luò )信息計量學(xué)
網(wǎng)絡(luò )信息計量學(xué)是在網(wǎng)絡(luò )信息環(huán)境下迅速形成和發(fā)展起來(lái)的,作為信息計量學(xué)的一個(gè)新的發(fā)展和重要的研究領(lǐng)域,它的出現使傳統的基于文獻和信息的文獻計量學(xué)、信息計量學(xué)面臨著(zhù)新的變革。關(guān)于其定義主要有:網(wǎng)絡(luò )計量學(xué)是一門(mén)計算機科學(xué),是一門(mén)研究互聯(lián)網(wǎng)上數據相互引用的科學(xué),是一門(mén)對網(wǎng)絡(luò )文獻規律進(jìn)行統計分析的科學(xué),基于Web和軟件計量分析工具,集計算機技術(shù)、網(wǎng)絡(luò )技術(shù)、計量學(xué)方法、統計學(xué)方法于一體,其應用范圍覆蓋了所有基于網(wǎng)絡(luò )通信技術(shù)的信息測度。網(wǎng)絡(luò )計量學(xué)是綜合采用文獻計量、信息計量、統計學(xué)方法、計算機技術(shù)和網(wǎng)絡(luò )技術(shù)對網(wǎng)絡(luò )文獻規律進(jìn)行統計分析的一門(mén)科學(xué)。網(wǎng)絡(luò )信息計量學(xué)是采用數學(xué)、統計學(xué)的各種定量方法,對網(wǎng)絡(luò )信息的組織、存儲、分布、傳遞、相互引證和開(kāi)發(fā)利用進(jìn)行定量描述和統計分析,借以揭示網(wǎng)絡(luò )信息的數量特征和內在規律的一門(mén)新興學(xué)科。它主要是由網(wǎng)絡(luò )技術(shù)、網(wǎng)絡(luò )管理、信息資源管理與信息計量學(xué)等相互結合、交叉滲透而形成的一門(mén)交叉性邊緣學(xué)科。
2 鏈接分析法研究現狀
2.1 鏈接分析法的內容
鏈接分析法是網(wǎng)絡(luò )信息計量學(xué)中一個(gè)重要方法,它可以看成是文獻計量學(xué)中引文分析法在網(wǎng)絡(luò )環(huán)境中的應用。網(wǎng)絡(luò )超文本通過(guò)鏈可以將結點(diǎn)鏈接起來(lái),一般使用兩種方法——索引鏈和結構鏈進(jìn)行鏈接,它既可以表示信息之間的關(guān)系,又是構成網(wǎng)絡(luò )的手段。在將網(wǎng)絡(luò )相關(guān)信息資源內容鏈接起來(lái)形成新的信息鏈或信息集合的基礎上,融合了參考文獻鏈接功能,并通過(guò)引文關(guān)系來(lái)分析鏈接網(wǎng)絡(luò )信息資源的方法?梢园凑找贸潭群鸵脵嗤畔⒃磥(lái)分析,在網(wǎng)絡(luò )信息組織、檢索、評價(jià)、服務(wù)等方面起著(zhù)重要作用。
2.1.1 鏈接分析法在網(wǎng)絡(luò )信息組織方面的作用
網(wǎng)絡(luò )信息資源生產(chǎn)者如網(wǎng)頁(yè)創(chuàng )作者使用鏈接分析,創(chuàng )建一些對訪(fǎng)問(wèn)者有用的鏈接,可以鏈接到不同主題或相同主題質(zhì)量更優(yōu)秀的網(wǎng)頁(yè)。一般來(lái)說(shuō)鏈接類(lèi)型大致有:合作鏈接(被鏈接網(wǎng)站和鏈接網(wǎng)站之間存在合作關(guān)系)、友情鏈接(網(wǎng)站之間可能由于在資源或其它相關(guān)方面有關(guān)系,相當于影視術(shù)語(yǔ)中的友情客串)、推薦鏈接(被推薦網(wǎng)站由于質(zhì)量好、人氣旺、訪(fǎng)問(wèn)用戶(hù)多或是熱門(mén)網(wǎng)站等原因鏈接)、內容鏈接(被鏈接網(wǎng)站和鏈接網(wǎng)站在內容上存在著(zhù)互補或相通關(guān)系等),可以起到網(wǎng)絡(luò )導航的作用,大大方便用戶(hù)在網(wǎng)上沖浪。Google還通過(guò)鏈接分析來(lái)確定網(wǎng)絡(luò )上的權威信息源來(lái)進(jìn)行相關(guān)的排名。Google認為網(wǎng)頁(yè)制作者僅創(chuàng )建他們認為重要的網(wǎng)頁(yè)的鏈接,鏈接到另外的網(wǎng)頁(yè)就像一本書(shū)的引文,網(wǎng)頁(yè)之間的這種引文關(guān)系“像是對網(wǎng)頁(yè)進(jìn)行評論的過(guò)程”。例如,網(wǎng)頁(yè)的制作者們創(chuàng )造了幾千個(gè)Yahoo的鏈接,困此Yahoo被當作一個(gè)重要程度點(diǎn);如果許多重要的網(wǎng)頁(yè)都指向Yahoo,則其重要程度會(huì )更高。這種方法的好處是網(wǎng)頁(yè)制作者不可能誤導網(wǎng)站的排序,并且擴展性極好——當網(wǎng)絡(luò )增長(cháng)時(shí),產(chǎn)生更多的重要網(wǎng)頁(yè)的鏈接,自然更能確定該網(wǎng)頁(yè)是否是權威的信息源。
2.1.2 鏈接分析法在網(wǎng)絡(luò )信息檢索方面的作用
鏈接分析主要應用于網(wǎng)絡(luò )信息檢索方面,如搜索引擎收集信息、檢索結果的排序等。網(wǎng)絡(luò )信息檢索為用戶(hù)提供海量信息多媒體數據庫,采用超文本技術(shù)使檢索空間比傳統的信息檢索范圍更廣泛,以結點(diǎn)為單位組織,以超鏈接的方式鏈接相關(guān)內容,更加符合人們的思維方式,打破了線(xiàn)性存儲的限制,真正實(shí)現多維檢索。Web信息檢索系統可以利用鏈接信息來(lái)優(yōu)化對相關(guān)文獻的查詢(xún),能夠極大地提高檢索結果的相關(guān)性。在搜索引擎收集信息的過(guò)程中,J.Kleinberg認為搜索引擎的Robots直接訪(fǎng)問(wèn)Web提取出權威頁(yè)(AuthorityPage)。但是如何提取出權威頁(yè),這需要一個(gè)原始積累和評價(jià)過(guò)程。先給出一批起始網(wǎng)頁(yè),Robot從這些源網(wǎng)頁(yè)開(kāi)始收集,可以按照深度優(yōu)先或廣度優(yōu)先的算法進(jìn)行。當網(wǎng)頁(yè)提取回來(lái)后,采用鏈接分析技術(shù)(具體用遞歸算法)來(lái)計算出權威頁(yè)。有了權威網(wǎng)頁(yè),Robot在收集Web信息時(shí),就有針對性地、高效率地訪(fǎng)問(wèn)Web網(wǎng)頁(yè)。搜索引擎檢索結果排序方面也運用了鏈接分析技術(shù),由于索引數據庫容量大,若用戶(hù)輸入一個(gè)關(guān)鍵詞,有可能會(huì )有成千上萬(wàn)條記錄相匹配,搜索引擎對如此龐大的結果如何排序,如何把最相關(guān)的幾十條記錄顯示出來(lái)?搜索引擎按記錄號的順序提取結果集中的前幾十條記錄,再按鄰近圖(NeighborGraph)算法對這幾十條記錄排序,最先顯示給用戶(hù)。這種檢索結果排序就是利用鏈接分析技術(shù),大大減輕了搜索引擎的負擔,Yahoo、Google等搜索引擎就采用了超鏈接分析技術(shù)來(lái)對檢索結果排序。2.1.3 鏈接分析法在網(wǎng)絡(luò )信息資源評價(jià)方面的作用
傳統的引文分析法在學(xué)術(shù)方面衡量學(xué)術(shù)期刊重要性的指標之一是“影響因子”(IF),哪家期刊和論文被引用次數多,影響因子就高,誰(shuí)就被認為是權威,論文也就是優(yōu)秀論文。在互聯(lián)網(wǎng)上IF對應于統計指向某一網(wǎng)頁(yè)的鏈接數目后對該網(wǎng)頁(yè)作出的排序,網(wǎng)站引用分析對應的是某個(gè)站點(diǎn)網(wǎng)頁(yè)被其它站點(diǎn)引用的情況的統計分析,也就是網(wǎng)頁(yè)可能被其它網(wǎng)站搜索提問(wèn)命中的結果數的多少,采用計分法和線(xiàn)性代數方法對中心網(wǎng)頁(yè)和權威網(wǎng)頁(yè)分數進(jìn)行迭代求和,以確定權威網(wǎng)頁(yè)和中心網(wǎng)頁(yè)。這與百度搜索引擎的創(chuàng )始人李彥宏1996年提出的搜索引擎的第二定律:“人氣質(zhì)量定律”相一致。根據這一定律,用鏈接分析法進(jìn)行統計網(wǎng)站被鏈接和訪(fǎng)問(wèn)次數,可以作為評價(jià)網(wǎng)站和網(wǎng)絡(luò )信息資源質(zhì)量的一個(gè)指標。再加上相應的鏈接文字分析,就可以用在搜索結果的排序上了,對搜索結果進(jìn)行的按相關(guān)性排序,不完全依賴(lài)于詞頻統計,而是更多地依賴(lài)于超鏈分析。在Internet上鏈接關(guān)系反映的是網(wǎng)頁(yè)在全世界范圍內、同一學(xué)科類(lèi)屬的影響力,評價(jià)范圍是很廣的、甚至全球性的。目前主要利用搜索引擎工具在網(wǎng)絡(luò )上檢索網(wǎng)站和網(wǎng)頁(yè)的鏈接情況,并按相關(guān)性對檢索結果進(jìn)行排序,大大方便了用戶(hù)在浩
翰的信息海洋中迅速準確地獲得有用的信息,易于操作、實(shí)用且可以節省用戶(hù)的時(shí)間,在一定程度上可以彌補同行評議等定性方法的缺陷。
2.2 鏈接分析法對情報學(xué)研究方法的意義
蘇聯(lián)科學(xué)家巴甫洛夫說(shuō)過(guò):“科學(xué)是隨著(zhù)研究方法所取得的成就向前的。研究方法每前進(jìn)一步,隨之我們面前也就開(kāi)拓了一個(gè)充滿(mǎn)種種新鮮事物的更遼闊的遠景!鼻閳髮W(xué)是一門(mén)新興的綜合性邊緣學(xué)科,是一個(gè)開(kāi)放的綜合性知識體系,它善于吸收其它相關(guān)學(xué)科的知識和研究方法。上世紀60年代后,隨著(zhù)科學(xué)的日益發(fā)展,科學(xué)研究中應用研究、實(shí)用研究和開(kāi)發(fā)研究比重逐漸增大,情報學(xué)研究方法體系取得了長(cháng)足進(jìn)步,表現在:一是情報研究的領(lǐng)域、對象、內容等的擴大和深化;二是現代科學(xué)學(xué)科與方法的創(chuàng )立和發(fā)展。情報學(xué)研究方法體系是動(dòng)態(tài)的、發(fā)展的。情報學(xué)科要想在原有的基礎上實(shí)現學(xué)科研究模式的更新
、學(xué)科結構的變革和學(xué)科體系的拓展,就必須研究和采用新的思維方式和新的`研究方法,及時(shí)反映最新的學(xué)科學(xué)術(shù)動(dòng)態(tài)和最新的理論學(xué)說(shuō),移植、借鑒其它學(xué)科的研究方法,如哲學(xué)方法、數學(xué)方法、社會(huì )學(xué)方法、經(jīng)濟學(xué)方法、信息技術(shù)方法等來(lái)豐富自己的研究方法,并加以創(chuàng )造和大膽創(chuàng )新,不僅引起自身學(xué)科結構的變革和深化學(xué)科前沿的研究,而且不斷發(fā)展新的分支學(xué)科,促使學(xué)科研究充滿(mǎn)時(shí)代氣息。
鏈接分析法大大拓展了信息計量學(xué)在網(wǎng)絡(luò )環(huán)境下的應用,充實(shí)了網(wǎng)絡(luò )信息計量學(xué)的內容,是情報學(xué)研究的新領(lǐng)域,完善了情報學(xué)方法論體系。它是情報學(xué)逐漸成熟的一個(gè)重要歷程碑,標志著(zhù)情報學(xué)理論方法的一個(gè)新的飛躍。
2.3 鏈接分析法目前存在的問(wèn)題
在文獻計量學(xué)中,傳統的引文分析法只要統計參考文獻數據就可完成引文分析的任務(wù),但是在互聯(lián)網(wǎng)上,鏈接分析法的研究對象是網(wǎng)絡(luò )信息資源,網(wǎng)絡(luò )信息資源覆蓋范圍廣、動(dòng)態(tài)性強,具的信息量巨大、不確定性、缺乏合理組織、難以預測等特點(diǎn),且信息過(guò)載(InformationOverload)和信息污染(InformationPollution)現象嚴重;引用與被引用關(guān)系也變得十分復雜;鏈接分析法的適用范圍也是有限的;Internet是在一個(gè)商業(yè)化的環(huán)境中發(fā)展起來(lái)的,一個(gè)網(wǎng)站的被鏈接數量還與它的商業(yè)推廣有著(zhù)密切的聯(lián)系,因此這種評價(jià)體制在某種程度上缺乏客觀(guān)性。因此,在使用鏈接分析法時(shí)要充分考慮以上問(wèn)題,盡大可能保證其結果的可靠性。
3 結束語(yǔ)
由于鏈接分析法借鑒了引文分析法的方法和思路,是情報學(xué)研究方法在網(wǎng)絡(luò )環(huán)境下新應用,目前鏈接分析法主要實(shí)驗工具是搜索引擎,但隨著(zhù)網(wǎng)絡(luò )信息技術(shù)如人工智能、網(wǎng)絡(luò )信息檢索、計算機網(wǎng)絡(luò )、知識挖掘、自然語(yǔ)言處理等的發(fā)展,必將為鏈接分析法的研究和開(kāi)發(fā)應用提供更為有力的支持。情報學(xué)也必將充分利用網(wǎng)絡(luò )信息技術(shù),吸收其它學(xué)科的先進(jìn)方法來(lái)深化、完善自己的方法論體系,建立起更為完善的體系結構,從而改變情報學(xué)學(xué)科的面貌。
【參考文獻】
1 徐久齡等.網(wǎng)絡(luò )計量學(xué)的研究.情報學(xué)進(jìn)展1998-1999年度評論,第三卷.北京:航空工業(yè)出版社,1999:78-105
2 夏旭等.網(wǎng)絡(luò )計量學(xué)研究:現狀、問(wèn)題與發(fā)展.圖書(shū)館論壇,2001,(12):44-47
3 鄒志仁.論情報研究方法體系.江蘇圖書(shū)館學(xué)報,1990,(2):18-23
4 楊濤.鏈接分析法存在的問(wèn)題及改進(jìn)方法.圖書(shū)情報知識,2002,(3):62-63
5 劉雁書(shū),方平.Web網(wǎng)站站外鏈接類(lèi)型與特征調查-鏈接分析法可行性研究.大學(xué)圖書(shū)館學(xué)報,2001,(5):65-68
6 鄒菲.試論網(wǎng)絡(luò )信息計量學(xué)在數字圖書(shū)館中的應用.圖書(shū)情報知識,2001,(1):16-17,20
7 邱均平.信息計量學(xué)(一).情報理論與實(shí)踐,2000,(1)
8 鄒曼莉.國外網(wǎng)絡(luò )信息檢索的最新進(jìn)展.圖書(shū)館雜志,2002,(2):67-70
9 J.Kleinberg.AuthoritativeSourcesinaHyperlinkedEnvironment.Proc.NinthACM-SIAMSymp.DiscreteAlgorithm,ACMPress.NewYork.1998
【鏈接分析法——情報學(xué)研究新方法論文】相關(guān)文章:
環(huán)境治理研究的新方法解析論文10-29
信息鏈與我國情報學(xué)研究管理論文12-13
知識管理與圖書(shū)情報學(xué)的變革論文10-23
基于層次分析法的工程項目評標應用研究論文10-26
圖書(shū)情報學(xué)持續發(fā)展途徑探索論文05-11
關(guān)于基于內容分析法的云會(huì )計發(fā)展影響因素研究論文05-08