優(yōu)勝從選擇開始,我們是您最好的選擇!—— 中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)
0373-5939925
2851259250@qq.com
我要檢測 我要投稿 合法期刊查詢
您的位置:網(wǎng)站首頁 > 優(yōu)秀論文 > 正文

網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘

作者:張敬來源:http://www.zzqkw.com日期:2013-05-15人氣:946
網(wǎng)絡(luò)結(jié)構(gòu)挖掘是從Web文檔結(jié)構(gòu)、WWW的組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)的。網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘的目的是尋找Web和頁面的結(jié)構(gòu)及其蘊(yùn)含在這些結(jié)構(gòu)中的有用模式,然后對其鏈接進(jìn)行合理的分類,通過不同網(wǎng)頁的關(guān)聯(lián)有助于用戶找到所需信息的相關(guān)資源,并且可以通過瀏覽特定的網(wǎng)頁從中獲取最新的動態(tài)信息。還可以發(fā)現(xiàn)Web文檔本身固有的結(jié)構(gòu),此種結(jié)構(gòu)既可以擁有用戶的瀏覽,也可以對網(wǎng)頁進(jìn)行比較。 1.網(wǎng)絡(luò)信息用法挖掘 通過網(wǎng)絡(luò)信息用法挖掘,可以充分的了解用戶的網(wǎng)絡(luò)數(shù)據(jù)實際意義。網(wǎng)絡(luò)信息內(nèi)容挖掘和網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘主要是針對原始數(shù)據(jù)的,而網(wǎng)絡(luò)信息用法挖掘主要是針對用戶和網(wǎng)絡(luò)交互的過程中產(chǎn)生的數(shù)據(jù)。這些數(shù)據(jù)類型包括很多:用戶對網(wǎng)絡(luò)服務(wù)器的訪問記錄、瀏覽器日志記錄、用戶的個人信息、用戶額交易信息等等。運(yùn)用網(wǎng)絡(luò)信息用法挖掘技術(shù)能夠有效的從服務(wù)器以及瀏覽器端的日志記錄中發(fā)現(xiàn)隱藏在網(wǎng)絡(luò)數(shù)據(jù)中的一些無法通過索引獲取的模式信息,還可以了解用戶對網(wǎng)絡(luò)系統(tǒng)的訪問模式以及在網(wǎng)絡(luò)上所進(jìn)行的行為模式,從而對其作出預(yù)測性分析。 2.網(wǎng)絡(luò)新挖掘在信息檢索中的應(yīng)用 網(wǎng)絡(luò)信息挖掘的作用除了體現(xiàn)在具有很大權(quán)威的網(wǎng)頁的生成上外,還可以通過Web的組織結(jié)構(gòu)和鏈接關(guān)系中發(fā)現(xiàn)一些其他類型的知識。網(wǎng)絡(luò)信息挖掘可以通過挖掘web的結(jié)構(gòu)信息揭示蘊(yùn)含在web內(nèi)容之外的許多隱含的有用信息,例如web頁面上的U不僅可以反映頁面的類型,還可以在一定程度上反映頁面間信息的存儲位置和不同信息內(nèi)容的層次關(guān)系以及通過分析網(wǎng)頁的URL來分析這種層次關(guān)系。根據(jù)上述原理已有很多人提出了與web頁面URL有關(guān)的啟發(fā)式規(guī)則,并將其應(yīng)用于尋找個人主頁上。因此,利用網(wǎng)絡(luò)信息挖掘可以很快的尋找個人主頁和與其相似的網(wǎng)頁。除此之外,web的信息挖掘還可以對web頁進(jìn)行合理的分類,預(yù)測用戶的鏈接使用及鏈接屬性的可視化,對各個企業(yè)搜索引擎索引的web頁數(shù)量進(jìn)行統(tǒng)計分析等。它也可以揭示文檔結(jié)構(gòu)信息中的有用模式,有助于從多個維度和層面提供檢索途徑。 3.結(jié)語 因為信息時代的發(fā)展,促使網(wǎng)絡(luò)信息挖掘成為網(wǎng)絡(luò)信息處理領(lǐng)域中的一項新技術(shù),它可以使用戶通過大量網(wǎng)絡(luò)信息中,得到數(shù)據(jù)對象間的內(nèi)在特性,并根據(jù)數(shù)據(jù)間的關(guān)聯(lián)在網(wǎng)絡(luò)資源中進(jìn)行有目的獲取相應(yīng)的信息。目前網(wǎng)絡(luò)信息挖掘是數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)時代網(wǎng)絡(luò)信息處理中的一項非常重要的應(yīng)用,同時也是今后網(wǎng)絡(luò)領(lǐng)域中的一項嶄新的研究課題。隨著網(wǎng)絡(luò)的快速發(fā)展和不斷的普及,網(wǎng)絡(luò)信息資源不但來源途徑更加廣泛而且內(nèi)容也越來越豐富,但如何分析和利用這些無以計數(shù)的網(wǎng)絡(luò)數(shù)據(jù)是當(dāng)前比較突出的一個問題。網(wǎng)絡(luò)信息挖掘在實際工作中具有重要的實踐意義和非常廣闊的應(yīng)用前景。

網(wǎng)絡(luò)客服QQ: 沈編輯

投訴建議:0373-5939925????投訴建議QQ:

招聘合作:2851259250@qq.com (如您是期刊主編、文章高手,可通過郵件合作)

地址:河南省新鄉(xiāng)市金穗大道東段266號中州期刊聯(lián)盟 ICP備案號:豫ICP備2020036848

【免責(zé)聲明】:中州期刊聯(lián)盟所提供的信息資源如有侵權(quán)、違規(guī),請及時告知。

版權(quán)所有:中州期刊聯(lián)盟(新鄉(xiāng)市博翰文化傳媒有限公司)

關(guān)注”中州期刊聯(lián)盟”公眾號
了解論文寫作全系列課程

核心期刊為何難發(fā)?

論文發(fā)表總嫌貴?

職院單位發(fā)核心?

掃描關(guān)注公眾號

論文發(fā)表不再有疑惑

論文寫作全系列課程

掃碼了解更多

輕松寫核心期刊論文

在線留言