您的位置:網(wǎng)站首頁 > 優(yōu)秀論文 > 正文
網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘
作者:張敬來源:http://www.zzqkw.com日期:2013-05-15人氣:946
網(wǎng)絡(luò)結(jié)構(gòu)挖掘是從Web文檔結(jié)構(gòu)、WWW的組織結(jié)構(gòu)和鏈接關(guān)系中推導(dǎo)的。網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘的目的是尋找Web和頁面的結(jié)構(gòu)及其蘊(yùn)含在這些結(jié)構(gòu)中的有用模式,然后對其鏈接進(jìn)行合理的分類,通過不同網(wǎng)頁的關(guān)聯(lián)有助于用戶找到所需信息的相關(guān)資源,并且可以通過瀏覽特定的網(wǎng)頁從中獲取最新的動態(tài)信息。還可以發(fā)現(xiàn)Web文檔本身固有的結(jié)構(gòu),此種結(jié)構(gòu)既可以擁有用戶的瀏覽,也可以對網(wǎng)頁進(jìn)行比較。
1.網(wǎng)絡(luò)信息用法挖掘
通過網(wǎng)絡(luò)信息用法挖掘,可以充分的了解用戶的網(wǎng)絡(luò)數(shù)據(jù)實際意義。網(wǎng)絡(luò)信息內(nèi)容挖掘和網(wǎng)絡(luò)信息結(jié)構(gòu)挖掘主要是針對原始數(shù)據(jù)的,而網(wǎng)絡(luò)信息用法挖掘主要是針對用戶和網(wǎng)絡(luò)交互的過程中產(chǎn)生的數(shù)據(jù)。這些數(shù)據(jù)類型包括很多:用戶對網(wǎng)絡(luò)服務(wù)器的訪問記錄、瀏覽器日志記錄、用戶的個人信息、用戶額交易信息等等。運(yùn)用網(wǎng)絡(luò)信息用法挖掘技術(shù)能夠有效的從服務(wù)器以及瀏覽器端的日志記錄中發(fā)現(xiàn)隱藏在網(wǎng)絡(luò)數(shù)據(jù)中的一些無法通過索引獲取的模式信息,還可以了解用戶對網(wǎng)絡(luò)系統(tǒng)的訪問模式以及在網(wǎng)絡(luò)上所進(jìn)行的行為模式,從而對其作出預(yù)測性分析。
2.網(wǎng)絡(luò)新挖掘在信息檢索中的應(yīng)用
網(wǎng)絡(luò)信息挖掘的作用除了體現(xiàn)在具有很大權(quán)威的網(wǎng)頁的生成上外,還可以通過Web的組織結(jié)構(gòu)和鏈接關(guān)系中發(fā)現(xiàn)一些其他類型的知識。網(wǎng)絡(luò)信息挖掘可以通過挖掘web的結(jié)構(gòu)信息揭示蘊(yùn)含在web內(nèi)容之外的許多隱含的有用信息,例如web頁面上的U不僅可以反映頁面的類型,還可以在一定程度上反映頁面間信息的存儲位置和不同信息內(nèi)容的層次關(guān)系以及通過分析網(wǎng)頁的URL來分析這種層次關(guān)系。根據(jù)上述原理已有很多人提出了與web頁面URL有關(guān)的啟發(fā)式規(guī)則,并將其應(yīng)用于尋找個人主頁上。因此,利用網(wǎng)絡(luò)信息挖掘可以很快的尋找個人主頁和與其相似的網(wǎng)頁。除此之外,web的信息挖掘還可以對web頁進(jìn)行合理的分類,預(yù)測用戶的鏈接使用及鏈接屬性的可視化,對各個企業(yè)搜索引擎索引的web頁數(shù)量進(jìn)行統(tǒng)計分析等。它也可以揭示文檔結(jié)構(gòu)信息中的有用模式,有助于從多個維度和層面提供檢索途徑。
3.結(jié)語
因為信息時代的發(fā)展,促使網(wǎng)絡(luò)信息挖掘成為網(wǎng)絡(luò)信息處理領(lǐng)域中的一項新技術(shù),它可以使用戶通過大量網(wǎng)絡(luò)信息中,得到數(shù)據(jù)對象間的內(nèi)在特性,并根據(jù)數(shù)據(jù)間的關(guān)聯(lián)在網(wǎng)絡(luò)資源中進(jìn)行有目的獲取相應(yīng)的信息。目前網(wǎng)絡(luò)信息挖掘是數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)時代網(wǎng)絡(luò)信息處理中的一項非常重要的應(yīng)用,同時也是今后網(wǎng)絡(luò)領(lǐng)域中的一項嶄新的研究課題。隨著網(wǎng)絡(luò)的快速發(fā)展和不斷的普及,網(wǎng)絡(luò)信息資源不但來源途徑更加廣泛而且內(nèi)容也越來越豐富,但如何分析和利用這些無以計數(shù)的網(wǎng)絡(luò)數(shù)據(jù)是當(dāng)前比較突出的一個問題。網(wǎng)絡(luò)信息挖掘在實際工作中具有重要的實踐意義和非常廣闊的應(yīng)用前景。
欄目分類
熱門排行
推薦信息
- 面向職業(yè)技能大賽的無線網(wǎng)絡(luò)課程教學(xué)改革
- 網(wǎng)絡(luò)安全等級保護(hù)中tomcat整改的探討
- 探析微博環(huán)境下網(wǎng)紅的現(xiàn)狀及轉(zhuǎn)型之路——以美食博主李子柒為例
- 大數(shù)據(jù)時代人工智能在網(wǎng)絡(luò)管理中的應(yīng)用研究
- 新媒體環(huán)境下網(wǎng)絡(luò)輿論的形成機(jī)制研究
- 淺析網(wǎng)絡(luò)謠言的傳播機(jī)制——基于王鳳雅事件的案例分析
- 我國互聯(lián)網(wǎng)金融監(jiān)管的若干思考
- 淺析網(wǎng)絡(luò)傳播中議題的儀式化
- 試論網(wǎng)絡(luò)直播的風(fēng)險與治理
- 新媒介語境下的網(wǎng)絡(luò)輿論分析——基于內(nèi)容分析方法
期刊知識
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級黨報?是否有什么說據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!