您的位置:網(wǎng)站首頁 > 優(yōu)秀論文 > 正文
關(guān)鍵模塊SVM研究
作者:楊明級來源:http://www.zzqkw.com日期:2013-03-01人氣:775
短信預(yù)處理模塊和SVM模塊,實現(xiàn)以下功能:
(1)短信預(yù)處理模塊。在短信預(yù)處理模塊中對嫌疑短信進行前期處理,完成分詞、文本表示和特征選擇,把嫌疑短信表示成計算機能夠處理的形式。
(2)SVM模塊。因為支持向量機具有較高的分類精度,但在處理大規(guī)模數(shù)據(jù)集時有收斂速度較慢的特點,在SVM模塊中對嫌疑短信進行離線分類,將其用于校對和補充貝葉斯模塊的判定結(jié)果,并計算關(guān)鍵詞的權(quán)重,更新關(guān)鍵詞庫,以提高垃圾短信過濾準(zhǔn)確率。[3][4]
本文結(jié)合短信文本的特點,提出了基于支持向量機的短信分類方法以及實現(xiàn)步驟。基于支持向量機的短信分類是通過提取短信文本內(nèi)容,將短信識別看作文本的兩分類問題,利用支持向量機方法對訓(xùn)練短信集進行訓(xùn)練學(xué)習(xí),得到分類模型以及決策函數(shù),再利用得到的分類模型對待分類短信進行分類,識別短信的屬性,即判斷短信是否屬于垃圾短信的過程。其具體實現(xiàn)主要分為兩個階段,即訓(xùn)練階段和分類階段。如下圖1所示:
基于支持向量機的短信分類過程需要經(jīng)過短信預(yù)處理,特征降維,短信文本表示以及構(gòu)建分類器四個步驟。首先要對短信訓(xùn)練集和測試集(即已知樣本短信和未知分類短信)進行預(yù)處理,對短信的屬性類別,詞條(即特征)進行統(tǒng)計,然后對特征集進行降維,進而完成特征的向量表示。在對樣本特征集進行訓(xùn)練學(xué)習(xí)的過程中,根據(jù)訓(xùn)練集中的樣本點計算出參數(shù),從而得到分類模型(二元分類器)。接下來進行的分類階段,通過分類模型的決策函數(shù)對未知的待分類樣本進行分類,以判別待分類短信是否屬于垃圾短信。
欄目分類
熱門排行
推薦信息
- 以場景、生態(tài)與科技激活文旅消費升級新動能
- 科技金融融合賦能企業(yè)開放式創(chuàng)新
- 農(nóng)業(yè)科技創(chuàng)新驅(qū)動下的農(nóng)村產(chǎn)業(yè)結(jié)構(gòu)優(yōu)化與農(nóng)村發(fā)展
- 數(shù)字科技與藝術(shù)設(shè)計的融合探究
- 光伏制氫摻入天然氣燃燒可行性研究
- 纖維素基摩擦納米發(fā)電機的制備及其在人機交互與能源收集中的應(yīng)用研究
- 工業(yè)機器人技術(shù)在自動化控制領(lǐng)域中的應(yīng)用
- 創(chuàng)造低碳舒適家居的追光導(dǎo)光儲能系統(tǒng)研究
- 靜電紡絲法制備納米復(fù)合纖維研究進展
- 基于數(shù)字信號處理的無線傳輸系統(tǒng)優(yōu)化與技術(shù)突破
期刊知識
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認可省市級黨報?是否有什么說據(jù)?還有哪些機構(gòu)認可黨報?
- 《農(nóng)業(yè)經(jīng)濟》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!