大數(shù)據(jù)背景下意識形態(tài)研究的方法論、機(jī)遇與路徑
以往對意識形態(tài)的分析主要沿著“左—右”連續(xù)統(tǒng)(issue continuum)而展開,但是這一路徑更可能適合于政治精英、知識精英等處于社會較高階層的人,并不完全適合于普通大眾。研究者們發(fā)現(xiàn),象征性和操作性意識形態(tài)與那些對政治知曉程度或參與程度較高的人更一致。[1]類似的是,對于那些具有較高教育程度和豐富政治經(jīng)驗的人[2],自由主義、保守主義態(tài)度的評估更可能反映在單維度方面。同時,社會和經(jīng)濟(jì)議題的態(tài)度在不同維度上可以預(yù)測政治精英的意識形態(tài)[3],但是這一維度結(jié)構(gòu)并不適用于一般公眾[4]。隨著網(wǎng)絡(luò)技術(shù)賦予普通人更多表達(dá)權(quán),公眾的意見表達(dá)也越來越豐富。新媒體中針對特定議題的表達(dá)話語,能夠較好預(yù)測用戶的意識形態(tài)。一些研究發(fā)現(xiàn),社交媒體人物標(biāo)識可以測量個人特征[5],F(xiàn)acebook和Twitter可以準(zhǔn)確預(yù)測傳統(tǒng)測量中的意識形態(tài)[6]。
從意識形態(tài)的功能看,意識形態(tài)包括話語上層建筑,以及功能或動機(jī)的子結(jié)構(gòu)。話語上層建筑指的是在特定時期和特定地點,社會建構(gòu)態(tài)度、信念、信念與特定的意識形態(tài)位置。[7]話語上層建筑被認(rèn)為是一種社會再現(xiàn),一般是由政治精英塑造,并傳播到公眾。[8]功能子結(jié)構(gòu)指的是社會心理需求、目標(biāo)、動機(jī)使得公眾的政治興趣自下而上形成,這是在話語層面意識形態(tài)的指導(dǎo)下進(jìn)行的。[9]
以往很多研究關(guān)注上層建筑的意識形態(tài),例如政治領(lǐng)導(dǎo)人和黨派意識形態(tài)[10],具體分析這種意識形態(tài)是如何建構(gòu)、傳播,并說服公眾,從而形成政權(quán)合法性的強(qiáng)有力基礎(chǔ)[11]。隨著大眾社會的興起,心理學(xué)特別是政治心理學(xué)開始強(qiáng)調(diào)公眾的意識形態(tài),其意識形態(tài)由一系列信念、認(rèn)知、價值觀、態(tài)度包裹而成。心理學(xué)家認(rèn)為,自下而上的認(rèn)知和動機(jī)過程非常重要,其對于我們更加深刻了解人們的所思、所想、所感有著重要意義。特別是當(dāng)下公眾可以通過網(wǎng)絡(luò)等新媒體平臺表達(dá)意見,并通過鏈接、轉(zhuǎn)發(fā)等多種方式將承載著自我信念的話語在不同個體之間擴(kuò)散和傳播,這種橫向的話語串聯(lián)在某種狀態(tài)下會以涌現(xiàn)的方式表征為子群體的意識形態(tài)狀態(tài)。
大數(shù)據(jù)背景下社會意識和心理,以語言、文本的形式存儲和記錄于網(wǎng)絡(luò)空間和平臺之中。對這些以文本形式存在的數(shù)據(jù)進(jìn)行分析,有助于把握公眾的意識形態(tài)心理及其傳播過程,以及新媒體環(huán)境下公眾的意識形態(tài)存在狀態(tài)。相比于傳統(tǒng)研究方法,當(dāng)下以大數(shù)據(jù)為代表的計算社會科學(xué)的興起,對研究公眾意識形態(tài)形成、擴(kuò)散等提供了良好的發(fā)展機(jī)遇。這方面的研究,傳播學(xué)的作用和潛力巨大,正如有研究者認(rèn)為的那樣,在計算社會科學(xué)中,文本就是數(shù)據(jù),這將傳播研究置于中心,要關(guān)注傳播內(nèi)容——他們?nèi)绾萎a(chǎn)生、如何回復(fù)的——這是該領(lǐng)域的中心工作。[12]
一、大數(shù)據(jù)背景下意識形態(tài)研究的方法論基礎(chǔ)
技術(shù)為研究方法的發(fā)展提供了新思路,大數(shù)據(jù)技術(shù)的發(fā)展要求在研究中要具有“數(shù)據(jù)”思維。陸地認(rèn)為,大數(shù)據(jù)既可以是手段,也可以是事實,是一種世界觀、一種方法論、一種研究方法。[13]大數(shù)據(jù)思維更為意識形態(tài)分析等提供了方法論基礎(chǔ),這體現(xiàn)了當(dāng)下意識形態(tài)研究要超越傳統(tǒng)的二元對立思維,更加注重大眾化的意識形態(tài)。同時,大數(shù)據(jù)也為新媒體中的意見表達(dá)分析提出了具體可行的分析技術(shù)和方法,有助于更好地理解意識形態(tài)和公眾社會心理。從方法論的角度看,大數(shù)據(jù)背景下意識形態(tài)研究具有以下幾個重要趨勢。
(一)從意識形態(tài)精英化走向意識形態(tài)大眾化、日常化
傳統(tǒng)研究認(rèn)為意識形態(tài)具有明顯的結(jié)構(gòu)性,即沿著左右派別而劃分,這也體現(xiàn)在政治、經(jīng)濟(jì)、文化等維度。這大多被認(rèn)為存在于具有明確意識形態(tài)的人當(dāng)中,包括政治精英、知識精英,以及其他處于較高社會地位的人。[14]但其實,意識形態(tài)根源于基本的個人性格差異以及對世界的心理需求、動機(jī)等相對穩(wěn)定的個人偏好。有研究發(fā)現(xiàn),保守主義和自由主義都具有認(rèn)識論動機(jī)(epistemic motivates)、存在論動機(jī)(epistemic motivates)、關(guān)系動機(jī)(relational motives)。[15]心理學(xué)家也基于認(rèn)知和動機(jī)過程,發(fā)展意識形態(tài)信念系統(tǒng),這些信念系統(tǒng)具有一定的維度結(jié)構(gòu)。[16]
若從心理動機(jī)來分析意識形態(tài),普通人的一切能夠預(yù)測心理特征的網(wǎng)絡(luò)使用行為和消費行為都可以用來分析意識形態(tài)。換句話說,網(wǎng)絡(luò)媒體的使用也構(gòu)成了意識形態(tài)日?;闹匾嫦?。意識形態(tài)日?;c傳統(tǒng)自上而下話語形態(tài)、上層建筑的意識形態(tài)有所不同,更加強(qiáng)調(diào)意識形態(tài)中的個人主體性角色。意識形態(tài)日常化的研究對象在當(dāng)下越來越容易獲得,包括人際討論、技術(shù)接入、日常消費等,網(wǎng)絡(luò)行為也不斷將意識形態(tài)生活化付諸實踐,通過網(wǎng)絡(luò)實踐促進(jìn)意識形態(tài)日?;?。
(二)從話語意識形態(tài)走向行為意識形態(tài)
自Free & Cantril &(1967)[17]開始,輿論研究者區(qū)分了意識形態(tài)的象征方面(symbolic aspect)和操作方面(operational aspect)。象征性意識形態(tài)指的是一般意義上的、抽象的意識形態(tài)標(biāo)簽、影響和類型,包括自我確認(rèn)左或右的行為,可以通過詢問政治意識形態(tài)的位置獲得。操作性意識形態(tài)指的是更為具體的、基于事件的觀點,可以通過對某些議題的贊同程度獲得。[18]其隱含的基本假定是,具有特定意識形態(tài)的人一般持有類似的態(tài)度和觀點,由此,研究大多通過話語預(yù)測意識形態(tài)。
但是,網(wǎng)絡(luò)數(shù)據(jù)除了話語之外,還包括各種行為數(shù)據(jù),如關(guān)注、轉(zhuǎn)發(fā)、評論等行為,以及人們的網(wǎng)絡(luò)消費行為。這些很大程度上也反映了特定的意識形態(tài)。有研究將網(wǎng)絡(luò)用戶的商品消費評論與評論者個人建立聯(lián)系,并認(rèn)為評論者的個性特征會影響評論的組織方式。研究發(fā)現(xiàn),相比于保守主義者,那些持自由主義態(tài)度的評論者會更多地運用復(fù)雜語言、更多元的論據(jù)對商品進(jìn)行評論。[19]也有研究者對100萬網(wǎng)絡(luò)書籍合購數(shù)據(jù)的分析中發(fā)現(xiàn),意識形態(tài)偏好在學(xué)科內(nèi)和學(xué)科間都存在。在所有領(lǐng)域,那些自由主義消費者都偏愛技術(shù)科學(xué)(如物理學(xué)、天文學(xué)、動物學(xué)),而保守主義者則偏愛應(yīng)用和商業(yè)科學(xué)(如犯罪學(xué)、藥學(xué)、地球物理學(xué))。同時,在學(xué)科內(nèi)部,那些保守主義消費者傾向于購買其他學(xué)科的書,其學(xué)科類型較少,而且這些學(xué)科都處于邊緣地位。[20]也就是說,政治左派和右派普遍對科學(xué)感興趣,但是其消費類型呈現(xiàn)出顯著的意識形態(tài)差異,網(wǎng)絡(luò)消費行為在很大程度上可以預(yù)測人們的意識形態(tài)偏好。
(三)從個體媒介實踐走向宏觀意識形態(tài)圖景建構(gòu)
從媒介二元性的角度看,新媒體為用戶的媒介使用提供了多種可能,用戶的媒介實踐反過來構(gòu)建了整個意識形態(tài)圖景?;ヂ?lián)網(wǎng)技術(shù)的結(jié)構(gòu)性主要體現(xiàn)在其具有聯(lián)通線上線下、聯(lián)通不同個體的中介性功能。在新媒體使用中,人們通過互聯(lián)網(wǎng)的鏈接性而得以聯(lián)通,在網(wǎng)絡(luò)中實踐意識形態(tài)。個人在虛擬與現(xiàn)實的穿梭中,參與并作用于意識形態(tài)的日?;瑥?qiáng)化了現(xiàn)實意識形態(tài),這是一種機(jī)械地將個人集合為整體意識形態(tài)圖景。同時,個人通過網(wǎng)絡(luò)共享現(xiàn)實,尋找與自己身份一致的意識形態(tài)群體和信念,這是一種有機(jī)的、超越了現(xiàn)實情況進(jìn)而產(chǎn)生于虛擬空間的媒介實踐,其影響了意識形態(tài)圖景。
值得注意的一個現(xiàn)象是,個人的網(wǎng)絡(luò)使用行為是注意力的表征,在其網(wǎng)絡(luò)信息流中,通過轉(zhuǎn)發(fā)、互動等擴(kuò)大相關(guān)議題的討論等,這特別體現(xiàn)在對帖子內(nèi)容的具體分析細(xì)節(jié)當(dāng)中。例如,相關(guān)研究大多運用主題模型識別重要的討論議題,借助于常用的話題模型(如LDA,Latent Dirichlet Allocation),可以從帖子中抽取有意義的話題類型,也可以從微觀的個體詞匯歸納出宏觀層面的話語框架;也能夠呈現(xiàn)個人議題是如何成為公眾議題的。由此,個體的日常媒介話語實踐通過連接線上線下、匯聚個體注意力等而得以成為宏觀意識形態(tài)圖景。
(四)從理論驅(qū)動走向理論與數(shù)據(jù)驅(qū)動的結(jié)合
對于大數(shù)據(jù)分析與傳播規(guī)律把握的關(guān)系,理論驅(qū)動還是數(shù)據(jù)驅(qū)動始終存在爭論。一方面,理論是分析意識形態(tài)現(xiàn)象的基本出發(fā)點和立足點;另一方面,從數(shù)據(jù)中可以探索出一些傳播規(guī)律和現(xiàn)象,對其的解釋也要建立在理論基礎(chǔ)之上。目前,網(wǎng)絡(luò)意識形態(tài)的分析中,最常采用的方法是機(jī)器學(xué)習(xí)法。該方法可以直接從數(shù)據(jù)中辨識和提取特定的類型,基于實證數(shù)據(jù)做出智能決策。很多研究運用分類方法自動探測社交媒體中的帖子,以確定民主黨和共和黨的政治話語。例如,有監(jiān)督的學(xué)習(xí)算法運用訓(xùn)練集建構(gòu)數(shù)學(xué)模型,然后用該模型預(yù)測測試集。訓(xùn)練集由很多人工標(biāo)注和編碼的語料庫組成,如政治態(tài)度和傾向等。由此可以通過有監(jiān)督的機(jī)器學(xué)習(xí)對帖子的政治傾向進(jìn)行分類[21],進(jìn)而探測特定意識形態(tài)類團(tuán)、識別主要的對話機(jī)制。
當(dāng)然,對于數(shù)據(jù)背后反映的深刻意識形態(tài)內(nèi)涵,還需借助對意識形態(tài)話語、政治狀況等的深刻闡釋。在大數(shù)據(jù)與意識形態(tài)分析中,首先需要正視大數(shù)據(jù)分析中數(shù)據(jù)驅(qū)動存在的問題,在此基礎(chǔ)上正確理解大數(shù)據(jù)所反映的意識形態(tài)內(nèi)涵。不過,通過對特定時間針對特定主題的情感、行為或傳播特征和現(xiàn)象的系統(tǒng)化、實時性的分析,可以更加深刻地認(rèn)識其意識形態(tài)的某些面向。由此,數(shù)據(jù)驅(qū)動技術(shù)可促使意識形態(tài)分析達(dá)到預(yù)測和洞見這兩個更高的研究目標(biāo)。
二、大數(shù)據(jù)背景下意識形態(tài)研究的新機(jī)遇
從研究方法看,對意識形態(tài)的傳統(tǒng)分析最常用的是問卷調(diào)查的自我報告方法,通常情況下將意識形態(tài)操作化為議題態(tài)度,且大多將意識形態(tài)作為個性特征的一部分分析對其他因素的影響。這些分析雖一定程度上回答了意識形態(tài)的存在狀態(tài),但仍然存在局限性,而大數(shù)據(jù)分析方法在諸多方面為當(dāng)下意識形態(tài)研究提供了新機(jī)遇。
(一)多樣化意識形態(tài)及思潮得以涌現(xiàn)
以往研究大多沿著“左—右”連續(xù)統(tǒng)來分析意識形態(tài),主要有以下幾種方法:一是,通過自我設(shè)定的意識形態(tài)感知量表獲得,其可以測量普通政黨成員、候選人、法官等的意識形態(tài)[22],以及普通人的意識形態(tài)。一般采用7點量表,從最自由主義到最保守主義。二是,通過普通公眾對候選人的排名獲得。[23]三是,通過理想點(ideal points)獲得,也就是將普通公眾的意識形態(tài)與候選人或政治人物的意識形態(tài)位置相匹配。[24]四是,通過公眾的政治行為或者社會行為獲得,如有研究者通過競選捐贈數(shù)據(jù)評估候選人和捐贈者的意識形態(tài)。[25]
以左—右派為代表的理念性的意識形態(tài),雖然一定程度上與人們的大致思想狀態(tài)具有對應(yīng)關(guān)系,但是缺乏經(jīng)驗性。有研究者認(rèn)為應(yīng)該從實際出發(fā),通過自下而上的涌現(xiàn)方式來歸納意識形態(tài)社群。[26]例如,有研究通過對2010年美國選舉中期數(shù)據(jù)的分析,運用多維尺度和K-means方法發(fā)現(xiàn),美國公眾主要有5類意識形態(tài)傾向。第一類沒有特別的政治傾向;第二類是激進(jìn)主義;另外三類都不同程度反映了保守主義,但是有細(xì)微差別。第三類群體雖然是保守主義的,卻經(jīng)常使用左翼標(biāo)簽。第四類大部分是保守主義。第五類主要聚焦于茶黨和政治家。[27]也有研究者提出了探測Twitter用戶意識形態(tài)的方法,主要是根據(jù)其關(guān)注、提及和轉(zhuǎn)發(fā)鏈接獲得,并建構(gòu)了統(tǒng)一概率模型(unified probabilistic model);由此可以結(jié)合異質(zhì)性鏈接預(yù)測人們的意識形態(tài);也可以自動學(xué)習(xí)不同聯(lián)系的屬性以確定意識形態(tài)。[28]
(二)對群體層面意識形態(tài)的結(jié)構(gòu)性分析更加深入
在傳統(tǒng)意識形態(tài)中,多聚焦于意識形態(tài)的結(jié)構(gòu)等內(nèi)生性問題,其中作為個人特性的意識形態(tài)特征通常被認(rèn)為處于左或右的兩極,或者是自由主義和保守主義。但也有人認(rèn)為意識形態(tài)并不是兩極的,左或者右是兩個相互獨立的維度[29]。其他研究認(rèn)為,對于社會文化議題的態(tài)度在因子聚類中不同于經(jīng)濟(jì)議題[30],在具體分析中也分別從社會維度和經(jīng)濟(jì)維度測量政治意識形態(tài)。同時,意識形態(tài)也被作為自變量用于預(yù)測其他的政治行為和政治參與活動,如投票、捐贈、政治討論、新聞媒體使用等。例如,意識形態(tài)是話語表達(dá)的遠(yuǎn)端因素(distal factor),具有穩(wěn)定性和根本性。由此,意識形態(tài)作為個人特性對輿論等話語表達(dá)具有預(yù)測作用。
但是以往研究缺乏對意識形態(tài)群體結(jié)構(gòu)的深入分析。例如,對于政治極化的分析中,有研究認(rèn)為,過去幾十年美國人始終存在政治極化[31];但也有一些研究直接分析公眾的政治話題意見,認(rèn)為人們針對議題的討論從1970年開始并沒有過多的政治極化[32]。傳統(tǒng)調(diào)查一般測量個體層面的、靜態(tài)的極化,如黨派維度通過民主黨和共和黨的情感溫度指數(shù)(feeling thermometer index)的差異獲得;意識形態(tài)維度通過詢問意識形態(tài)位置獲得;議題維度等通過對特定議題(如同性戀結(jié)婚和醫(yī)療改革)的贊同程度獲得。[33]
在新媒體平臺上,極端主義意識形態(tài)被給予高度關(guān)注,包括辨識相關(guān)內(nèi)容帖子以及辨識極端主義用戶。具體可以通過情緒指標(biāo)的極端程度、詞語使用的極端程度、意識形態(tài)標(biāo)識等識別極化意識形態(tài)。由此可以把握群體層面的極化行為特征,并且動態(tài)分析極化群體的態(tài)度是否隨著時間而發(fā)生改變。例如,有研究通過對Twitter帖子的分層聚類分析和文本分析發(fā)現(xiàn),在極端主義人群中也存在跨意識形態(tài)交流。[34]除此之外,有研究分析社交媒體上白人極端主義意識形態(tài)用戶的特征和發(fā)布的帖子內(nèi)容;以及他們?nèi)绾卧谏缃幻襟w上擴(kuò)散他們的意識形態(tài)。[35]。也有研究分析了23個不同國家的90個政黨的討論網(wǎng)絡(luò),發(fā)現(xiàn)那些具有極端意識形態(tài)的個人和政黨更可能在社交媒體上形成回應(yīng)室。[36]
值得注意的是,如何辨識極端意識形態(tài)是這些研究的基礎(chǔ)工作。有研究提出了辨識社交媒體用戶極端意識形態(tài)的方法和路徑。在辨識相關(guān)情緒性內(nèi)容過程中,主要包括特征提取、帖子檢索(積極、消極帖子)、網(wǎng)絡(luò)創(chuàng)建、用戶中心性計算、以及用戶中心性集成等步驟。[37]具體來看,首先辨識那些體現(xiàn)極端主義意識形態(tài)的帖子,以及反極端主義意識形態(tài)的帖子;然后建構(gòu)權(quán)重網(wǎng)絡(luò)來模擬所辨識的帖子在不同發(fā)布者之間的流動軌跡(信息流);接著運用不同的節(jié)點中心性指標(biāo)來評估用戶在擴(kuò)散極端主義意識形態(tài)和反極端主義意識形態(tài)的中起到的作用,那些較多擴(kuò)散極端主義意識形態(tài)的人則被認(rèn)為傳播了極端主義觀點;最后,通過實證方法評估這一分析路徑是否適合于分析現(xiàn)實社交媒體帖子的極化狀況。[38]
(三)對跨意識形態(tài)交流現(xiàn)象的分析更加具有過程性和動態(tài)性
跨意識形態(tài)交流研究具有很久的傳統(tǒng),其關(guān)系到公共領(lǐng)域的發(fā)展、傳播的民主化、傳播的社會功能等結(jié)構(gòu)性問題。以往對跨群體接觸效應(yīng)的研究很大程度依賴于調(diào)查問卷,測量政治行為,以及傳播網(wǎng)絡(luò)特征。[39]調(diào)查詢問被試與之互動的對象,具體包括他們的意識形態(tài)以及討論次數(shù)。但被訪者通常不可能列出所有互動關(guān)系,弱關(guān)系很可能被排除。同時,被訪者自我報告的關(guān)系可能有偏誤,有研究發(fā)現(xiàn),傳播網(wǎng)絡(luò)中的關(guān)系準(zhǔn)確性低于50%。[40]更為重要的是,這些調(diào)查數(shù)據(jù)大多靜態(tài)呈現(xiàn)了不同意識形態(tài)群體是否能夠?qū)υ掃@一結(jié)果,而無法突出互動過程及其動態(tài)性。
新媒體平臺中可以運用鏈接、互動等呈現(xiàn)用戶接觸對立意識形態(tài)的狀況。以鏈接為例,可以考察帖子是否有鏈接、鏈接內(nèi)容來源(如組織化媒體、草根網(wǎng)站、政府網(wǎng)站等),進(jìn)而可以根據(jù)帖子的政治傾向,以及鏈接內(nèi)容的傾向作對應(yīng)分析。由此,鏈接成為不同意識形態(tài)用戶進(jìn)行溝通的“橋梁”和“紐帶”。也有研究運用被動攻擊算法(passive-aggressive algorithm)并計算TF-IDF值對兩個黨派的帖子進(jìn)行區(qū)分;在此基礎(chǔ)上,對基于轉(zhuǎn)發(fā)同一條帖子的人建立互動關(guān)系,選擇有出度關(guān)系的節(jié)點并建構(gòu)網(wǎng)絡(luò)。網(wǎng)絡(luò)中個體指向同類屬性的出度關(guān)系的數(shù)量除以整體出度關(guān)系數(shù)量,就可以獲得網(wǎng)絡(luò)的政治同質(zhì)化程度。[41]同時,也可以根據(jù)互動關(guān)系發(fā)現(xiàn)意識形態(tài)社群社區(qū)和互動網(wǎng)絡(luò),有研究針對Twitter中的10個爭論性政治話題,運用Clauset Newman Moore Algorithm社區(qū)發(fā)現(xiàn)算法,辨識網(wǎng)絡(luò)中的主要類團(tuán)。主要是基于用戶的互動關(guān)系模型,將用戶置于最適合他們的類團(tuán)中。[42]研究發(fā)現(xiàn),Twitter用戶不可能接觸來自于他們所關(guān)注的類團(tuán)中的對立意識形態(tài)內(nèi)容。相比之下,用戶更可能與草根網(wǎng)頁(如博客)相連接,而與傳統(tǒng)媒體網(wǎng)站的連接較少。[43]
當(dāng)然,也有研究發(fā)現(xiàn),不同意識形態(tài)的交流是可能的,只是存在量的差異而已。在網(wǎng)絡(luò)信息接觸中,從隨機(jī)到潛在存在、再到接觸、最后到閱讀點擊這一過程,跨意識形態(tài)內(nèi)容的接觸比例不斷減少。起初網(wǎng)絡(luò)中信息內(nèi)容存在較大的意識形態(tài)差異;但是異質(zhì)性朋友接觸不同意識形態(tài)立場內(nèi)容的比例會降低;而通過算法排名,人們接觸到不同意識形態(tài)內(nèi)容的比例更會降低;在此基礎(chǔ)上,人們再主動選擇內(nèi)容進(jìn)行點擊和閱讀,但是這一比例更低。[44]由此,可以更加動態(tài)、清晰地呈現(xiàn)跨意識形態(tài)交流的過程,以及跨意識形態(tài)交流存在的條件和情境。
(四)網(wǎng)絡(luò)意識形態(tài)的跨國比較研究成為可能
網(wǎng)絡(luò)環(huán)境下,不同國家意識形態(tài)呈現(xiàn)出了不同的存在狀態(tài)。右翼勢力在全球擴(kuò)散、跨越國界傳播其意識形態(tài);與此相對的是,也有國家呈現(xiàn)明顯的左翼傾向;而在意識形態(tài)對立特別明顯的美國,意識形態(tài)與黨派、媒體等相互作用的語境下,呈現(xiàn)了更加碎片化的意識形態(tài)圖景[45]。同時,全球民粹主義話語不斷崛起,在美國和歐洲一些國家,右翼民粹主義與種族主義、反自由主義、排外主義相互纏繞。[46]
意識形態(tài)是一個全球問題,由于網(wǎng)絡(luò)數(shù)據(jù)的可獲得性比較高,以及意識形態(tài)通過網(wǎng)絡(luò)擴(kuò)散等,意識形態(tài)的跨國比較以及全球擴(kuò)散現(xiàn)象引起了關(guān)注。例如,有研究分析了極端右翼在不同國家的異同點。該研究結(jié)合歐洲國家(奧地利、法國、德國、英國、意大利、西班牙)代表性極端右翼組織的54位人物的訪談,以及對美國336個右翼網(wǎng)站的內(nèi)容分析發(fā)現(xiàn),極端右翼群體運用互聯(lián)網(wǎng)吸引新成員,運用有吸引力的網(wǎng)站和互動元素(如調(diào)查、聊天、論壇)向意識形態(tài)類似的人宣傳其思想。[47]也有研究者嘗試分析社交媒體如何減少大眾的政治極化問題,為了避免大眾政治極化中可能存在的天花板效應(yīng)和地板效應(yīng)(ceiling and floor effects),選擇了三個政治極化程度具有差異的國家:德國、西班牙、美國。在德國,輿論不太極端;相反,美國呈現(xiàn)了高度的意識形態(tài)極化現(xiàn)象;而西班牙介于二者之間,盡管在過去幾年西班牙極端化更加嚴(yán)重,但是仍然處于低水平。[48]這些跨國比較研究主要是基于網(wǎng)站和社交媒體中帖子的分析獲得,而這在傳統(tǒng)環(huán)境下很難實現(xiàn)。
三、運用大數(shù)據(jù)分析方法研究意識形態(tài)的路徑
在社交媒體平臺上,各種平臺設(shè)置因素將不同時空中的個人鏈接起來。標(biāo)簽、關(guān)鍵詞設(shè)置、超鏈接、點贊、轉(zhuǎn)發(fā)等象征符號,反映了實踐這些符號的個人或者群體之間的關(guān)系。網(wǎng)絡(luò)中內(nèi)容通過個人的媒介互動實踐得以串聯(lián)并產(chǎn)生影響;個人之間通過內(nèi)容的鏈接產(chǎn)生話語關(guān)系。在意識形態(tài)的分析中,主要使用的象征符號包括詞語標(biāo)簽、互動鏈接等,基于此的大數(shù)據(jù)分析方法包括對詞語標(biāo)簽的內(nèi)容分析、對互動關(guān)系的社會網(wǎng)絡(luò)分析以及將二者結(jié)合的路徑分析。
(一)基于詞語標(biāo)簽的內(nèi)容分析
語言能夠反映公眾的人口特征、心理狀態(tài)或者偏好,包括意識形態(tài)。一般來講,不同意識形態(tài)群體可能使用不同的詞匯。同時,標(biāo)簽使用戶能夠定位自己,是個人在議題事件中的身份象征;個人可以通過搜索標(biāo)簽參與更大的網(wǎng)絡(luò)社區(qū),這加強(qiáng)了與相同興趣他者的聯(lián)系。最終,標(biāo)簽將同類意識形態(tài)的人聚集起來,最終或者形成特定的黨派聚類、或者形成特定議題觀點的聚類。研究中可以基于分享的標(biāo)簽使用考察社交媒體(如Twitter)中如何形成不同意識形態(tài)的類團(tuán)。[49]具體來看,可以運用探索性語言或者標(biāo)簽找到區(qū)分不同意識形態(tài)特性因素的話題[50],或者找到那些能夠辨識黨派政治立場的詞語[51],這有助于更好地理解意識形態(tài)心理抑或傳播模式影響不同議題的傳播和擴(kuò)散。[52]
不同意識形態(tài)群體在詞語使用上有所不同。有研究發(fā)現(xiàn),詞用法的頻率和詞尾頻率在不同互動社群中有所不同,Twitter用戶的語言風(fēng)格也隨著互動對象的不同而有所不同。[53]也有研究發(fā)現(xiàn),保守主義帖子中較多出現(xiàn)的詞匯是宗教類的(如上帝、天堂、神圣、靈魂、祈禱)以及家庭關(guān)系的(叔叔、兒子)。極端自由主義較多運用形容詞(擔(dān)心、恐懼、害怕、焦慮),副詞和連詞,以及比較性質(zhì)的詞匯。極端保守主義的帖子中所呈現(xiàn)的積極情緒(喜悅、驚奇)都要多于自由主義的積極情緒,而極端自由主義更常使用焦慮類詞匯。關(guān)于政治方面,極端保守主義主要提到的是黨派保守主義媒體,如??怂剐侣劸W(wǎng)和雅虎新聞(@foxnews,@yahoonews);而極端自由主義聚焦于議題,如同性戀、種族主義、女性主義、跨性別者。[54]這些表明了保守主義帖子可以更好地辨識同類性質(zhì)的個人和群體,而自由主義則運用平臺討論相關(guān)議題。由此,對社交媒體平臺中帖子的分析可以作為評判意識形態(tài)的重要路徑和方式。也有研究者提出了一系列語言規(guī)則來辨識文本中承載的意識形態(tài)屬性,并將這些規(guī)則運用于自然語言處理系統(tǒng)。[55]
對于詞語和標(biāo)簽的分析,最常用的是主題模型,其可以識別重要的討論議題。目前常用的話題模型有LDA主題模型,其基本原理是,每一篇文檔代表了一些主題所構(gòu)成的一個概率分布,而每一個主題又代表了很多詞語所構(gòu)成的一個概率分布,由此確定文檔中的主題。當(dāng)然,每個文檔可能同時具有多個話題,可以根據(jù)擬合好的話題模型計算單個文檔中不同話題的概率分布,進(jìn)而選擇特定話題對應(yīng)的典型文本,并據(jù)此評估模型的有效性。[56]在具體執(zhí)行中,首先需要對文本進(jìn)行預(yù)處理,包括分詞與去除停用詞等,以及根據(jù)研究的特定需要刪除其他類型的詞匯。其次,根據(jù)研究目的尋找話題個數(shù)以及擬合話題模型,并將擬合后的模型與人工標(biāo)注的進(jìn)行對比,以考察機(jī)器學(xué)習(xí)的準(zhǔn)確性是否能夠滿足研究的特定需要。
(二)基于互動關(guān)系的網(wǎng)絡(luò)分析
社交媒體平臺中顯性的互動功能設(shè)置是轉(zhuǎn)發(fā)、提及@、評論等。評論是一對多互動,轉(zhuǎn)發(fā)提高了內(nèi)容可見性,提及在信息流中直接強(qiáng)調(diào)了特定用戶。[57]同時,也可以進(jìn)行共現(xiàn)分析(cooccurrence),即同時提到目標(biāo)標(biāo)簽或詞語的兩個標(biāo)簽或詞語共同出現(xiàn)的現(xiàn)象,進(jìn)而可以對不同標(biāo)簽或詞語共現(xiàn)構(gòu)成的網(wǎng)絡(luò)進(jìn)行分析。
通過社會網(wǎng)絡(luò)分析法可以探測比較重要的互動關(guān)系群。具體采用社群偵探(community detection)方法對互動關(guān)系進(jìn)行聚類,以找到不同類型的社群。例如,有研究者運用標(biāo)簽傳播算法(Label Propagation Method)以探測轉(zhuǎn)發(fā)網(wǎng)絡(luò)和提及網(wǎng)絡(luò),并分析其網(wǎng)絡(luò)結(jié)構(gòu)。該算法的核心思想是,將一個節(jié)點的鄰居節(jié)點的標(biāo)簽中數(shù)量最多的標(biāo)簽作為該節(jié)點自身的標(biāo)簽。[58]就是說,可以通過數(shù)據(jù)驅(qū)動的方式涌現(xiàn)出特定議題或者互動關(guān)系的網(wǎng)絡(luò)社群。進(jìn)而可以通過知識圖譜的方式考察不同社群之間是否能夠交流、社群內(nèi)部的關(guān)系緊密程度和互動程度;也可以探討特定類型用戶的互動網(wǎng)絡(luò)結(jié)構(gòu)等。
通常社區(qū)發(fā)現(xiàn)具有三個評估指標(biāo):標(biāo)準(zhǔn)化互信息(NIMI),ARI指標(biāo),以及模塊度(modularity)。有研究者運用模塊度作為社區(qū)發(fā)現(xiàn)的評估指標(biāo),該指標(biāo)提供了意識形態(tài)分化的測量,也可以衡量社區(qū)劃分質(zhì)量的高低。模塊度越大表明社區(qū)劃分效果越好。研究發(fā)現(xiàn),政治轉(zhuǎn)發(fā)網(wǎng)絡(luò)具有較高的分離性黨派結(jié)構(gòu),左派和右派使用者的聯(lián)系非常有限。用戶提及網(wǎng)絡(luò)中,主要由一個政治異質(zhì)性類團(tuán)構(gòu)成,其中具有對立意識形態(tài)的人相互交流程度要高于轉(zhuǎn)發(fā)網(wǎng)絡(luò)。[59]
(三)基于內(nèi)容和互動的路徑分析
意識形態(tài)的本質(zhì)可以簡化為這樣一些追問:我們是誰,我們屬于哪個群體,我們與哪個群體有關(guān)系。大數(shù)據(jù)意識形態(tài)分析中,可以運用關(guān)系數(shù)據(jù)預(yù)測意識形態(tài)屬性,這些關(guān)系數(shù)據(jù)能夠反映不同意識形態(tài)交流或互動的過程和結(jié)構(gòu)。但是,社會網(wǎng)絡(luò)分析法存在一定的缺陷,其過于強(qiáng)調(diào)社會網(wǎng)絡(luò)這一形式,很大程度上可能忽略了網(wǎng)絡(luò)承載的文化、政治、社會意涵。由此,在網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,納入主題模型和意義分析模型便顯得尤為重要了。
路徑分析中不僅承載著互動關(guān)系,也承載著互動內(nèi)容。為了強(qiáng)調(diào)互動網(wǎng)絡(luò)中是否討論的內(nèi)容也較為重要,有研究為每位用戶設(shè)置了人物特征,該向量包括用戶帖子中出現(xiàn)的所有標(biāo)簽,根據(jù)出現(xiàn)頻率設(shè)置權(quán)重;然后計算每一對“用戶-特征”之間的余弦相似性(cosine similarities),包括同一類團(tuán)中的以及不同類團(tuán)中“用戶-特征”的關(guān)系對。研究發(fā)現(xiàn),在提及網(wǎng)絡(luò)中,同一類團(tuán)中的不同用戶(用戶-間接的余弦相似性)最高,高于不同類團(tuán)之間的相似性。在轉(zhuǎn)發(fā)網(wǎng)絡(luò)中,特定類團(tuán)內(nèi)部的余弦相似度有所不同,而不同類團(tuán)之間的用戶相似性最低。結(jié)果是,轉(zhuǎn)發(fā)類團(tuán)中的平均相似度要高于不同類團(tuán)相似度。[60]由此表明,這種建立在互動基礎(chǔ)之上的社群是因為同一話題(內(nèi)容)而展開的互動,還是其他原因進(jìn)行的互動。更進(jìn)一步,這種建立在互動基礎(chǔ)之上的社群,可以探討其內(nèi)容和態(tài)度方面是否存在實質(zhì)性的分化。在這些基于內(nèi)容的互動關(guān)系中,通過對同一條帖子在不同用戶之間的傳播,可以找到某帖子的傳播路徑和軌跡,以及該傳播路徑中重要的關(guān)鍵用戶;也可以判斷某個標(biāo)簽在一定時間內(nèi)被轉(zhuǎn)發(fā)和分享的次數(shù),以及該話題的發(fā)端、發(fā)展、高潮、結(jié)局等重要時間點,由此可以更好地把握現(xiàn)實事件與傳播路徑之間的關(guān)系規(guī)律。
上層建筑的意識形態(tài)與公眾的意識形態(tài)具有不同的存在狀態(tài)和傳播邏輯。當(dāng)下公眾通過網(wǎng)絡(luò)等傳播工具進(jìn)行話語表達(dá),并通過網(wǎng)絡(luò)工具將不同話語聯(lián)結(jié),由此意識形態(tài)得以擴(kuò)散和傳播。這一定程度上反映了公眾社會意識通過自下而上的方式得以涌現(xiàn),運用大數(shù)據(jù)思維及具體分析方法可對其進(jìn)行挖掘和分析。
從方法層面看,傳統(tǒng)意識形態(tài)分析主要運用問卷調(diào)查的自我報告方法,這種方法受回答場景的限制,也受題目設(shè)置的影響,意識形態(tài)測量的信度和效度可能并不是很高。同時,自我報告無法獲取和了解回答者的無意識行為,也會存在社會期望偏差和測量對等性等問題,造成獲得虛假答案的可能。[61]而社會化媒體平臺中的數(shù)據(jù)一定程度上可以克服以上缺陷。具體來看,基于用戶網(wǎng)絡(luò)表達(dá)和使用行為,可以推測其意識形態(tài);基于社交媒體的社交互動數(shù)據(jù),可以更好地建構(gòu)互動類團(tuán),從而分析網(wǎng)絡(luò)的結(jié)構(gòu)性特征及其對意識形態(tài)的意義;基于實時信息流和動態(tài)數(shù)據(jù),可以看到用戶發(fā)布的信息以及政治活動,測量傳播網(wǎng)絡(luò)中意識形態(tài)分布如何隨著時間而改變。[62]
盡管社交媒體數(shù)據(jù)無法完全再現(xiàn)整個群體的意識形態(tài)圖景,但這并不影響這些數(shù)據(jù)分析的研究價值。大數(shù)據(jù)與意識形態(tài)關(guān)系的闡釋中主要遇到以下問題:人口偏差和特定內(nèi)容的偏差,導(dǎo)致不同意識形態(tài)的話語表達(dá)很大程度上很難找到對比的平衡點。同時,研究實踐中存在倫理和個人隱私問題,與預(yù)測和工程相關(guān)的理論和推理價值問題、適宜和嚴(yán)格的推理模式的應(yīng)用問題等[63],這要求研究者要更加通過數(shù)據(jù)洞察其背后的社會現(xiàn)象和傳播機(jī)理。除此之外,特別要注意以下兩個方面對意識形態(tài)研究可能帶來的系統(tǒng)性影響。
第一,現(xiàn)實意識形態(tài)和網(wǎng)絡(luò)意識形態(tài)依然存在某種偏差。社交媒體是一個創(chuàng)造和傳播理想自我的平臺[64],用戶根據(jù)這種理想的虛擬身份進(jìn)行話語表達(dá),但這并未真實反映他們的個性特征及意識活動。依此推理,或許社交媒體平臺上的意見表達(dá)受到了情境性因素的影響,而非是對意識形態(tài)的直觀反映。因為新媒體語境下,意見表達(dá)除了受到深層意識形態(tài)的影響之外,也受到情境、情感、場景等啟發(fā)性(heuristic)因素的影響。例如,在新媒體語境下,用戶對網(wǎng)絡(luò)內(nèi)容的消費,很大程度上取決于網(wǎng)絡(luò)認(rèn)可度和網(wǎng)絡(luò)討論等啟發(fā)性信號的影響,而不一定受到意識形態(tài)的決定性影響。[65]由此,現(xiàn)實意識形態(tài)與網(wǎng)絡(luò)議題態(tài)度之間存在偏差的可能性更大。
第二,社交網(wǎng)站存在的虛假賬號可能導(dǎo)致意見抓取呈現(xiàn)系統(tǒng)性偏差。目前,社交網(wǎng)站中存在大量的模仿人類行為進(jìn)行自動化交互的軟件程序,如social bots[66]。這些虛擬賬號有自己的個性標(biāo)簽、社交關(guān)系,能夠基于自然語言處理、文本挖掘、人工智能等發(fā)布帖子和表達(dá)意見,也能夠進(jìn)行簡單的互動行為,如點贊等。高級的虛擬賬號還可以借助網(wǎng)絡(luò)中大量的信息流和知識圖譜等獲取相關(guān)信息、熱點事件等。而這些技術(shù)和系統(tǒng)若被政治組織利用,很大程度上會影響和扭曲研究者對于意識形態(tài)狀況的判斷。盡管目前有一些社交平臺開發(fā)專門的識別系統(tǒng),以判斷帖子是機(jī)器還是人工發(fā)送的,對于虛假賬號可能影響話語表達(dá)氛圍、甚至影響對意識形態(tài)的客觀判斷的現(xiàn)象,研究者應(yīng)該保持警覺和反思。
本文來源:《新聞界》:http://www.12-baidu.cn/w/zw/1514.html
欄目分類
- 館藏《(增修)施南府志》的修復(fù)與保存
- 紙媒介在平面設(shè)計創(chuàng)作中的應(yīng)用與教學(xué)方法探討
- 廣電媒資從紙質(zhì)向數(shù)字化轉(zhuǎn)型中的敘事重構(gòu)研究
- 空間設(shè)計教學(xué)中紙藝技術(shù)的創(chuàng)意應(yīng)用與學(xué)生創(chuàng)新能力培養(yǎng)
- 人工智能驅(qū)動下的紙質(zhì)出版智能化轉(zhuǎn)型:技術(shù)融合與創(chuàng)新路徑
- 非遺傳統(tǒng)手工藝中紙張應(yīng)用的技術(shù)體系與活態(tài)傳承策略
- 紙藝術(shù)的跨文化符號:中西方剪紙的英譯對比研究
- 數(shù)智時代非物質(zhì)文化遺產(chǎn)的保護(hù)與傳承路徑——以河南剪紙為例
- 基于環(huán)保視角的紙制品企業(yè)廢物管理與再利用策略
- 圖書館紙質(zhì)文獻(xiàn)數(shù)字化存儲平臺的優(yōu)化設(shè)計與文件管理方法研究
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認(rèn)定!CSSCI南大核心首批191家“青年學(xué)者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了