小議識別網(wǎng)絡(luò)新聞“標(biāo)題黨”
我們通常認(rèn)為,在網(wǎng)絡(luò)上,一篇新聞報道要想獲得較高的點(diǎn)擊量,必須有吸引人的標(biāo)題、優(yōu)質(zhì)的內(nèi)容、廣泛的推廣渠道,相比于內(nèi)容和渠道,對標(biāo)題的再加工無疑是成本最小、收效最大的。隨著網(wǎng)絡(luò)信息的膨脹與快速變化,僅僅為吸引人眼球的標(biāo)題黨談不上任何創(chuàng)新創(chuàng)意,也絕無過人之處,有的只是罔顧事實(shí),誤導(dǎo)輿論。網(wǎng)絡(luò)新聞標(biāo)題黨雖然能夠博人眼球,但是卻失去了新聞報道最重要的功用——保障知情、輿論監(jiān)督、促進(jìn)公正,對于新聞輿論的公信力也是極大損傷。
本文首先介紹了網(wǎng)絡(luò)新聞標(biāo)題黨出現(xiàn)的原因及其危害,通過對幾個典型的標(biāo)題黨新聞的分析來探究標(biāo)題黨新聞識別技術(shù)的主要目的,介紹當(dāng)前國內(nèi)主要標(biāo)題黨新聞識別技術(shù),厘清標(biāo)題黨新聞識別的主要方法,指出這些方法存在的問題和局限性。最后,針對如何更好地進(jìn)行標(biāo)題黨新聞識別提出了一些自己的見解,希望標(biāo)題黨識別技術(shù)能夠在將來變得更加完善、高效,在一定程度上阻止標(biāo)題黨新聞的傳播,提高受眾者的閱讀品質(zhì)。
一、何為“標(biāo)題黨”
眾所周知,標(biāo)題是新聞的眼睛,在當(dāng)前信息化快速發(fā)展的時代中,人們接受新聞的方式呈現(xiàn)出多樣性,出現(xiàn)5秒效應(yīng)或者看新聞看題的提法,這種情況下在一定程度上體現(xiàn)出了新聞標(biāo)題的作用。此外,在網(wǎng)絡(luò)新聞中標(biāo)題同樣需要加以關(guān)注,只有如此才能讓快速抓住受眾,完成引導(dǎo)活動,形成良好閱讀,換而言之,現(xiàn)階段網(wǎng)絡(luò)新聞的競爭主要體現(xiàn)在網(wǎng)絡(luò)新聞標(biāo)題的競爭之上。
《現(xiàn)代漢語詞典》(第六版)中并沒有收錄“標(biāo)題黨”這一詞條。一般認(rèn)為,“標(biāo)題黨”是發(fā)端于網(wǎng)絡(luò)論壇,發(fā)帖者為吸引人氣,提高帖子的點(diǎn)擊量而制作博人眼球標(biāo)題的網(wǎng)絡(luò)貼主群體或行為?!皹?biāo)題黨”可以說是這樣一些信息發(fā)布和轉(zhuǎn)發(fā)行為、人群的總稱。 “標(biāo)題黨”的目的不是為傳播信息本身,而是為了引起關(guān)注,獲取更多的經(jīng)濟(jì)利益。網(wǎng)編們?yōu)榱嗽诤A康男畔⒅挟愜娡黄?獲取點(diǎn)擊率,爭取到好的排位,有更多的廣告收益,紛紛仿效廣告業(yè)“標(biāo)題黨”的手法將大量新聞標(biāo)題重新包裝,挖空心思“嘩眾取寵”,大量“題不對文”的新聞標(biāo)題就此出籠。從特點(diǎn)上分析,標(biāo)題黨具有兩個特征,第一是夸大性:主要是對文章內(nèi)容進(jìn)行夸大,以此起到吸引受眾眼球的作用;第二是作假型:標(biāo)題與文章的內(nèi)容有所差別,內(nèi)容描述的是另外一個事實(shí),但是為了提高受眾的注意力,則將標(biāo)題設(shè)定為其它內(nèi)容,起到吸引的作用。無論哪一個特點(diǎn),均在一定程度上反映出了標(biāo)題黨這種現(xiàn)象沒有遵循新聞的實(shí)際情況,也沒有符合新聞發(fā)展的要求,長此久往則會導(dǎo)致新聞呈現(xiàn)出缺陷與不足,甚至在新時期讓人們對新聞形成不良情緒。
二、標(biāo)題黨新聞識別的必要性
原標(biāo)題:“大胸”比“平胸”更易患乳癌
記者獲悉,中國女性超過一半是致密性乳腺,患乳腺癌的風(fēng)險比脂肪性乳腺高4.7倍,而且,密集的腺體易掩蓋早期癌癥病癥。這是因為,亞洲女性的乳房相對較小,且以致密性乳房為主。以致密性乳腺為主的亞洲女性,如果只用手動超聲做為第一線做乳腺癌篩查,可能會存在一定的漏診。
析因:超過50%的中國女性是致密性乳腺
在中國,超過50%的女性具有致密性乳腺。擁有致密性乳腺的女性,相對于脂肪性乳腺的女性,罹患乳腺癌的風(fēng)險高4.7倍。(節(jié)選)
這種新聞就是典型的“標(biāo)題黨”!全篇新聞沒有一次出現(xiàn)“大胸”、“平胸”,但在標(biāo)題中卻出現(xiàn)了“‘大胸’比‘平胸’更容易患乳腺癌”的結(jié)論,簡直是驚為天人。本來一個“中規(guī)中矩”的標(biāo)題,在他們手下,就變了大樣。 “標(biāo)題黨”抓住人們“掃視”新聞的這一心理,誤導(dǎo)大眾,不明事實(shí)真相的“吃瓜群眾”將這種不經(jīng)過大腦分析的消息通過網(wǎng)絡(luò)傳播給他人,以訛傳訛,謠言就產(chǎn)生了。從另外一個角度分析,如果這種文章傳輸給受眾,則會讓受眾無法辨別其真實(shí)性,甚至還會產(chǎn)生抵觸心理,嚴(yán)重影響了新聞的真實(shí)性以及全面性。除此之外,在當(dāng)前的發(fā)展背景下,需要清楚的認(rèn)識到標(biāo)題黨所帶來的影響,并且能夠從本質(zhì)出發(fā),從新聞識別的方式出發(fā),對標(biāo)題黨新聞的識別方法進(jìn)行對比與分析,這樣才能真正提高新聞的可行性以及創(chuàng)新性。
三、標(biāo)題黨新聞識別方法介紹及對比
1、基于主題句分布的標(biāo)題黨新聞識別算法
在新聞標(biāo)題與主題內(nèi)容相關(guān)程度研究方面,國內(nèi)有學(xué)者對“標(biāo)題黨”類新聞的識別進(jìn)行了研究,王志超提出中提出了一種基于內(nèi)容主題句相似度的“標(biāo)題黨”新聞識別方法: 首先從正文中提取出可能反映正文主題的句子集合,再分別計算它們與標(biāo)題的相似度,并以最大相似度作為評價參數(shù)。這種方法歸根到底是網(wǎng)頁信息抽取→主題句提取→句子相似度計算。但這個方法對于“以偏概全”的新聞難以達(dá)到較好的識別作用。它對一些同義詞以及未登錄詞、專有名詞無法很好地識別。比如林俊杰演唱會的報道中同時出現(xiàn)“林俊杰”和“JJ”,他們是一個人,但是基于主題句的識別方法認(rèn)為兩個詞不相關(guān),句子相似度計算出現(xiàn)誤差。這種方法終究沒有避免 TF-IDF只考慮上下文統(tǒng)計特性而不考慮語義信息的局限。漢語句子的表達(dá)形式是多種多樣的,如果要準(zhǔn)確地刻畫一個句子所表達(dá)的意思,還應(yīng)該結(jié)合語法結(jié)構(gòu)信息。所以在進(jìn)行新聞報道的時候,需要多角度的分析與研究,并且要從本質(zhì)商除法,對主題句分布的標(biāo)題黨新聞識別加以重視,如此才能實(shí)現(xiàn)新聞報道的有效與全面。
2、基于主題詞分布的識別算法
考慮到主題句識別算法的短板,又有學(xué)者引入了基于主題詞分布的新聞識別算法。首先從新聞標(biāo)題中提取出最能反映標(biāo)題中心含義的主題詞。再分析主題詞在新聞?wù)闹械姆植记闆r,最后根據(jù)分布情況計算出是正常新聞的概率,從而判斷是否為標(biāo)題黨新聞。這個算法考慮到短語結(jié)構(gòu)分析和依存句法分析,分析句子結(jié)構(gòu)對主題詞集合K的形成提供了幫助。但是這個方法也存在一些問題,根據(jù)依存句法所構(gòu)建的24種關(guān)系詞典都可以進(jìn)行二次處理嗎?在對多名詞短語處理時如何確定這個名詞短語是否過濾?
北京飯館老板換大招牌迎接奧運(yùn)
“北京飯館老板”為并列名詞,處理后變?yōu)?“老板換大招牌迎接奧運(yùn)
萬一作者強(qiáng)調(diào)的重點(diǎn)就是這個“北京老板”喜迎奧運(yùn)呢?這種情況該如何識別?
3、基于潛在語義的標(biāo)題黨新聞識別算法
這種標(biāo)題黨識別技術(shù)以潛在語義分析算法為理論基礎(chǔ)、以矩陣的奇異值分解為核心。這種方法的優(yōu)點(diǎn)有以下幾點(diǎn):1.可消除無關(guān)詞語的干擾。 2.抽取正文簡單有效。3.從與新聞標(biāo)題相關(guān)的段落數(shù)占總段數(shù)的比值,以及這些段落內(nèi)容總長度占新聞?wù)目傞L度的比值兩個角度對目標(biāo)新聞內(nèi)容進(jìn)行雙重判定。這種方法有是有明顯的局限性的,(1)網(wǎng)頁新聞布局結(jié)構(gòu)造成識別誤差(2)分詞詞典具有局限性,人名、地名、網(wǎng)絡(luò)詞匯等未登錄詞無法正確識別。
從總體上看,這三種方法都有各自明顯的優(yōu)勢和缺點(diǎn),如果能將主題詞識別新聞技術(shù)和潛在語義識別新聞技術(shù)結(jié)合起來使用,應(yīng)該是很有幫助的。在提取新聞?wù)暮瓦M(jìn)行分詞的過程中我認(rèn)為還有一些問題需要注意:
1、 現(xiàn)在的網(wǎng)頁不只包含新聞?wù)?,網(wǎng)頁兩邊還會有廣告,正文下方還會有“相關(guān)推薦”。這部分信息肯定會干擾關(guān)鍵詞的識別,那該如何篩除這部分信息?
2、 在對標(biāo)題、正文進(jìn)行切詞時,應(yīng)該采用多種分詞算法相結(jié)合的方法。如切分“北京大學(xué)生運(yùn)動會今日開幕”這樣的句子,可以使用正、逆向最大匹配方法,得到粒度更細(xì)的分詞結(jié)果。但是雙向最大匹配無法發(fā)現(xiàn)鏈長為偶數(shù)的交集型歧義,那么可以增加回溯機(jī)制。
3、 分詞詞典是進(jìn)行標(biāo)標(biāo)題識別不可缺少的部分,未登錄詞、新詞語、方言詞難以識別是造成識別率較低的原因之一。建立動態(tài)分詞詞典和語料庫就是我們必須要提上日程的事。同時,現(xiàn)在的新聞標(biāo)題,尤其是網(wǎng)絡(luò)新聞標(biāo)題中大量使用字母詞,對字母詞的識別也是我們需要注意的。
4、 在《基于潛在語義分析的標(biāo)題黨新聞識別技術(shù)研究》中,作者使用了基于詞頻統(tǒng)計的方式。但是,僅僅考慮新聞的分詞單位和段落之間的關(guān)系是不夠的,還需要了解分詞單位與其上下文之間的關(guān)系。這時可以利用TF·IDF算法來計算各單位對于各個段落的重要程度。 所以無論從哪一個角度分析,均可以清楚的認(rèn)識到在網(wǎng)絡(luò)新聞標(biāo)題是十分關(guān)鍵的,需要多加關(guān)注與研究,加強(qiáng)分析與研究,避免出現(xiàn)標(biāo)題黨現(xiàn)象的發(fā)生。
四、結(jié)語
總而言之,在當(dāng)前時代的不斷發(fā)展下,網(wǎng)絡(luò)新聞標(biāo)題語中存在很多不規(guī)范的地方。這些不規(guī)范的現(xiàn)象產(chǎn)生了許多消極的影響,嚴(yán)重破壞了語言的純潔性,尤其是標(biāo)題黨的出現(xiàn),沒有遵循新聞的基本要求,也沒有從本質(zhì)出發(fā),實(shí)現(xiàn)新聞傳播的有效性,故此本文通過對網(wǎng)絡(luò)新聞標(biāo)題黨識別算法進(jìn)行簡單分析和比較,對網(wǎng)絡(luò)新聞標(biāo)題的識別情況有一個整體性的了解和認(rèn)識,發(fā)現(xiàn)了新聞標(biāo)題黨識別技術(shù)在使用上存在的一些問題,并提出相關(guān)的意見和建議。雖然現(xiàn)在已經(jīng)出現(xiàn)多種識別網(wǎng)絡(luò)新聞標(biāo)題黨識別的技術(shù),但是它們都存在或多或少的問題,對于這方面的研究還需要繼續(xù)深入,我們能做的還有很多。
本文來源:《文學(xué)教育》:http://m.00559.cn/w/wy/63.html
欄目分類
- 馬克思主義與中國現(xiàn)代化關(guān)系探析
- 大學(xué)英語教育中的信息技術(shù)應(yīng)用研究
- 我國合作醫(yī)療制度的演進(jìn)及發(fā)展現(xiàn)狀研究
- 鑄牢中華民族共同體意識的理論背景、時代價值與實(shí)踐路徑
- 面向大學(xué)生就業(yè)的管理心理學(xué)課程改革研究
- 區(qū)域國別學(xué)人才全球勝任力培養(yǎng)的路徑探索
- 公立醫(yī)院黨建工作對醫(yī)院高質(zhì)量發(fā)展的啟示
- 新政府會計制度下公立醫(yī)院財務(wù)精細(xì)化管理實(shí)踐探討
- 特斯拉的創(chuàng)新之路:面對能源轉(zhuǎn)型與市場競爭的雙重挑戰(zhàn)
- 高質(zhì)量推動思政課數(shù)字化轉(zhuǎn)型的時代要義
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點(diǎn)分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個知識點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級黨報?是否有什么說據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報?
- 《農(nóng)業(yè)經(jīng)濟(jì)》論文投稿解析,難度指數(shù)四顆星,附好發(fā)選題!