如何選擇最适合的輿情監測系統?. 2017-08-03
如何選擇最适合的輿情監測系統
社會(huì)化網絡媒體(tǐ)的興起,正在改變傳統的信息傳播機制(zhì)。網絡傳播具有(yǒu)匿名性、速度快、範圍大(dà)、持續力強、傳播渠道(dào)多(duō)元化、傳播效果可(kě)測量等特點。一條負面信息從出現到形成輿論熱點的周期,從原來(lái)的24小(xiǎo)時(shí)(傳統新聞媒體(tǐ)比較典型的更新周期)縮短(duǎn)到現在的4小(xiǎo)時(shí)(微博熱點話(huà)題達到第一個(gè)傳播峰值比較典型的時(shí)間(jiān)周期)。如果不能在這4小(xiǎo)時(shí)內(nèi)做(zuò)出解釋、反饋、制(zhì)定應對策略,就可(kě)能出現輿論一邊倒的局面,甚至可(kě)能發生(shēng)極具品牌殺傷力的公共危機。由此,也就有(yǒu)了網絡輿情監測響應“黃金4小(xiǎo)時(shí)”的說法。
做(zuò)出及時(shí)、準确應對的前提是,要能夠在第一時(shí)間(jiān)了解網絡輿情的內(nèi)容、發生(shēng)源、關鍵傳播途徑等相關信息數(shù)據。由此,對于網絡輿情監測軟件的性能提出相應要求。
如何來(lái)選擇一套最适合的輿情監測系統?需要對輿情監測系統做(zuò)一下幾個(gè)方面的判斷。
第一:對網絡內(nèi)容監測的準确性。
對于內(nèi)容的判斷是一個(gè)關鍵技(jì)術(shù),目前的監測系統還(hái)不能做(zuò)到對內(nèi)容信息的完全自動判斷和(hé)處理(lǐ),在不能保證內(nèi)容識别百分之百準确率的情況下,往往需要對監測分析的中間(jiān)産物或不能識别的信息進行(xíng)一定程度的人(rén)工校(xiào)驗和(hé)清洗。
中文信息在處理(lǐ)上(shàng)具有(yǒu)一定特殊性和(hé)技(jì)術(shù)難點。英文每個(gè)單詞之間(jiān)用空(kōng)格或标點符号進行(xíng)分隔,與英文不同,中文字之間(jiān)沒有(yǒu)空(kōng)格,由字組成詞存在多(duō)種可(kě)能情況,中文分詞是識别的一個(gè)難點。
分詞難點:一是分詞的歧義識别,歧義是指同樣的一句話(huà),可(kě)能有(yǒu)兩種或者更多(duō)的切分方法。主要有(yǒu)“交叉歧義”、“組合歧義”、“真歧義”(相關定義參見附錄)三類情形。“真歧義”必須要聯系上(shàng)下文才能夠确定在文中的具體(tǐ)涵義;二是新詞識别,随着時(shí)代的發展,中文新詞不斷湧現,如果沒有(yǒu)被收錄而要進行(xíng)自動識别是非常困難的。與之相似的還(hái)有(yǒu)專業術(shù)語、名稱(包括,人(rén)名、商标、簡稱、機構名、縮略語等)等的識别問題。新詞識别準确率已經成為(wèi)評價一個(gè)分詞系統好壞的重要标志(zhì)之一。
在分詞基礎上(shàng),中文內(nèi)容監測還(hái)需要對信息自動進行(xíng)聚類、情感分析、提取摘要,特别是自動根據上(shàng)下文內(nèi)容判斷情感傾向與危機度、區(qū)分正負面。而這正是網絡輿情監測的核心工作(zuò)之一。
為(wèi)了提高(gāo)內(nèi)容識别的準确性,大(dà)部分網絡輿情監測系統采取了專業化發展的策略,通(tōng)過面向特定領域的知識、經驗和(hé)基礎數(shù)據的積累與不斷更新,逐步建立起輿情監測系統在特定領域內(nèi)的服務特長和(hé)功能優勢。由此,也就有(yǒu)了輿情監測服務市場(chǎng)的細分化,有(yǒu)的專注于民生(shēng)與社會(huì)動向、有(yǒu)的專注于消費品牌、有(yǒu)的專注于特定行(xíng)業……
也有(yǒu)一些(xiē)監測系統提供全方位的監測服務,這些(xiē)系統有(yǒu)較好的業務包容性,能夠滿足網絡輿情監測的主要需求,或者能夠根據客戶需要做(zuò)到定制(zhì)化的服務,這類系統通(tōng)常都會(huì)針對新客戶有(yǒu)一個(gè)系統部署階段,在部署過程中完成一些(xiē)定制(zhì)化的工作(zuò)。
“專用型系統”與“通(tōng)用型系統”各有(yǒu)特色,客戶在選擇時(shí)主要評估是否能夠充分滿足自身需求,同時(shí)擁有(yǒu)較好的性價比。兩類系統相比較,我個(gè)人(rén)更看好“專用型系統”未來(lái)的發展。
主要根據是,網絡媒體(tǐ)和(hé)內(nèi)容形式的發展非常迅速,一個(gè)好的輿情監測系統必須有(yǒu)一個(gè)持續而專業化的服務保障體(tǐ)系為(wèi)支撐,而“專用型系統”在此方面會(huì)有(yǒu)比較明(míng) 顯的優勢。另外,“專用型系統”還(hái)可(kě)以根據特定行(xíng)業或其他特定領域的特殊需求事先預置一些(xiē)特色功能,如果設計(jì)得(de)當,這些(xiē)功能會(huì)對目标客戶有(yǒu)很(hěn)大(dà)幫助和(hé)價 值,也會(huì)成為(wèi)營銷中的主要賣點之一。
準确性方面不同系統的表現差異很(hěn)大(dà)。從市場(chǎng)反饋的情況看,在商用領域,需要分行(xíng)業進行(xíng)監測服務的業務積累,在某個(gè)行(xíng)業或細分領域有(yǒu)的系統監測得(de)好、有(yǒu)的系統就不行(xíng);同樣,在政府管理(lǐ)服務領域,也有(yǒu)數(shù)個(gè)細分領域,不同系統的表現也是參差不齊。
第二:網絡內(nèi)容監測時(shí)效性。
時(shí)效性的高(gāo)低(dī)與軟硬件技(jì)術(shù)和(hé)運營設備資源都有(yǒu)密切關系,其中涉及到的專業技(jì)術(shù)不是本文關注的範疇。這裏要指出的是,時(shí)效性與前面提到的準确性是緊密相關的。如果系統對內(nèi)容的判斷準确性高(gāo),需要的人(rén)工幹預就少(shǎo)(當然,理(lǐ)想狀态是完全不需要人(rén)工幹預),監測信息處理(lǐ)的時(shí)滞就少(shǎo),監測的時(shí)效性自然就會(huì)有(yǒu)保障。如果系統需要一定的人(rén)工幹預,通(tōng)常情況下,會(huì)平均滞後0.5~3天左右。這個(gè)時(shí)間(jiān)已經遠遠超出了前文提到的網絡輿情監測及響應“黃金4小(xiǎo)時(shí)”周期。如果系統的時(shí)效性低(dī),就不能對網絡突發 輿情進行(xíng)及時(shí)監測和(hé)應急處理(lǐ),而這對危機公關服務是非常關鍵的。
有(yǒu)一些(xiē)監測系統的結果是依賴于baidu、google等搜索引擎的搜索結果進行(xíng)再分析(所謂的元數(shù)據抓取),而這些(xiē)大(dà)型搜索引擎的數(shù)據抓取更新是有(yǒu)自己的特定規律和(hé)周期。對于排名靠 後的網站(zhàn),搜索引擎爬蟲軟件會(huì)隔幾天,甚至更長時(shí)間(jiān),才會(huì)光顧一次。這種情況下,時(shí)效性自然不會(huì)有(yǒu)保障。
當然,對于時(shí)效性,不同的客戶會(huì)有(yǒu)不同的要求。有(yǒu)的客戶會(huì)要求做(zuò)到“實時(shí)監測”,例如提供危機公關服務的公關公司、廣告公司和(hé)一些(xiē)關注于民生(shēng)與社會(huì)動向的機構等;也有(yǒu)的客戶對時(shí)效性要求不是這麽高(gāo),例如對品牌價值進行(xíng)評估的服務需求,對特定事件做(zuò)事後評估的服務需求等等。
通(tōng)常情況下,時(shí)效性高(gāo)低(dī)是網絡輿情檢測系統定價的一個(gè)重要基礎,從節約經費的角度出發,客戶還(hái)是應當選擇滿足自身業務時(shí)效性需求前提下性價比較高(gāo)的系統和(hé)服務,不一定非要求做(zuò)到“實時(shí)監測”。
第三:網絡內(nèi)容監測全面性。
網絡內(nèi)容監測全面性的概念很(hěn)好理(lǐ)解,就是系統所監測網站(zhàn)的類别及總量。通(tōng)常情況下,監測系統不會(huì)做(zuò)全網監測,先不說技(jì)術(shù)上(shàng)的困難,僅在運營費用和(hé)投入上(shàng)就是中小(xiǎo)規模公司難以承受的。性 能優越的監測系統會(huì)有(yǒu)選擇地進行(xíng)網絡監測,客戶關注領域的相關網站(zhàn)、排名靠前的大(dà)網站(zhàn)、熱點網站(zhàn)是監測的主要對象。
絕大(dà)多(duō)數(shù)号稱能夠做(zuò)到“全網監測”的系統都是依賴對搜索引擎的搜索結果進行(xíng)再分析——元數(shù)據抓取。前文已經指出,這種方式可(kě)以達到了大(dà)覆蓋,但(dàn)犧牲了時(shí)效性。
不過在全面性方面也有(yǒu)一些(xiē)技(jì)術(shù) 問題需要處理(lǐ),一些(xiē)主要的內(nèi)容服務網站(zhàn)、社會(huì)化網絡媒體(tǐ)和(hé)電(diàn)商網站(zhàn)對于爬蟲軟件已經做(zuò)了限制(zhì)。限制(zhì)的原因有(yǒu)所不同,內(nèi)容服務網站(zhàn)、社會(huì)化網絡媒體(tǐ)(SNS 網站(zhàn)、微博等)主要是出于對信息及用戶數(shù)據的保護和(hé)主管部門(mén)的特定要求,電(diàn)商網站(zhàn)(自主平台類)主要為(wèi)了防範網絡商品比價。
綜合地看,相對于“準确性”與“時(shí)效性”而言“全面性”問題更容易解決,技(jì)術(shù)因素是一方面,通(tōng)過加大(dà)服務器(qì)和(hé)帶寬等運營資源的投入也能夠取得(de)顯著地改善。
看完本文的人(rén),98%了解了蜂眼輿情監測系統:
<蜂眼>網絡輿情監測系統架構如下
網絡輿情監測系統利用互聯網信息采集技(jì)術(shù)、信息智能信息處理(lǐ)技(jì)術(shù)和(hé)全文檢索技(jì)術(shù),對境內(nèi)外網絡中的新聞網頁、論壇、微博、貼吧(ba)、博客、新聞評論等網絡資源進行(xíng)全網監測、定向采集和(hé)智能分析,把互聯網讀薄,讀透。提供相關輿情、負面輿情、熱點信息的發現、主題事件監測、分類監測、輿情實時(shí)預警、輿情監管、統計(jì)分析、輔助決策支持等多(duō)層次、多(duō)維度的輿情信息服務,根據用戶的網絡輿情監測和(hé)定向追蹤等信息需求,形成簡報、報告、圖表等分析結果,從而幫助用戶及時(shí)掌握輿情動向。為(wèi)領導和(hé)輿情工作(zuò)部門(mén)提供信息參考和(hé)決策支持。