网络舆情监测技术研究及应用

中国科技纵横 / 2018年10月09日 19:28

互联网+

长沙舆情监测浅析国内外舆情监控研究现状

高淼

摘 要:随着互联网的普及,中国已成为世界第一大网民国家,网络的重要性凸显,而网络舆论热点也层出不穷,“毒跑道”事件、魏则西事件、大学生裸贷事件……都是通过网络进行第一时间传播,互联网已经成为信息交流和知识共享的最好平台,被公认为是继报纸、广播、电视之后的“第四媒体”,成为反映社会舆情的主要载体之一 。网络舆论一旦被错误地控制和引导,将成为影响社会稳定的重大隐患。因此,如何应对网络舆情,目前正在考验各级党政机关及企事业单位。

关键词:互联网;网络舆论;舆情

中图分类号:G203 文献标识码:A 文章编号:1671-2064(2017)07-0195-01

1 引言

当前,互联网已成为汇集舆情、畅通民意的重要平台和渠道。政府可以通过对网络舆情的搜集与分析来判定民众的意愿,从而来帮助自己更好地决策,也可以更好地应对一些社会突发危机事件;企事业单位可以通过对网络舆情的分析来有效保护和提升公司品牌形象,消减负面信息对公司的影响。

2 网络舆情监测技术重要性及必要性

网络舆论的影响是巨大的,其中大部分是正面的影响,但是如果不对网络舆情加以监控与引导,一旦被错误利用,就可能产生严重的负面影响,以致危害个人安全,甚至是危害国家安全,如近年来娱乐圈频发的抑郁症自杀事件;互联网是完全开放的虚拟的公共空间,每个网民都可以成为网络信息的发布者,每个网民都有选择网络信息的自由,网络舆情是网络与一般社会舆情结合的产物,网络舆情除具有社会舆情的一般特征外,还具有其它的特点:如网民在网上发布信息是匿名的,网民会直接表达自己的观点,反映真实的情绪;网络舆论的形成往往非常迅速;网络舆情的主题是宽泛的、自发的、随意的;网民普遍表现出强烈的参与意识,网络舆情经常是互动的;网民由于各种因素影响,网络舆论可能是感性的、情绪化的甚至是非理性的。[1]因此,如何因势利导,及时掌握社会舆情动态,积极引导社会舆论,是各级政府部门及企事业单位所面临的严肃课题与严峻挑战。

3 网络舆情监测技术应用研究

网络舆情监测的方式主要有人工方式和自动方式。人工方式主要是利用搜索引擎对网站进行人工监测,有信息量大、搜索不全面、不能实时监测的局限性,因此研究网络舆情自动监测是非常必要的。从技术角度来看,网络舆情监测系统是众多技术结合的成果,基于内容挖掘的网络舆情信息分析,涉及较多与自然语言处理相关的研究子领域。刘毅提出了内容分析法在网络舆情分析中的应用,开拓了内容分析在网络舆情监测中的先河。[2]在网络舆情监测系统处理信息过程中,一般包含网络舆情信息采集与提取、话题发现与追踪、网络舆情倾向性分析等步骤。

3.1 舆情信息采集与提取

网络舆情主要通过新闻、论坛/BBS、博客等渠道形成和传播,特别是近年的QQ群、以及Twitter等微博客,这些主要为动态网页,以松散的非结构化信息为主体,实现准确的舆情采集和抽取存在难度。

在信息采集中,主要采用网络爬虫和网页清洗等技术。网络爬虫是一个按照一定规则自动抓取网络信息的程序,又称网络蜘蛛。网络爬虫分为三类:通用爬虫、面向主题爬虫和面向DeepWeb爬虫。考虑到网络舆情监测一般是面向行业监测,倾向于使用面向主题爬虫。主题网络爬虫主要有两种技术:基于Web链接分析的搜索、基于Web内容分析的搜索。网页清洗就是从网页中过滤掉“噪聲”数据,提取出网页中有价值的信息内容。网页清洗分析方法主要分为三类:基于树结构分析方法,基于Web挖掘方法,基于正则表达式方法。

3.2 话题发现与追踪

无论是热点、敏感话题,还是需要重点关注的话题,如何从海量信息中找到这些话题?

话题发现与追踪是对网络舆情聚类分析后,利用关键词过滤、语义分析、数值统计等方式识别被关注话题,以及热点和敏感话题,并对其趋势变化进行追踪,是网络舆情监测中的核心技术。目前国内外的实现技术是基于文本聚类,即文本的关键词作为文本的特征。话题发现与追踪研究始于1996年美国DARPA提出一种能自动确定新闻信息流中话题结构的技术。目前,主题检测与跟踪研究集中于五个子任务展开,各个子任务的解决将有助于最终研究目标的实现。这五个子任务包括:对新闻报道的切分子任务、新事件的识别子任务、报道关系识别子任务、话题识别子任务、话题跟踪子任务。[3]其中话题识别和话题追踪是核心问题。

3.3 网络舆情倾向性分析

舆情倾向性分析是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。倾向性分析是自然语言处理技术中新兴的研究课题,具有很大的研究价值和应用价值,一般来说,它分为三个主要研究任务:情感信息抽取、情感信息分类、情感信息的检索与归纳。[4]

通过倾向性分析可以明确网络传播者所蕴涵的感情、态度、观点、立场、意图等主观反映。目前主要采用文本聚类和倾向性分析技术,对论坛帖子等网民评论聚类分析和倾向性分析,归纳网民观点。一方面能够主题趋势跟踪,分析新发表文章、贴子的话题是否与已有主题相同。另一方面对突发事件跨时间、跨空间综合分析,获知事件发生的全貌并预测发展趋势。同时,通过倾向性分析预警功能,对突发事件、涉及内容安全的敏感话题及时发现并报警。

4 网络舆情监测技术问题与发展

通过网络传播的信息包含了网民对当前社会各种现象以及诸多热点问题的立场和观点,话题涉及与日常生活相关的各个领域。因此,网络舆论能够最直接、快速地反映各个层面的社会舆情状况与发展态势。把握好网络舆情监测技术,及时了解并正确引导舆情发展方向,对政府和企业发挥职能和生产经营至关重要。

然而,网络舆情监测技术还存在许多亟需完善的地方,如监测源的获取、复杂舆情倾向判断、高质量舆情自动监测、如何及时关注及应对由社会突发公共事件引起的网络舆情问题、虚假信息和不良信息引发错误舆论导向问题等,这些关键问题的研究不仅需要我们充分利用已有的理论知识和先进的技术手段,还需要我们能够创新性地提出更贴切网络舆情实际的解决方案,来及时应对网络舆情带来的一系列影响。同时要继续深化对网络舆情的理论挖掘,加强数据挖掘技术的研究,在原有数据挖掘算法的基础上改进或者提出新的算法,提高网络舆情监测技术水平,在此基础上构建实时智能化的网络舆情监测以及应急处理机制。

参考文献

[1]谢海光.互联网内容及舆情深度分析模式.中国青年政治学院学报[J],2006,(3):95-100.

[2]刘毅.内容分析法在网络舆情信息分析中的应用.天津大学学报(社会科学版)[J],2006(4):308-310.

[3]洪宇,张宇,刘挺,李生.话题检测与跟踪的评测及研究综述.中文信息学报[J],2007.21(6):71-87.

[4]赵妍妍,秦兵,刘挺.文本情感分析.软件学报[J],2010.10(8):1834-1848.

1.环球科技网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.环球科技网的原创文章,请转载时务必注明文章作者和"来源:环球科技网",不尊重原创的行为环球科技网或将追究责任;3.作者投稿可能会经环球科技网编辑修改或补充。