一、网络舆情概述 1.网络舆情的概念、要素与发展过程 所谓舆情,是指由个人以及各种社会群体构成的公众, 在一定的历史阶段和社会空间内,对自己关心或与自身利益 紧密相关的各种公共事务所持有的多种情绪、意愿、态度和 意见交错的总和。随着互联网的普及,网络成为反映舆情的 重要载体。网络舆情是通过互联网表达和传播的各种不同情 绪、态度和意见交错的总和。“网络舆情信息”则是民众在 互联网上发布和传播的能够反映民众舆情的文字、图像、音 频、视频等,往往是以文字形式为主。网络舆情反映和表达 了一定的社情民意,是社会舆情的一种表现形式。
作为社会舆情的组成部分,高校网络舆情主要是指高校 教职员工和学生对有关国际重大问题、社会焦点问题、时政问题以及有关校园事务和学校管理等与自己利益相关的问 题的情绪、看法、意见和态度。它不仅包括其对国家、社会 的政治态度,也有对自身利益需求的诉求和表达,是要求国 家、学校不断改善其现状、情况的诉求和意愿的集合。
从网络舆情的定义可知,高校网络舆情的要素包括主体、 客体、本体和舆情空间四部分。高校网络舆情的主体是学校 全体师生员工,其中以学生为主。高校网络舆情的客体是中 介性社会事项,包括各种事件、热点现象、行为和政策等等。
高校网络舆情的本体是各种情绪、态度和意见的总和。高校 网络舆情空间是指网络使用者(俗称网民)对中介性社会事 项的态度形成、变化和发生作用的情境,通常指学生社会政 治态度形成、变化和发生作用的环境。网络舆情空间是多层 的、结构化的和复杂多变的,是主客体和空间中具有的其他 基本因素之间的多维或多元的互动。舆情空间包括硬空间和 软空间。硬空间是指存在于互联网中的各种虚拟空间,如校 园BBS、论坛、微博等。软空间是指网络使用者(俗称网民) 在使用互联网时必须遵循的法律法规、角色认知、价值观以 及网络文化等。
网络舆情一般都要经历产生、形成、发展、消亡四个过 程。首先是社会或校园中某个话题或现象引发网络使用者 (俗称网民)关注。在得到网民的关注后,借助网络的传播 和放大作用,更多的网民加入其中,逐渐形成一种或数种舆 论观点。当参与人数和舆情信息的传播达到一定程度后,网络的声音开始在现实社会产生影响,引起现实社会的共鸣, 促成网络舆情高潮的到来。而一旦热点转移或消失,该舆情 热点话题随之退化或转入下一热点。
2.网络舆情信息生命周期管理 从网络舆情的发展过程可以得知,网络舆情信息有着自 己的生命周期。所谓网络舆情信息的生命周期是指从决策工 作产生对网络舆情信息的需求开始,到网络舆情信息分析结 果被决策者利用的整个过程,如图1所示。对网络舆情信息 的需求和利用分别是网络舆情信息生命周期的起始和终结, 中间还要经历一系列不可缺少的环节,主要包括:网络舆情 信息工作规划、网络舆情信息汇集、整理和评价、网络舆情 信息分析、网络舆情信息的报送和反馈、网络舆情信息预警 等,它们共同构成整个网络舆情信息汇集和分析的主体部分。
二、高校网络舆情信息监测管理体系的构建 网络舆情的发展过程,对网络舆情信息的管理提出了更 高的要求。构建高校网络舆情信息监测管理体系,对高校网 络舆情信息进行监测、分析,准确把握教育网络舆情信息的 内容、导向、发展趋势,整合各类资源,形成决策数据链, 为高校网络舆情信息的科学决策提供有效支持。结合网络舆 情信息生命周期管理过程,构建高校网络舆情信息监测、分 析与管理体系,如图2所示。
高校网络舆情信息监测管理体系主要包括网络舆情信 息提取(数据采集、数据预处理、信息萃取)、网络舆情信息数据挖掘分析、网络舆情决策管理和网络舆情信息监测环 境。
网络舆情信息提取是利用网络抓取技术,包括网络雷达 技术、元搜索技术、网页内容智能提取技术等;
多文档自动 摘要技术;
信息检索技术,包括全文检索技术、基于图片内 容检索、数据挖掘技术、自动分类与自动聚类、相似搜索与 消重等技术,对校园网(新闻、论坛、微博、即时通讯等) 进行实时监测、采集,对转载频率高和访问次数多的网络舆 情信息进行自动分类聚类,主题检测和专题聚焦等。
整个体系的构建是基于网络舆情监测的环境中,监测 环境的建立有助于相关舆情管理部门对网络舆情信息的分 析处理、决策方针的制定、对舆情的监控和管理。
三、主要功能分析和实现 1.网络舆情信息采集与处理 高校利用对校园网络的控制与管理,校园网内的舆情信 息数据可通过对各种信息发布平台的访问权限来获取。通过 三种方式实现对校园网内多种异构数据源的信息采集,具体 为:利用网络爬虫模块实现对校园网内网页文件的信息采 集;
利用Lucene数据库接口实现与各种异构数据库的连接;
利用Nutch的插件机制,实现对文档文件的解析与读取。
Nutch是一个开源的Java实现的Web搜索引擎,在Lucene 基础上通过添加网页数据抓取功能构建而成,提供了构建搜 索引擎所需的基本工具模块,包括网络爬虫、文本分析、分词工具、建立索引、搜索功能和结果过滤等。Lucene是一个 高性能、可伸缩的信息搜索库。可为Nutch提供文本索引和 搜索的API,也可为应用程序添加索引和搜索功能。通过 Lucene的数据库接口直接从数据库中取出数据。用API建立 索引并提供搜索接口。
互联网的舆情数据信息可利用元搜索引擎技术从网页 数据和异构文档中获取。元搜索引擎将检索条件转换为各独 立成员搜索引擎(例如百度、谷歌等)能够接受的格式,并 通过各自的查询接口提交,然后对获得的HTML格式的检索结 果进行分析、处理。获得与之相对应的链接地址、网页标题 以及部分说明文字,将上述信息处理为结构化数据后存放到 相应的数据库中。最后通过对不同独立成员搜索引擎所获取 的舆情信息的链接地址和网页标题等信息的对比和有效性 检测,实现结果的筛选和去重,然后将结果提交给Nutch插 件,与校园网舆情信息统一建立索引。
网络舆情信息预处理包含分词与建立索引。主要对信息 采集过程采集到的文本数据库进行读取,逐条进行数据清理, 去除文本中的脚本等无用信息,提取出文本的标题、内容, 并利用Lucene.Net对文本进行分词索引,创建文本模型并提 供数据资源。
2.网络舆情信息分析 网络舆情信息分析是网络舆情信息监测管理体系的核 心。学者们在网络舆情信息分析的理论研究和实践探索方面,虽然总结了许多应用模型,但不能较全面地实现网络舆情信 息的内容分析,在继承学者们的研究实践(如指标分析)基 础上,针对不同的网络舆情信息,结合内容分析法,选取趋 势分析、指标分析、文本分析、比较分析等分析方法,以达 到较为全面地分析网络舆情信息内容的目的。
内容分析法是一种对文献内容进行客观系统的定量分 析的专门方法,其目的是弄清或测验文献中本质性的事实和 趋势,揭示文献所含隐性信息,对事物发展做出预测。内容 分析法用于网络信息的分析,显示出良好的应用前景,主要 体现在对网络的内容挖掘、对网络的结构挖掘和对网络的使 用记录挖掘方面。随着数据挖掘技术的发展,内容分析法可 以在自动处理环境中深入揭示文本的隐性内容。
趋势分析通过对某一舆情话题,在不同时期内所显示的 舆情信息资料进行函数模式的转化,把这些不同样本的量化 结果加以比较,找出其中某一特征的信息的数量、重要性、 强度等发生变化和差异的因素,从而可以判断这一舆情话题 的趋势倾向。
绝大多数的网络舆情信息是以文本形式出现的,文本分 析是对文本的表示及其特征项的选取,它以特征词作为分析 要素进行量化来表示文本信息,统计其出现的频次,分析和 推断网络传播的内容,以及言论的倾向性。
特征分析把从文本中抽取出的特征词进行量化来表示 文本信息,通过对某一对象的特征词,在不同问题上,或在不同场合上所显示出来的内容资料进行内容分析,把这些不 同样本的量化结果加以比较,找出其中稳定的、突出的因素, 从而判定这一对象的特征。
比较分析是通过对同一中心问题,但对象或来源不同的 样本资料进行内容分析,把这些来自不同对象的样本的量化 结果加以对比,从而找出它们之间的异同。通过比较可以发 现研究对象的不同,找出本质上的异同。例如:比较同一舆 情信息在不同地域的传播特点、反应热度等;
比较不同媒体 载体报道风格的异同等。
四、网络舆情信息管理模型的实践应用 五、结束语 作为舆情研究的前沿领域,网络舆情信息的理论和实践 研究面临一系列挑战,在借鉴和吸收网络舆情信息基础理论 和应用实践的基础上,构建高校网络舆情信息管理体系,并 形成网络舆情信息互动反馈响应体系。作为一种丰富和复杂 的人类社会精神现象,网络舆情信息研究还需要在今后的实 践工作中继续拓展和深入。
扩展阅读文章
推荐阅读文章
推荐内容
钻爱网 www.zuanai.cn
Copyright © 2002-2018 . 钻爱网 版权所有 湘ICP备12008529号-1