基于大数据的高校贴吧舆情分析系统

新闻来源:竞赛组委会
发布时间:2021年06月26日

1、作品名称

基于大数据的高校贴吧舆情分析系统

2、作品分类

数据可视化

3、作品描述

随着计算机存储能力的提升和复杂算法的发展,近年来数据量呈指数型发展。目前,百度贴吧栏目为全国大部分高校所拥有。在此栏目下,贴吧信息量大且比较分散,不便于高校管理部门作进一步分析。对此,我们设计出高校贴吧舆情分析系统。 本产品采用了基于Hadoop 分布式集群为基础的大数据平台结合数据分析算法对贴吧数据集进行清洗、规范化、分析与处理;模块化处理,增强了系统重用度;以并行的方式工作,提高了系统的运行速度;分布式计算平台可以更快捷的处理海量的贴吧数据信息。设计基于K-means算法模型,建立用户画像,分析判断贴吧用户地域、高校、男女关注度等信息并作数据统计。采用功能强大的HiveQL技术作为数据仓库处理手段,减小了数据调用的难度,加快系统的运行速度。最后利用H5对处理好的数据进行可视化展示,互动性强,视觉效果佳,用户的感官体验好,可以提高流量转化,加快获客的效率和速度。 本产品通过分析各高校百度贴吧数据信息,判断学校和学生舆论热点以及数据热点分布区域。处理过程主要分为四个阶段,数据抓取和提取、数据存储、数据分析、数据展示。具有方便、快捷、直观等优点,可以迅速准确的输出分析的结果,并给出有效的分析说明。在大数据时代的背景下,热点数据的提取变的尤为重要。本产品未来可应用于企业的客服,增加与客户信息的交流,从而得到用户需求,更有利于抓住市场痛点,推动商业、服务业等产业人性化发展。

4、创意来源

众多的网络舆情表现形态中,高校网络舆情是一种具有特殊重要意义的网络舆情类型,不仅因为其制造主体在网络使用方面具有显著的数量优势,而且因为高校学生是一个知识水平高、思想活跃、社会影响力较强的特殊社会群体,一旦高校网络舆情失控将产生严重的负面影响。因此,高校网络舆情受到社会各界的广泛关注,也成为不同声音、不同阵营争夺的焦点。正确及时地对高校网络话题进行筛选、研判和引导,不仅是促进高校和大学生健康发展的内在诉求,更是建设社会主义和谐社会的客观要求。对此,本团队研发设计出基于大数据的百度贴吧舆情分析系统。

5、运行环境(所需操作系统、硬件、软件等)

操作系统:windoows 硬件:电脑运行 软件:VMware Workstation、MATLAB R2016a、HeidiSQL、eclipse.exe等


声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:cmit@vip.qq.com
新闻扩展
竞赛获奖作品
回到顶部