大数据视角下的舆情观测平台:社会焦点透视镜系统

除了以上几个重要模块的展示外,社会焦点透视镜系统还有其他一些丰富的展示效果,详情请见http://qx.8wss.com。

3 社会焦点透视镜系统的应用实例——“9·3阅兵”

与人民网和新浪微博合作,笔者将社会焦点透视镜系统的关键技术用于了2015年的“9·3阅兵”话题中,推出了阅兵大数据“网民情绪展示”平台,该平台每隔15 min刷新一次数据,进行展示。

“网民情绪展示”平台的主要功能包括:网民实时关注热门地区排名、网民实时评论阅兵热点高频词分析、网民实时热点话题排行榜以及整个阅兵过程中的舆情走势等。该平台共采集了9月3日8:30-12:30这4 h内网民在新浪微博平台上的阅兵相关话题,并进行分析统计。大数据分析结果显示:原创微博及转发微博总帖量共计453万人次,网民参与发帖的峰值点出现在中午12:00,峰值数据为50万人次;热门地区被广东、北京和山东包揽前三甲;网民热议的高频词有“国泰民安、挺身而出、舍生忘死”等;“习近平宣布将裁军30万”成为网民最热议的话题。

图5是“网民情绪展示”平台的部分数据截图。

图 5 “网民情绪展示”平台的部分数据截图

4 结束语

本文介绍的“社会焦点透视镜系统”是微博大数据时代下的一种新型的舆情监测平台。该系统不仅可以像传统系统一样展示出社会热议的事情及民众的情绪分析,还可以深层透视焦点事件背后情绪分布的原因及其相应的用户群体,相信可以对当代社会治理方案的制定提供一定的技术支持。

作者简介:

赵妍妍(1983-),女,哈尔滨工业大学机电学院媒体技术与艺术系副教授、硕士生导师,中国中文信息学会社会媒体处理专委会委员,主要研究方向为社会计算、情感分析。

秦兵(1968-),女,哈尔滨工业大学计算机科学与技术学院教授、博士生导师,社会计算与信息检索中心副主任,中文信息学会信息检索专委会委员,中国计算机学会中文信息技术委员会委员,主要研究方向为社会计算、自然语言处理、文本挖掘。

刘挺(1972-),男,哈尔滨工业大学教授,社会计算与信息检索研究中心主任,中国计算机学会理事,中国中文信息学会常务理事、社会媒体处理专业委员会主任,国际会议ACL2014、EMNLP2015领域主席,主要研究方向为社会计算、信息检索和自然语言处理。

参考文献:

[1] ZHAO J C, DONG L, WU J J, et al. MoodLens: an emoticon-based sentiment analysis system for Chinese Tweets in Weibo[C]//The 18th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, August 12-16, 2012, Beijing, China. New York: ACM Press, 2012: 1528-1531.

[2] WANG H, CAN D, KAZEMZADEH A, et al. A system for real-time Twitter sentiment analysis of 2012 U.S. presidential election cycle[C]//The ACL 2012 System Demonstrations, July 8-14, Jeju Island, Korea. New York: ACM Press, 2012: 115-120.

[3] CIOT M, SONDEREGGER M, RUTHS D. Gender inference of Twitter users in non-English contexts[C]//The 2013 Conference on Empirical Methods in Natural Language Processing, October 18-21, 2013, Seattle, Washington, USA. Sofia: Association for Computational Linguistics, 2013: 1136-1145.

[4] DIAO Q M, JIANG J, ZHU F D, et al. Finding bursty topics from microblogs[C]//The 50th Annual Meeting of the Association for Computational Linguistics, July 8-14, Jeju Island, Korea. New York: ACM Press, 2012: 536-544.

[5] WILLIAMS J, KATZ G. Extracting and modeling durations for habits and events from Twitter[C]//The 50th Annual Meeting of the Association for Computational Linguistics, July 8-14, Jeju Island, Korea. New York: ACM Press, 2012: 223-227.

[6] ZHAO Y Y, QIN B, LIU T, et al. Social sentiment sensor: a visualization system for topic detection and topic sentiment analysis on Microblog[J]. Multimedia Tools and Applications, 2014: 1-18.

[7] MOHAMMAD S M, KIRITCHENKO S, ZHU X D. NRC-Canada: building the state-of-the-art in sentiment analysis of Tweets[C]//The International Workshop on Semantic Evaluation, June 2013, Atlanta, USA. New York: Association for Computational Linguistics, 2013: 321-327.

[8] SOCHER R, PERELYGIN A, Wu J, et al. Recursive deep models for semantic compositionality over a sentiment treebank[C]//The Conference on Empirical Methods in Natural Language Processing(EMNLP 2013), October 18-21, 2013, Seattle, WA, USA. Sofia: Association for Computational Linguistics, 2013: 1631-1642.