信息资源管理学报 ›› 2020, Vol. 10 ›› Issue (1): 29-.doi: 10.13365/j.jirm.2020.01.029
大数据驱动的社交网络舆情用户情感主题分类模型构建研究——以“移民”主题为例
王晰巍1,2 邢云菲1 韦雅楠1 王铎1
Research on the Topic Model Construction of Sentiment Classification of Public Opinion Users in Social Networks Driven by Big Data——Taking “Immigration” as the Topic
Wang Xiwei1,2 Xing Yunfei1 Wei Yanan1 Wang Duo1
摘要: 基于卷积神经网络构建大数据驱动的社交网络舆情用户情感主题分类模型,通过爬虫分别获取微博和Twitter用户针对热点主题“移民”的情感文本内容,利用Word2Vector训练中文词向量,GloVe训练英文词向量,使用NLPIR和BosonNLP工具进行分词,构建基于“移民”主题的用户情感语料库,通过CNN卷积神经网络对情感分类进行训练和测试,并将分类结果与TimeLSTM和SVM的分类结果进行对比以验证CNN分类的优越性。数据结果表明,所构建的模型能够实现有效的多语言环境下中英文文本分类,通过合理设置激活函数和相关参数能够优化提高模型分类准确度,相较传统机器学习具有一定的优越性。在处理“移民”话题的文本分类上,CNN分类效果优于TimeLSTM模型。研究为跨语言的社交网络舆情用户情感主题图谱的可视化分析提供了前期的研究框架。
中图分类号: