信息资源管理学报 ›› 2023, Vol. 13 ›› Issue (6): 99-109,124.doi: 10.13365/j.jirm.2023.06.099
孙冉1 安璐1,2
Sun Ran1 An Lu1, 2
摘要: 言语行为的自动分类有助于理解社交媒体用户话语的意图和行为,从而有效刻画舆情态势。本研究基于言语行为理论,对社交媒体用户在文本中表达的意图进行了细粒度的分类,对与疫苗相关的四千条推文进行手动注释,基于用户特征、时间特征、文本向量特征、主题特征、情感特征等,采用逻辑回归、随机森林、XGBoost等机器学习方法以及BERT和神经网络模型的组合方法,构建并评估突发事件情境下社交媒体用户言语行为分类模型,随后采用SHAP解释方法进行特征重要性排序,并利用非参数检验方法Kruskal-Wallis检验对不同言语行为的情感、影响力等差异性进行检验。基于XGBoost模型的言语行为分类准确度达到0.792,优于其他基线模型。文本向量特征在言语行为识别中的重要性最高。不同的推文言语行为在转发数上没有显著差别,在点赞数和情感特征上具有显著差异。
中图分类号: