信息资源管理学报 ›› 2013, Vol. 3 ›› Issue (3): 40-46.

• 研究论文 • 上一篇    下一篇

一种时间情境依赖的微博话题抽取方法

庄婷婷 王平 程齐凯   

  • 收稿日期:2013-07-05 出版日期:2013-09-26 发布日期:2013-09-26
  • 作者简介:庄婷婷,女,硕士研究生,研究方向为信息检索;王平,男,讲师,研究方向为社会网络;程齐凯,男,博士研究生,研究方向为信息检索与数据挖掘。
  • 基金资助:

    中国博士后科学基金第六批特别资助项目“网上多源信息的可信度判断与评估模型研究”(2013T60749)的研究成果之一。

Temporal Related Topic Detection Approach on Microblog

Zhuang Tingting Wang Ping Cheng Qikai   

  • Received:2013-07-05 Online:2013-09-26 Published:2013-09-26

摘要:

微博话题处在动态变化中,为了准确的抽取所需的微博话题,在微博文本内容之外,需要考虑微博的情境依赖关系,而其中尤为重要的是时间情境。本文提出了一种时间情境依赖的时序微博话题检测方法。该方法包括四个步骤:文本预处理、微博文本的特征选取、基于主题模型的文本话题检测、微博话题演化状态的确定。在真实数据上的实验表明,本文提出的方法具有较好的效果。

关键词: 话题检测, 微博, 特征选取, 主题模型

Abstract:

Topic in microblog data is dynamic. Aiming at detecting microblog’s topic more precisely, we should make use of the context of given microblog other than its text content. This paper proposes a temporal related topic detection method. This method can be divided into four phases: preprocessing, feature selection, topic detection, topic evolution analysis. Experimental results on real data show that the methods we propose in this paper perform well.

Key words: Topic detection,  Microblog,  Feature Selection,  Topic Model

中图分类号: