信息资源管理学报 ›› 2018, Vol. 8 ›› Issue (1): 55-64.doi: 10.13365/j.jirm.2018.01.055

• 研究论文 • 上一篇    下一篇

潜在狄利克雷分布模型研究综述

何伟林 谢红玲 奉国和   

  • 收稿日期:2017-08-02 出版日期:2018-01-26 发布日期:2018-01-26
  • 作者简介:何伟林,男,硕士研究生,研究方向为数据挖掘,Email:739320481@qq.com;谢红玲,女,硕士研究生,研究方向为数据挖掘;奉国和,男,博士,教授,硕士生导师,研究方向为数据挖掘、数字图书馆。
  • 基金资助:

    本文系2016年国家社科基金项目“基于文本挖掘的科技文献知识发现研究”(16BTQ071)、2016年华南师范大学研究生创新项目“基于深度学习的科技文献挖掘研究”(2016wkxm62)的成果之一。

Review on Latent Dirichlet Allocation Model

He Weilin  Xie Hongling Feng Guohe   

  • Received:2017-08-02 Online:2018-01-26 Published:2018-01-26

摘要:

潜在狄利克雷分布(LDA)模型是主题挖掘领域的重要方法之一,为深入了解该领域的研究进展,对2012到2016年5年期间该模型相关研究成果进行全面阐述和分析。系统地梳理LDA模型在词汇、时间演化、层次关系、情感分析、短文本、标签和比较性文本挖掘等7个方面的模型扩展研究;总结LDA模型在主题探索、推荐系统、预测系统,过滤系统和图像处理等方面的应用研究;最后对该模型未来研究方向进行展望,包括完善评价体系、提高模型精确度和处理效率以及在模型中引入可视化技术等。

关键词: 潜在狄利克雷分布, 概率主题模型, 主题建模

Abstract:

Latent Dirichlet Allocation(LDA) model is one of the important methods in topic mining.To understand the research progress in this field,the paper comprehensively expounds and analyzes the research results of this model in the five years from 2012 to 2016.The paper introduces the LDA model and summarizes the extended model research in seven aspects: lexical, topic evolution, hierarchical relationship, emotion analysis, short text, label and comparative text mining.The applications of this model in topic exploration, recommendation system, forecasting system, filtering system and image processing are summarized.Finally,the future research in this field is forecasted, including improving the evaluation system, improving the precision and efficiency of the model, and introducing the visualization technology into the model.

Key words: Latent Dirichlet Allocation(LDA), Probability topic model, Topic modeling

中图分类号: