信息资源管理学报 ›› 2020, Vol. 10 ›› Issue (5): 96-111.doi: 10.13365/j.jirm.2020.05.096

• 研究论文 • 上一篇    下一篇

面向自然语言处理的条件随机场模型研究综述

余本功 范招娣   

  1. 合肥工业大学管理学院, 合肥, 230009
  • 出版日期:2020-09-26 发布日期:2020-10-14
  • 作者简介:余本功,博士,教授,硕士生导师,研究方向为信息系统、自然语言处理;范招娣,硕士研究生,研究方向为自然语言处理,Email:fzdfzd@mail.hfut.edu.cn。
  • 基金资助:
    本文系2016年国家自然科学基金项目“基于制造大数据的产品研发知识集成与服务机制研究”(71671057)的成果之一。

A Review of Conditional Random Field Models for Natural Language Processing

Yu Bengong Fan Zhaodi   

  1. School of Management, Hefei University of Technology, Hefei 230009
  • Online:2020-09-26 Published:2020-10-14

摘要: 条件随机场(CRF)模型是自然语言处理(NLP)领域的重要方法之一,为深入了解该领域的研究进展,对近年来该模型的相关研究成果进行阐述和分析。梳理CRF模型在多标签、隐变量、语义层次、空间信息、半监督和多模型融合等六个方面的扩展研究,总结CRF模型在分词分割、标注标记、识别检测、提取分类、填充匹配等自然语言处理方向的应用研究,最后对该模型未来研究方向进行展望,包括设计特征生成方法、优化训练推断算法以及扩展模型的图结构等。

关键词: 条件随机场, 自然语言处理, 序列标注, 概率图模型, 机器学习模型

Abstract: Conditional Random Field (CRF) Model is one of the important methods in natural language processing (NLP). To understand the research progress in this field, the paper comprehensively expounds and analyzes the research results of this model. The paper introduces the CRF model and summarizes the extended model research in six aspects: multi-label, hidden state, semantics hierarchy, spatial information, semi-supervised learning and model fusion. The applications of this model in word segmentation, labeling and marking, identification and detection, extraction and classification, filling and matching are summarized. Finally, the future research in this field is forecasted, including designing feature generation methods, optimizing training and inference algorithms, and extending the graph structure of the model.

Key words: Conditional Random Field (CRF), Natural language processing (NLP), Sequence labeling, Probability graph model, Machine learning model

中图分类号: