信息资源管理学报 ›› 2020, Vol. 10 ›› Issue (3): 78-91.doi: 10.13365/j.jirm.2020.03.078
秦成磊 章成志
Qin Chenglei Zhang Chengzhi
摘要: 新材料、新技术、新工艺的应用使得新属性广泛存在于新上市的产品中。现有的产品属性抽取方法通常只关注评价对象的主要属性抽取,未对新属性识别展开深入研究,从而影响以属性抽取为研究基础的相关研究的实验结论。针对该情况,本研究将产品新属性识别转化为分类任务,分别将分类模型、条件随机场(CRF)、双向长短期记忆网络与条件随机场结合的深度学习模型(Bi-LSTM-CRF)应用到该任务中。对实验结果进行分析,确定使用CRF模型获取候选新属性;随后,使用四种强约束规则过滤噪音,优化模型识别结果;最后,为增强所识别新属性的可解释性,基于层次聚类的思想对新属性和种子属性进行聚类,以种子属性解释新属性。实验结果表明本研究所提出的产品新属性识别方案能够对产品属性进行有效扩充。
中图分类号: