信息资源管理学报 ›› 2020, Vol. 10 ›› Issue (6): 101-109.doi: 10.13365/j.jirm.2020.06.101
肖 璐1 赵之辉1 陈 果2
Xiao Lu1 Zhao Zhihui1 Chen Guo2
摘要: 针对细分领域知识关联挖掘应用中普遍存在的“所得结果不需要挖掘也知道”这一质疑,提出一种更符合专业人员需求的非常识性知识关联挖掘方案。该方案包含三个关键点:①数据源采用专业人员经验交流文本,而不是常识性的百科文本,以保障挖掘结果符合专业问题解决的需要;②采用大规模预训练词向量+小规模细分领域语料学习微调的方式,能更好地开展领域术语表示学习,以解决细分领域语料不足和未登录专业术语学习的效果问题;③依托领域知识库剔除挖掘结果中常识性知识关联,以向专业人员提供值得深入的潜在性、线索性知识关联。以心血管领域为例,从小规模医生经验交流文本上挖掘所得知识关联,能更好地契合临床疑难问题解决经验、医学研究实验发现,可为专业人员提供有价值的、可进一步知识探索和利用的线索。
中图分类号: