摘要:
本文给出了一种高度自动化、可操作性强的百度百科网页质量评价方法。论文首先阐述了百度百科网页质量评价的必要性,介绍了国内外网页质量评价的现状;然后给出了百度百科网页质量的自动化评价思路,包括确定并自动化提取网页特征值、训练评价模型和自动化评价网页质量等步骤;以百度百科中“中华烹饪文化”相关的网页为实验对象,在对比分类结果的基础上,选取J48分类器实现了自动化评价,并探讨了各特征值对评价结果的影响;最后讨论了这种自动化评价方法的局限及后续研究。
中图分类号:
仝召娟 许鑫. 百度百科网页质量的自动化评价[J]. 信息资源管理学报, 2015, 5(2): 63-69.
Tong Zhaojuan Xu Xin. Automatic Evaluation of Baidu Encyclopedia Web Pages[J]. Journal of Information Resources Management, 2015, 5(2): 63-69.