信息资源管理学报 ›› 2019, Vol. 9 ›› Issue (1): 105-113,127.doi: 10.13365/j.jirm.2019.01.105

• 研究论文 • 上一篇    下一篇

基于链接分析和规则分类的恶意网站识别技术研究

胡忠义 王超群 吴江 陈远   

  • 收稿日期:2018-07-04 出版日期:2019-01-26 发布日期:2019-01-26
  • 作者简介:胡忠义,讲师,博士,研究方向为商务智能与机器学习,Email:Zhongyi.Hu@whu.edu.cn;王超群,研究生,研究方向为数据挖掘;吴江,教授,博士,研究方向为数据挖掘、社会网络分析等;陈远,副教授,博士,研究方向为数据分析与挖掘等。
  • 基金资助:

    本文系国家自然科学基金面上项目“内容关系互动下的在线医疗社区用户行为演化研究”(71573197)和国家自然科学基金青年基金项目“基于集成学习的区间型电力负荷预测技术研究”(71601147)的成果之一。

Malicious Websites Identification based on Hyperlink Analysis and Classification Rule

Hu Zhongyi Wang Chaoqun Wu Jiang Chen Yuan   

  • Received:2018-07-04 Online:2019-01-26 Published:2019-01-26

摘要:

采用多源链接分析指标,构建了基于链接分析和规则分类技术的恶意网站识别模型。通过分析四种规则分类技术的识别性能和识别规则,并与四种传统的机器学习分类技术进行对比,验证所构建模型的有效性。在所提取的识别规则中,来自Alexa和Moz平台上的网站链接指标在恶意网站识别中有重要作用;与传统的机器学习分类技术相比,基于链接分析和规则分类的识别模型不仅能提取出多组易于理解的恶意网站识别规则,还具有更好的识别性能。本研究不仅拓展了链接分析在恶意网站识别中的应用,有效提升了恶意网站识别的准确性,还提取出易于理解的恶意网站识别规则。

关键词: 恶意网站, 链接分析, 分类规则, 机器学习, 网站识别

Abstract:

With multi-source hyperlink indices, this study proposes a malicious websites identification model based on hyperlink analysis and classification rule. The performance and associative rules of four types of classification rule in identifying malicious websites are analyzed by comparing with four typical machine learning classifiers. By analyzing the extracted rules, the hyperlink indices from Alexa and Moz play an important role for the malicious website identification. Compared with four typical machine learning classifiers, the proposed identification model not only extracts a group of identification rules for malicious websites, but also has better performance in identifying malicious websites. This study can not only expand the use of hyperlink analysis in the area of malicious websites identification, but also build an efficient model and extract easy-to-understand rules in identifying malicious websites.

Key words: Malicious website, Hyperlink analysis, Classification rules, Machine learning, Website identification

中图分类号: