信息资源管理学报 ›› 2017, Vol. 7 ›› Issue (4): 44-50,57.doi: 10.13365/j.jirm.2017.04.044

• 研究论文 • 上一篇    下一篇

哪些老人不说话?基于标签的老年缄默用户预测

左美云 侯静波 汪长玉   

  • 收稿日期:2017-04-08 出版日期:2017-10-26 发布日期:2017-10-26
  • 作者简介:左美云(通讯作者),男,博士,教授、博士生导师,研究方向为智慧养老、信息管理、知识管理,Email:zuomy@ruc.edu.cn;侯静波,男,硕士研究生,研究方向为数据挖掘、社交网络分析、智慧养老;汪长玉,女,博士研究生,研究方向为知识管理、信息系统、智慧养老。
  • 基金资助:

    本文系中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目(10XNJ065)、国家自然科学基金资助项目“线上线下互动对虚拟社区中老年人知识分享的影响研究”(71273265,2013/01-2016/12)、国家社科基金重大项目“国家数字档案资源整合与服务机制研究”(13&ZDZ184,2013/12-2017/12)的成果。

Which Seniors Don’t Talk? A Study on Predicting Mute Senior Users by Tags

Zuo Meiyun Hou Jingbo Wang Changyu   

  • Received:2017-04-08 Online:2017-10-26 Published:2017-10-26

摘要:

基于用户标签实现社交网络缄默用户里的老年用户预测,有助于解决使用传统基于用户产生文本的预测方法难以预测缄默用户内老年用户的难题。有效预测出缄默用户中的老年人有助于为这部分用户提供诸如适老化用户界面、适老信息以及好友推荐等适老服务,减轻老年人使用社交网络的负担。使用Word2vec和LDA两种方法,本文提取了社交网络用户标签特征向量,并使用六种不同分类算法对社交网络内老年用户进行预测。根据TF-IDF计算不同年龄组别用户标签词的热度指数,本文发现不同年龄组别用户的热门标签词语存在明显差别,表明使用标签词预测用户的年龄分组具有一定可行性。使用Word2vec方法提取用户标签特征,同时使用简单逻辑回归或随机森林分类模型可以有效判断缄默用户是否为老年用户,在不使用任何社交网络拓扑结构和用户生成文本的情况下,分类正确率达到66%。

关键词: 社交网络, 缄默用户, 老年用户预测, 用户标签

Abstract:

The problem of distinguishing senior users from mute users was solved by the tags in their profiles in social media. Finding the mute seniors is helpful for providing suitable user interface to these users and recommending suitable information for these users, and can reduce these senior users’ burden of the social network. We use Word2vec and LDA to extract users’ features to predict whether the user is a senior citizen or not. This paper uses TF-IDF to compute the tag’s popularity in different age groups, finding that there is distinct difference among different age groups. So tags can be used to predict users’ age group. Experiment results demonstrated that the approaches(using Word2vec to extract features and using random forest or logistic regression to predict the age group) can make accurate prediction on whether a user is a senior user. Its accuracy can achieve 66% without any user generated content or network topology.

Key words: Social network, Mute users, Senior user prediction, User tag

中图分类号: