首页 | 官方网站   微博 | 高级检索  
     

基于注意力机制与文本信息的用户关系抽取
引用本文:赵赟,吴璠,王中卿,李寿山,周国栋.基于注意力机制与文本信息的用户关系抽取[J].中文信息学报,2019,33(3):87-93.
作者姓名:赵赟  吴璠  王中卿  李寿山  周国栋
作者单位:苏州大学 计算机科学与技术学院,江苏 苏州 215006
基金项目:国家自然科学基金(61331011,61672366)
摘    要:随着社交媒体的发展,用户之间的关系网络对于社交媒体的分析有很大的帮助。因此,该文主要研究用户好友关系检测。以往的关于用户好友关系抽取的研究主要基于社交媒体上的结构化信息,比如其他好友关系,用户的不同属性等。但是,很多时候用户本身并没有大量的好友信息存在,同时也不一定有很多确定的属性。因此,我们希望基于用户发表的文本信息来对用户关系进行预测。不同于以往的潜在好友推荐算法,该文提出了一种基于注意力机制以及长短时记忆网络(long short-term memory,LSTM)的好友关系预测模型,将好友之间的评论分开处理,通过分析用户之间的评论来判断是否具备一定的好友关系。该模型将好友双方信息拼接后的结果作为输入,并将注意力机制应用于LSTM的输出。实验表明,用户之间的评论对于好友关系预测确实有较大的实际意义,该文提出的模型较之于多个基准系统的效果,取得了明显的提升。在不加入任何其它非文本特征的情况下,实验结果的准确率达到了77%。

关 键 词:好友判断  关系预测  社交网络  注意力机制  

User Relation Extraction via Text Information and Attention Mechanism
ZHAO Yun,WU Fan,WANG Zhongqing,LI Shoushan,ZHOU Guodong.User Relation Extraction via Text Information and Attention Mechanism[J].Journal of Chinese Information Processing,2019,33(3):87-93.
Authors:ZHAO Yun  WU Fan  WANG Zhongqing  LI Shoushan  ZHOU Guodong
Affiliation:School of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006, China
Abstract:With the development of social media, the relationship network between users has greatly helped the analysis of social media. Focusing on predicting the user relationship based on the text information published by the user, this paper proposes a friendship prediction model based on attention mechanism and Long Short-Term Memory(LSTM), which separates the comments between friends, and determines whether there is a certain friend relationship by analyzing the users comments. This model takes as input the concatenated results of the two friends and applies the attention mechanism to the output of the LSTM. Experiment shows that the proposed model achieved an accuracy of 77% without adding any other non-text features.
Keywords:friend judgment  relationship prediction  social network  attention mechanism  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号