首页 | 官方网站   微博 | 高级检索  
     

基于主题模型的中文词义归纳
引用本文:高章敏,何祥,刘嘉勇,汤殿华.基于主题模型的中文词义归纳[J].四川大学学报(自然科学版),2016,53(6):1269-1272.
作者姓名:高章敏  何祥  刘嘉勇  汤殿华
作者单位:四川大学电子信息学院信息安全研究所,四川大学电子信息学院信息安全研究所,四川大学电子信息学院信息安全研究所,保密通信重点实验室
摘    要:词义归纳是在给定包含多义词语料的条件下,识别出多义词词义的过程,通常是采用聚类的方法.本文提出了基于主题模型的方法来解决中文词义归纳问题,基于主题模型的词义归纳方法关键之处在于使用文档的主题概率分布来推断多义词的词义分布.实验结果表明,本文方法在测试数据上获得了77.58%FScore值.

关 键 词:词义归纳  主题模型  隐含狄利克雷分布
收稿时间:2015/12/25 0:00:00
修稿时间:5/3/2016 12:00:00 AM

Chinese word sense induction based on topic model
GAO Zhang-Min,HE Xiang,LIU Jia-Yong and TANG Dian-Hua.Chinese word sense induction based on topic model[J].Journal of Sichuan University (Natural Science Edition),2016,53(6):1269-1272.
Authors:GAO Zhang-Min  HE Xiang  LIU Jia-Yong and TANG Dian-Hua
Affiliation:College of Electronics and Information, Sichuan Universiry,,Science and Technology on communication Security Laboratory
Abstract:Sense Induction is the process of identifying the word sense given its context, often treated as a clustering task. In this paper, we present a approach to Chinese Word Sense Induction which is based on topic modeling. Key to our methodology is the use of probabilistic assignment of topics distributions to documents to estimate sense distributions. Experimental results show that our method could achieve 77.58% scores of F-score on the development data set.
Keywords:word sense induction  topic model  LDA
本文献已被 CNKI 等数据库收录!
点击此处可从《四川大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《四川大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号