首页 | 官方网站   微博 | 高级检索  
     

融入多特征的汉越新闻观点句抽取方法
引用本文:林思琦,余正涛,郭军军,高盛祥.融入多特征的汉越新闻观点句抽取方法[J].中文信息学报,2019,33(11):101-106.
作者姓名:林思琦  余正涛  郭军军  高盛祥
作者单位:昆明理工大学 信息工程与自动化学院,云南 昆明 650504
基金项目:国家重点研发计划(2018YFC0830105,2018YFC0830100);国家自然科学基金(61732005,61672271,61761026,61762056,61866020);云南省高新技术产业专项(201606);云南省自然科学基金(2018FB104);云南省科技人才培养项目(KKSY201703015)
摘    要:该文提出一种融入多特征的汉越双语新闻观点句抽取方法。首先针对汉语和越南语标记资源不平衡的问题,构建了汉越双语词嵌入模型,用丰富的中文标记资源来弥补越南语标记资源的缺失。并且该文认为句子的主题特征、位置特征和情感特征对观点句分类具有重要作用,因此将这些特征分别融入词向量和注意力机制中,实现句子语义信息和情感、主题、位置特征的结合。实验表明,该方法可有效提升越南语新闻观点句抽取的准确率。

关 键 词:观点句抽取  双语词嵌入  注意力机制  

Chinese-Vietnamese News Perspective Sentence Extraction Methods Incorporating Multiple Features
LIN Siqi,YU Zhengtao,GUO Junjun,GAO Shengxiang.Chinese-Vietnamese News Perspective Sentence Extraction Methods Incorporating Multiple Features[J].Journal of Chinese Information Processing,2019,33(11):101-106.
Authors:LIN Siqi  YU Zhengtao  GUO Junjun  GAO Shengxiang
Affiliation:School of Information Engineering and Automation, Kunming University of Science and Technology, Kunming, Yunnan 650504, China
Abstract:This paper proposes a Chinese-Vietnamese bilingual news perspective sentence extraction method that incorporates multiple features. Firstly, for the problem of unbalanced resources in Chinese and Vietnamese, this method constructs a Chinese-Vietnamese bilingual word embedding model. We use rich Chinese tag resources to make up for the lack of Vietnamese tagging resources. Then, the emotional, topical and positional features of sentences are integrated into the word vector and attention mechanism respectively. Experiments show that this method can effectively improve the accuracy of Vietnamese news perspective sentence extraction.
Keywords:perspective sentence extraction  bilingual word embedding  attention mechanism  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号