首页 | 官方网站   微博 | 高级检索  
     

融合通道特征的混合神经网络文本分类模型
引用本文:韩永鹏,陈彩,苏航,梁毅.融合通道特征的混合神经网络文本分类模型[J].中文信息学报,2021,35(2):78-88.
作者姓名:韩永鹏  陈彩  苏航  梁毅
作者单位:北京工业大学 信息学部,北京 100124
基金项目:国家自然科学基金(61672505,91546111)
摘    要:基于卷积神经网络与循环神经网络的混合文本分类模型通常使用单通道词嵌入。单通道词嵌入空间维度低,特征表示单一,导致一维卷积神经网络不能充分学习文本的空间特征,影响了模型的性能。因此,该文提出一种融合通道特征的混合神经网络文本分类模型。该模型使用了双通道词嵌入丰富文本表示,增加了空间维度,在卷积的过程中融合了通道特征,优化了空间特征与时序特征的结合方式,最终提高了混合模型的分类性能。在IMDB、20NewsGroups、复旦中文数据集、THUC数据集上进行实验,该模型的分类准确率相比于传统卷积神经网络平均提升了1%,在THUC数据集上准确率最高提升了1.3%。

关 键 词:通道特征  神经网络  文本分类  
收稿时间:2019-11-29

Hybrid Neural Network Text Classification Model with Channel Features
HAN Yongpeng,CHEN Cai,SU Hang,LIANG Yi.Hybrid Neural Network Text Classification Model with Channel Features[J].Journal of Chinese Information Processing,2021,35(2):78-88.
Authors:HAN Yongpeng  CHEN Cai  SU Hang  LIANG Yi
Affiliation:Faculty of Information, Beijing University of Technology, Beijing 100124, China
Abstract:The hybrid text classification model based on convolutional neural network and recurrent neural network usually uses single-channel word embedding. Single-channel word embedding has low spatial dimension, leading that one-dimensional convolutional neural network fail to fully capture text features. This paper proposes a hybrid neural network text classification model combined with the channel features. The model uses two-channel word embedding to enrich text representation, fuses channel feature in the process of convolution, and optimizes the combination of spatial and temporal features. Tested on IMDB, 20NewsGroups, Fudan Chinese dataset and THUC dataset, the proposed model improves the classification accuracy by an average of 1% compared with the traditional methods, with a top increase of 1.3% on the THUC dataset.
Keywords:channel feature  neural network  text classification  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号