融合语义和句法依存分析的图卷积新闻文本分类 |
| |
引用本文: | 孙红,陆欣荣,徐广辉,黄雪阳,任丽博.融合语义和句法依存分析的图卷积新闻文本分类[J].中文信息学报,2023(7):91-101. |
| |
作者姓名: | 孙红 陆欣荣 徐广辉 黄雪阳 任丽博 |
| |
作者单位: | 1. 上海理工大学光电与计算机工程学院;2. 上海第四人民医院脊柱外科 |
| |
基金项目: | 上海市自然科学基金(21ZR1450200); |
| |
摘 要: | 图卷积神经网络GCN已经广泛应用于文本分类任务中,但GCN在文本分类时仅仅根据词语的共现关系来构建文本图,忽略了文本语言本身的规律关系,如语义关系与句法关系,并且GCN不善于提取文本上下文特征和序列特征。针对上述问题,该文提出了一种文本分类模型SEB-GCN,其在文本词共现图的基础上加入了句法文本图与语义文本图,再引入ERNIE和残差双层BiGRU网络来对文本特征进行更深入的学习,从而提高模型的分类效果。实验结果表明,该文提出的SEB-GCN模型在四个新闻数据集上,分类精确度对比其他模型分别提高4.77%、4.4%、4.8%、3.4%、3%,且分类收敛速度也明显快于其他模型。
|
关 键 词: | 文本分类 图卷积神经网络 语义文本图 句法文本图 残差 |
|
|