融合多头自注意力机制的中文短文本分类模型 |
| |
作者姓名: | 张小川 戴旭尧 刘璐 冯天硕 |
| |
作者单位: | 1. 重庆理工大学 两江人工智能学院, 重庆 401135;2. 重庆理工大学 计算机科学与工程学院, 重庆 400054 |
| |
基金项目: | 重庆市自然科学基金;国家自然科学基金 |
| |
摘 要: | 针对中文短文本缺乏上下文信息导致的语义模糊从而存在的特征稀疏问题,提出了一种融合卷积神经网络和多头自注意力机制(CNN-MHA)的文本分类模型.首先,借助现有的基于Transformer的双向编码器表示(BERT)预训练语言模型以字符级向量形式来格式化表示句子层面的短文本;然后,为降低噪声,采用多头自注意力机制(MHA...
|
关 键 词: | 中文短文本 文本分类 多头自注意力机制 卷积神经网络 特征融合 |
收稿时间: | 2020-06-19 |
修稿时间: | 2020-08-26 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《计算机应用》浏览原始摘要信息 |
|
点击此处可从《计算机应用》下载全文 |
|