期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	1篇
免费	0篇

学科分类

工业技术

1篇

出版年

2023年

1篇

排序方式： 共有1条查询结果，搜索用时 15 毫秒

基于门控特征融合的中文错别字纠正模型

周雨昊孙哲吴晓非禹可《北京邮电大学学报》2023,(4):91-96+122

针对在中文错别字纠正中，平等地融合汉字的语义、读音和字形信息进行建模的方法会由于错误的读音或字形信息而影响模型性能的问题，提出了一种基于门控特征融合的中文错别字纠正模型，利用自适应门控来选择性地融合语义、读音和字形信息，提升模型性能并加强模型的可解释性。此外，使用改进的四角号码编码汉字的字形信息，有效地提取了汉字的字形特征，并且基于此扩展了模型预训练时的字形相似混淆集。使用了基于混淆集替换的预训练掩码策略，使模型能有效学习文本错误知识。在公开数据集SIGHAN13、SIGHAN14和SIGHAN15上，所提模型分别取得了78.7%、67.8%和77.7%的纠错F1分数，相比于最优基线模型分别提升了1.5%、1.5%和1.0%。相似文献