首页 | 官方网站   微博 | 高级检索  
     

融合词向量的多特征句子相似度计算方法研究
作者单位:;1.中国人民解放军后勤科学研究所;2.北京航空航天大学计算机学院;3.昆明理工大学信息工程与自动化学院
摘    要:在归纳常见的句子相似度计算方法后,基于《人民日报》3.4万余份文本训练了用于语义相似度计算的词向量模型,并设计了一种融合词向量的多特征句子相似度计算方法。该方法在词方面,考虑了句子中重叠的词数和词的连续性,并运用词向量模型测量了非重叠词间的相似性;在结构方面,考虑了句子中重叠词的语序和两个句子的长度一致性。实验部分设计实现了4种句子相似度计算方法,并开发了相应的实验系统。结果表明:提出的算法能够取得相对较好的实验结果,对句子中词的语义特征和句子结构特征进行组合处理和优化,能够提升句子相似度计算的准确性。

关 键 词:词向量  句子相似度  Word2vec  算法设计

Research on Multi-Feature Sentence Similarity Computing Method with Word Embedding
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号