首页 | 官方网站   微博 | 高级检索  
     

一种Word2vec构建词向量模型的实现方法
引用本文:席宁丽,朱丽佳,王录通,陈俊,万晓容.一种Word2vec构建词向量模型的实现方法[J].电脑与信息技术,2023(1):43-46.
作者姓名:席宁丽  朱丽佳  王录通  陈俊  万晓容
作者单位:1. 贵州师范大学教育学院;2. 贵州师范大学外国语学院;3. 广西现代职业技术学院教师教育学院
基金项目:贵州省教育厅高校人文社会科学研究项目(项目编号:2020GH015);
摘    要:Word2vec是一种基于简单神经网络的自然语言处理方法,是一种词嵌入技术,可用于构建高维词向量。研究针对Word2vec词向量表示方法进行模型构建和分析,通过NLPCC2014语料训练,将词映射到高维词向量空间中,完成了Word2vec的功能实现以及可视化输出。实验中进一步针对CBOW模型与Skip-gram模型,这两种Word2vec中的重要模型进行对比研究,输出结果表明:在通过大语料训练中文词向量时,Skip-gram模型在新词识别上具有明显优势,综合模型准确性与时间性能来说,总体可靠性更优。

关 键 词:词向量  Word2vec  CBOW  Skip-gram  NLP
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号