一种Word2vec构建词向量模型的实现方法 |
| |
引用本文: | 席宁丽,朱丽佳,王录通,陈俊,万晓容.一种Word2vec构建词向量模型的实现方法[J].电脑与信息技术,2023(1):43-46. |
| |
作者姓名: | 席宁丽 朱丽佳 王录通 陈俊 万晓容 |
| |
作者单位: | 1. 贵州师范大学教育学院;2. 贵州师范大学外国语学院;3. 广西现代职业技术学院教师教育学院 |
| |
基金项目: | 贵州省教育厅高校人文社会科学研究项目(项目编号:2020GH015); |
| |
摘 要: | Word2vec是一种基于简单神经网络的自然语言处理方法,是一种词嵌入技术,可用于构建高维词向量。研究针对Word2vec词向量表示方法进行模型构建和分析,通过NLPCC2014语料训练,将词映射到高维词向量空间中,完成了Word2vec的功能实现以及可视化输出。实验中进一步针对CBOW模型与Skip-gram模型,这两种Word2vec中的重要模型进行对比研究,输出结果表明:在通过大语料训练中文词向量时,Skip-gram模型在新词识别上具有明显优势,综合模型准确性与时间性能来说,总体可靠性更优。
|
关 键 词: | 词向量 Word2vec CBOW Skip-gram NLP |
|
|