首页 | 官方网站   微博 | 高级检索  
     

多特征融合的教育资源标签生成算法
引用本文:李雯,文勇军,唐立军.多特征融合的教育资源标签生成算法[J].计算机与现代化,2020,0(9):19-24.
作者姓名:李雯  文勇军  唐立军
作者单位:长沙理工大学物理与电子科学学院,湖南长沙410114;长沙理工大学近地空间电磁环境监测与建模湖南省普通高校重点实验室,湖南长沙410114
基金项目:湖南省研究生科研创新项目;国家科技支撑计划;湖南省教育厅科学研究项目;湖南省重点研发计划项目;湖南省高等学校重点实验室开放基金
摘    要:利用标签的形式简单有效地对教育资源进行准确描述,对互联网中杂乱、庞大的教育资源进行高效分类,能使用户便捷地浏览和获取教育资源信息并提高教育资源的利用率。自然语言处理中生成文本标签的方法有很多种,但特征描述不全面,因此需要研究多特征融合的标签生成方法。本文结合中文文本的特点,在TextRank算法基础上,加入TF-IDF权重和位置信息权重,考虑词语在语料库中的信息及在文章中的位置信息,生成包括语料库信息和位置信息的标签,形成多特征融合的标签生成算法。测试结果及分析表明,多特征融合后的标签生成算法最高F值为0.571,其平均值为0.34,优于常用的TextRank算法和TF-IDF算法,有效提高了教育资源标签质量,有利于教育资源更好的利用和管理。

关 键 词:教育资源标签  TextRank算法  TF-IDF算法  标签生成  算法改进  
收稿时间:2020-09-24

A Multi-feature Fusion Algorithm for Label Generation of Educational Resources
Abstract:
Keywords:educational resource lable  TextRank algorithm  TF-IDF algorithm  lable generation  algorithm improvement  
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机与现代化》浏览原始摘要信息
点击此处可从《计算机与现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号