首页 | 官方网站   微博 | 高级检索  
     

基于舆情新闻的中文关键词抽取综述
引用本文:杨文忠,丁甜甜,康鹏,卜文秀.基于舆情新闻的中文关键词抽取综述[J].计算机工程,2023(3):1-17.
作者姓名:杨文忠  丁甜甜  康鹏  卜文秀
作者单位:1. 新疆大学信息科学与工程学院;2. 新疆大学信息科学与工程学院新疆维吾尔自治区多语种信息技术重点实验室
基金项目:国家自然科学基金(U1603115,62262065);;国家重点研发计划子课题(2017YFC0820702-3);;新疆维吾尔自治区自然科学基金(2021D01C080);
摘    要:基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度学习的序列标注模型所替代。梳理无监督关键词抽取的限制性、分类模型在关键词抽取中的优势与不足、以及现有的深度学习对关键词抽取技术发展的帮助,重点分析整体关键词抽取技术的发展中卷积神经网络、循环神经网络等深度学习的关键词抽取方法,并归纳现有方法的优缺点与发展趋势。此外,深度学习虽然在关键词抽取领域发挥了重要的作用,但其自身也存在着依赖大规模带标签样本、训练时间长与复杂度高等缺陷,需要在未来发展中进行解决。为确保分析过程的真实性,利用6个舆情新闻数据集和2个小型数据集进行实验复现,实验结果与文中理论分析一致。在此基础上,对关键词抽取技术及其所面临的困难和挑战进行梳理和分析,并针对现存问题对该领域的发展前景加以展望。

关 键 词:舆情监测  关键词抽取  核心词汇  深度学习  自然语言处理
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号