首页 | 官方网站   微博 | 高级检索  
     

面向泛娱乐文本的层次多标签分类方法
引用本文:陈若愚,刘秀磊,于汝意.面向泛娱乐文本的层次多标签分类方法[J].计算机应用与软件,2023(1):60-65.
作者姓名:陈若愚  刘秀磊  于汝意
作者单位:1. 北京信息科技大学网络文化与数字传播北京市重点实验室;2. 北京信息科技大学数据与科学情报分析实验室
基金项目:北京市教育委员会科技计划面上项目(KM201811232018);
摘    要:针对泛娱乐领域文本情报预测类别标签具备有向无环图(DAG)结构的特点,提出一种考虑标签层次结构的基于最优路径层次多标签分类方法。根据现有标签构建DAG结构并将其转化为较易处理的树形结构;采用局部策略为树形结构中每个节点分别训练基分类器,同时为每个节点设置贡献值,贡献值由分类器输出概率与层次权重组合而成,贡献值大于阈值时该节点设置为1,否则为0;对树形结构进行深度优先遍历生成路径,计算各路径得分,选择满足层次约束并得分最高的路径作为最终预测集合。在泛娱乐公开文本信息数据集上进行了4组实验,结果表明该方法相较于分类器链、二元分析、SVM多标签分类和MLKNN算法,分类效果更优。

关 键 词:层次多标签分类  最优路径  有向无环图结构  树形结构
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号