面向泛娱乐文本的层次多标签分类方法 |
| |
引用本文: | 陈若愚,刘秀磊,于汝意.面向泛娱乐文本的层次多标签分类方法[J].计算机应用与软件,2023(1):60-65. |
| |
作者姓名: | 陈若愚 刘秀磊 于汝意 |
| |
作者单位: | 1. 北京信息科技大学网络文化与数字传播北京市重点实验室;2. 北京信息科技大学数据与科学情报分析实验室 |
| |
基金项目: | 北京市教育委员会科技计划面上项目(KM201811232018); |
| |
摘 要: | 针对泛娱乐领域文本情报预测类别标签具备有向无环图(DAG)结构的特点,提出一种考虑标签层次结构的基于最优路径层次多标签分类方法。根据现有标签构建DAG结构并将其转化为较易处理的树形结构;采用局部策略为树形结构中每个节点分别训练基分类器,同时为每个节点设置贡献值,贡献值由分类器输出概率与层次权重组合而成,贡献值大于阈值时该节点设置为1,否则为0;对树形结构进行深度优先遍历生成路径,计算各路径得分,选择满足层次约束并得分最高的路径作为最终预测集合。在泛娱乐公开文本信息数据集上进行了4组实验,结果表明该方法相较于分类器链、二元分析、SVM多标签分类和MLKNN算法,分类效果更优。
|
关 键 词: | 层次多标签分类 最优路径 有向无环图结构 树形结构 |
|