期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杜芳华冀俊忠吴晨生吴金源《计算机工程》2014,(11):167-171

半监督文本分类中已标记数据与未标记数据分布不一致,可能导致分类器性能较低。为此,提出一种利用蚁群聚集信息素浓度的半监督文本分类算法。将聚集信息素与传统的文本相似度计算相融合,利用Top-k策略选取出未标记蚂蚁可能归属的种群,依据判断规则判定未标记蚂蚁的置信度,采用随机选择策略,把置信度高的未标记蚂蚁加入到对其最有吸引力的训练种群中。在标准数据集上与朴素贝叶斯算法和EM算法进行对比实验,结果表明,该算法在精确率、召回率以及F1度量方面都取得了更好的效果。相似文献

2.

基于特征选择技术的情感词权重计算 总被引：2，自引：0，他引：2

吴金源冀俊忠赵学武吴晨生杜芳华《北京工业大学学报》2016,42(1):142-151

在文本情感分析中,情感词典的构建至关重要,然而目前这方面的研究大多集中在简单的词语极性判别上,有关情感词的权重赋值研究较少,且已有的权重赋值方法基本上都需要人工辅助来选取基准词,这给实际应用带来很大的困难.针对此问题,提出了一种自动的基于特征选择技术的情感词权重计算方法.首先提出了词语情感权重与文本情感倾向的相关假设;然后针对情感分类,结合二元分类的特性改进了信息增益(information gain,IG)和卡方统计量(chi-square,CHI),将特征选择技术应用于情感词权重计算.实验结果表明:将计算所得的带情感权重的情感词库用于文本情感分类能够提升分类精度. 相似文献

3.

基于类别加权和方差统计的特征选择方法 总被引：1，自引：0，他引：1

冀俊忠吴金源吴晨生杜芳华《北京工业大学学报》2014,40(10):1593-1602

为提高不均衡文本分类的准确率和稳定性, 提出了一种基于类别加权和方差统计的联合特征选择方法.首先, 基于类别文档数大小对特征选择的影响, 给出了一种类别加权策略以强化小类别的特征;其次, 在探究特征类别区分能力的基础上, 设计了类别方差统计策略来凸显含有丰富类别信息的特征;最后, 将2种策略相融合, 实现了一种联合特征选择的新算法.在Reuters-21578和复旦大学语料这2个不均衡语料上的实验都表明:该算法有效, 特别是在小类别的分类效果上远远好于IG、CHI和DFICF等流行的通用算法. 相似文献

4.

从不后退

杜芳华《建筑工人》1997,(5)

我不管,别人用什么眼光看我。一身的泥土,一脸的汗水,我的年华写满苦和累。但我的脚步从不后退,因为我给别人带来希望,也塑造了自己顶天立地的形象。从不后退@杜芳华!吉林汪清~~ 相似文献

5.

砖的赞歌

杜芳华《建筑工人》1997,(12)

出自泥土又奉献给大地的砖啊你经受了炽火的洗礼与铸炼从不因自己陋小的身躯而自弃也不因馈赠人间的温暖而自傲土生土长本身就平平凡凡出自泥土又奉献给大地的砖啊你经受了秋霜冬寒的考验你多像我们默默无闻的建筑工人为咱祖国的昌盛呕心沥血毫无怨言砖的赞歌@杜芳华!吉林汪清~~ 相似文献

6.

雨中施工

杜芳华《建筑工人》2019,(5)

<正>~~ 相似文献

7.

南方来的小师傅

杜芳华《建筑工人》1996,(7)

工地上有一个从南方来的小师傅,他说他十八岁。小师傅的技艺.看惊了我们的眼睛,十八岁的年龄让我们睑红。小师傅是见过大世面的人,每到一处就筑起一道风景,他像一面镜子映照我们。南方来的小师傅@杜芳华~~ 相似文献

8.

技术员

杜芳华《建筑工人》2019,(5)

<正>~~ 相似文献

9.

基于特征映射的半监督文本分类算法

杜芳华冀俊忠赵学武吴晨生《北京工业大学学报》2016,42(2):230-235

针对已标记数据与未标记数据分布不一致可能导致半监督分类器性能降低的不足,提出了一种基于特征映射的半监督文本分类算法.首先通过不同的特征选择方法,分别在训练集的已标记数据、未标记数据以及测试集数据中选取各自的特征集,并初始化特征的权值;在此基础之上,分别建立已标记数据与未标记数据、已标记数据与测试集数据、未标记数据与测试集数据之间的映射函数,并利用这3个特征映射函数重新计算特征的权重;最后利用期望最大比(expectation maximization,EM)算法进行半监督文本分类.在标准数据集上的实验结果表明:提出的算法是有效的. 相似文献