排序方式: 共有111条查询结果,搜索用时 171 毫秒
101.
With the emergence of a large amount of short texts, using short text classification technology to mine a large amount of effective information in short text has become a hot topic of research. For the feature selection method in the current classification process, which only considers the word frequency, and the short text is short in length and sparse keywords, the paper proposes a short text classification method based on emotional features, combined with TF-IDF, the weight of the feature words is modified with the 〖JP2〗sentiment dictionary, which can effectively improve the weight of the feature words with distinguishing ability, and avoid the problem of low accuracy caused by traditional methods which do not consider emotion but only word frequency. Using the Chinese corpus of teacher Tan Songbo for short text classification, through comparative experiments, the effectiveness of the method is verified. 相似文献
102.
结合语义的特征权重计算方法研究 总被引:2,自引:1,他引:1
为进一步改善目前大多数基于向量空间模型(VSM)的文本聚类算法的效果,研究了文本聚类的基础和关键环节--文本间相似度的计算,其中一个重要步骤就是计算各文本中特征词的权重,该计算的合理性和有效性直接影响到文本相似度的准确性和聚类的效果.传统的VSM特征权重计算方法-TF-IDF,没有考虑语义相似的词语在文本集中的分布情况,针对该问题,在基于"知网"的词语语义相似度分析基础上,提出了一种改进的TF-IDF权重计算方法.实验结果表明,该算法是有效可行的,且在一定程度上提高了文本聚类的查准率和查全率. 相似文献
103.
基于分块主色调和纹理特征的彩色图像检索 总被引:1,自引:0,他引:1
提出一种基于分块主色调和纹理特征的彩色图像检索方法。该方法首先提取占彩色图像比重较大的前几种主色调,根据主色调将图像划分为不同分块,并以主色调作为各分块图像的颜色特征。然后,采用灰度共生矩阵算法,提取各分块的纹理特征。综合考虑各分块图像的颜色特征和纹理特征,从图像数据库中检索相似图像。实验结果表明,该方法具有较高的检索效率。 相似文献
104.
105.
特征选择即是降维去噪的过程,一个词汇是否具有强的类别区分能力通过特征选择评价函数的权值大小来衡量,然而影响特征选择的因素有很多,主要包括特征的维度、重要性和语义;针对短文本信息量少导致特征表示高维稀疏和传统特征提取方法缺乏语义的问题,构建多因素融合的特征选择函数FS,和传统的特征选择函数TF-IDF对比,FS不仅融入了特征的语义性,而且能够去除大量冗余特征,提高具有类别区分能力特征的权重;把FS作为新的特征选择函数,使用搜狗实验室的中文语料库进行短文本分类实验,验证了方法有效性. 相似文献
106.
基于模糊熵的改进型PCNN图像分割方法 总被引:2,自引:1,他引:1
针对传统的PCNN在图像分割中需要设定大量的参数,并且分割的最佳迭代次数无法自动确定等问题,简化了传统PCNN模型的接受部分,改进了PCNN的连接部分,改变了PCNN的阈值衰减方式,并利用最大模糊熵作为最佳分割迭代次数的判定准则,提出了一种新的PCNN改进模型,从而实现了PCNN的自动精确分割.对各类图像的实验结果表明,该方法能够自动确定循环迭代次数和自动选取最佳阈值,与基于最大香农熵的PCNN分割方法相比,该方法具有收敛速度快、分割精度高、分割效果好等特点. 相似文献
107.
108.
109.
为了有效控制低负荷改良型氧化沟工艺的污泥膨胀现象,对该工艺的运行参数进行了系统的分析。结果表明,工艺发生污泥膨胀的主要原因是由于氧化沟循环廊道内的溶解氧浓度分级不明显。针对污泥膨胀原因及相关的膨胀机理,采用在循环廊道内加设插板来保证缺氧区、好氧区溶解氧浓度的合理分布。确定了试验装置的最佳运行条件为:好氧区溶解氧含量为1.5—2.0mg/L,缺氧区溶解氧含量小于0.5mg/L,污泥指数为120~150mL/g,污泥质量浓度为3.5-4.0g/L。 相似文献
110.
为了消除自然语言对构件文本信息描述的二义性以及增强术语间的语义关系,文中采用领域本体的思想,给出了一个基于人工智能领域本体的软件构件聚类模型和基于该模型的聚类算法。该模型通过分析领域的共同概念,形成领域本体知识库,提供领域内一致认可的术语,用于匹配对构件文本描述所使用的自然语言。给出的算法通过与基于传统空间向量的K—Means算法分析比较,验证了该算法是有效的,实现了对软件构件更合理的聚类,提高了构件检索的效率和准确性。 相似文献