首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
免疫聚类算法在基因表达数据分析中的应用   总被引:3,自引:0,他引:3  
提出了基于免疫聚类算法的基因表达数据分析方法. 根据基因表达数据矩阵的特点,设计了改进的Consine系数来度量基因相似度;借鉴生物免疫学的有关免疫理论,利用基因表达数据分析的先验知识自适应地改变抗体本身及其与抗原亲合度的关系,构造了基于免疫优势克隆的聚类算法. 与K均值算法和遗传算法的对比实验表明,该算法能够获得较大的类内紧制度、较小的类间分离度,具有较好的工程应用价值.  相似文献   

2.
针对传统办公自动化系统只能处理公文数据,阐述了知识管理在办公自动化系统的作用,给出知识发现的体系模型,并对知识发现与提取的算法进行了研究,利用知识聚类与相似度的计算生成知识。  相似文献   

3.
讨论了在结构化的数据库中发现有用知识的一些研究工作。这项工作是在前期工作的基础上进行的 ,〔1〕文曾提出了一个新的知识发现系统 ,本文对该系统作了改进 ,它使用遗传编程方法得到一组对象集 ,系统对该对象集在数据库查询表中发现判别式规则。为了在数据库中发现有用的判别式规则 ,首先要对给定数据库聚类产生相似对象集 ,再将所得对象集应用于发现系统  相似文献   

4.
以专利引证网络为载体,从知识基因稳定性、遗传性以及变异性等基本特征出发,提出一种基于subject-action-object三元组的知识基因提取方法.应用连接度算法分析专利引证关系,挖掘引证专利和被引专利之间继承和发展的知识流,建立知识进化轨迹|利用文本语法分析技术,从专利权利要求书中提取subject-action-object三元组|基于语义词库WordNet进行语义加工,计算语义相似度,合并同义的subject-action-object三元组,绘制知识基因图谱.从美国专利数据库中采集了5 073项1975-1999年授权的数据挖掘领域的相关专利,分析了专利的地区分布情况和年度分布情况.从NBER (National Bureau of Economic Research)的专利数据集中查询得到专利引证关系,利用网络分析软件Pajek构建专利引证网络,作为实验数据样本,对所提出的知识基因提取方法进行验证.实验结果表明:所提取的subject-action-object三元组具备了知识基因稳定性、遗传性和变异性等特征,可以作为知识基因的一种表现形式.  相似文献   

5.
针对基于非负低秩稀疏表示的子空间聚类方法不能准确描述数据集结构的问题,提出了一种稀疏流形低秩表示的子空间聚类方法。该方法使用双曲正切函数代替核范数来估计秩函数,并利用加权稀疏正则项使表示系数矩阵稀疏,同时引入稀疏流形正则项来刻画数据集的内在流形结构信息。首先通过带有自适应惩罚的线性交替方向法求解子空间表示模型。然后利用获得的表示系数矩阵构造相似度矩阵,结合使用谱聚类方法得到数据集的聚类结果,最后采用基于局部和全局一致性的半监督分类方法获得数据集的分类结果。在Extended Yale B数据库、CMU PIE数据库、ORL数据库、COIL 20数据库和MNIST数据库上的实验结果表明,本方法可以提高子空间聚类和半监督学习的准确率。  相似文献   

6.
数据库中知识发现KDD是目前数据库应用领域的重要内容。本文介绍了其基本原理及方法,描述了一种常用的面向属性归纳算法,并结合综合化计算机辅助考试系统ICAT的研究情况,对KDD应用中的相应关键问题进行介绍。  相似文献   

7.
知识发现与数据可视化技术浅析   总被引:7,自引:0,他引:7       下载免费PDF全文
数据挖掘和知识发现、数据可视化技术都是发现数据库中数据中隐藏的信息的有效途径。知识发现过程离不开数据可视化的支持,数据可视化分析本身是一种知识发现的过程,并提到将知识发现与数据可视化有机集成的问题。  相似文献   

8.
从审计领域的实例发,指出数据库的数据语义不但受到数据库完整的性的约束,而且受到数据库应用领域的特殊约束,并且把判断数据库是否满足特定领域的约束问题归为对数据库数据语义的判别,文中通过给出审计专家系统(Audit Expert System,AES)的实现方案,分析了审计领域对数据库的特殊约束,提出用规则组的知识表示方法来表达这些特殊约束,并给出了基于规则组的推理策略,使用规则组知识表示方法,缩小了选择可用知识的范围,有效地降低了算法的时间复杂度。  相似文献   

9.
模糊聚类是目前知识发现领域的研究分支之一,而遗传算法是一种良好的优化算法.本文将遗传算法引入模糊聚类中,结合模糊聚类的特点,提出了一种适合于模糊聚类的遗传编码方案,并通过仿真表明了该编码的可行性.  相似文献   

10.
针对传统文本统计学抽样风险问题,采用文本挖掘技术提取相关文献中具有分析价值的信息,引入自然语言处理技术对文献信息进行主题词抽取和清洗,利用文本聚类结合知识图谱和数据可视化,为分析相关文献研究方向的现状、热点和发展趋势等提供依据。以教育类文献为例,通过研究表明,自然语言处理技术与聚类方法结合数据可视化可以为分析当前教育领域的研究热点和发展趋势提供有力的数据支撑。  相似文献   

11.
服务聚类能够极大的提升服务发现的能力。但是,现有服务聚类方法缺乏针对服务描述文件语义稀疏情境下的研究。针对该问题,本文首次将迁移学习技术应用到服务聚类领域以尝试解决服务聚类过程中语义稀疏的问题。通过使用一种对偶PLSA模型来融合目标领域和辅助领域语料知识,利用无监督的方式迁移知识以促进语义稀疏领域的服务聚类过程。实验结果表明,该方法能够提高针对语义稀疏情景下服务的聚类效果。与K-Means等方法相比,该方法在聚类纯度、熵指标上均具有更好的效果。  相似文献   

12.
分析和研究了一种分布式数据模型的策略 ,利用聚类分析算法和智能 Agent技术 ,对相关数据进行聚类统计 ,按照同类数据聚合的原理 ,决定需调整和转移的数据 ;在此基础上 ,提出了系统集成中数据分布不合理时的数据动态转移 ,以及在数据转移过程中 ,异种数据库之间的数据格式转换等问题的解决方案  相似文献   

13.
聚类分析是数据挖掘领域中一种非常有用的技术,它用于从大量数据中寻找隐含的数据分布模式,主要有分割法、层次法、密度法、网格法和模型法等。该文主要讨论数据挖掘中一种基于密度和网格的聚类分析算法及其在客户关系管理中的应用。该算法具有较高的聚类效率而且容易实现,可以发现任意形状的聚类,时间复杂度低,聚类精度高,适用于数据的批量更新。该文还提出增量式聚类技术,它不仅能够利用前期聚类的结果,充分提高聚类分析的效率,而且可以降低维护知识库所带来的巨大开销。实验证明了算法的有效性。  相似文献   

14.
心电信号在线数据知识化辅助诊断算法研究   总被引:1,自引:0,他引:1  
针对心电监护与诊断过程中数据量大、准确性和快速性要求高的特点,提出了一套基于数据知识化的心电辅助诊断算法.该套算法包括数据识别、冗余处理、转换和提取过程,利用小波变换的多分辨率和抗干扰能力好的特点,检测QRS波、P波、T波,提高了特征检测的准确性;利用聚类分析具有较好的鲁棒性和适合于大数据量分析的特点,对QRS进行波形分类;算法结合了单独一搏诊断和串诊断以及多参数综合分析.采用MIT-BIH标准心电数据库中的部分数据和心电专家确诊的心律失常数据文件对该算法进行了评估,检出率都在95%以上,表明该套算法对部分心律失常可以进行有效分析.  相似文献   

15.
介绍了研制的功能相关基因模块的共表达信息融合分析软件GeneHub的7个功能模块:数据提交及分解、统一编号、数据标准化、差异表达基因筛选、基因功能分组、表达相关性统计分析和综合评价.Gene.Hub涉及的生物学.数据库(LocusLink、Unists、GO、KEGG、BIND、MIPS).应用GeneHub,可选择不同的表达相似性测度(欧氏距离,Pearson相关系数。Spearman相关系数)在不同的实验数据集上研究功能相关基因的表达相关性.GeneHub已被用于研究按染色体定位、蛋白质互作及蛋白质复合物、调控通路、信号传导通路和细胞位置5个方面的基因功能分类体系下基因组共表达现象.该软件有利于整合其他多种基因组信息源,从而为采用信息融合分析技术挖掘基因表达谱数据和发现新的基因功能知识建立了很好的基础.  相似文献   

16.
聚类算法是数字识别的热点研究技术之一,是一种寻找特征相似的聚合类的非监督学习的方法。采用聚类法在vc++6.0环境进行手写体数字识别系统设计。通过图像的分割与特征提取,模式相似性测量和聚类的分析完成识别工作。结果表明基于试探的聚类识别算法的手写数字识别系统识别率达到100%,满足实际应用需求。  相似文献   

17.
聚类的目的是帮助人们发现和认识未知世界,为现实生活中的学习积累知识。聚类分析一直是广大学者重点关注的无监督学习内容,也是许多交叉学科用来探索数据中潜在规律的重要分析工具。通过简单梳理聚类分析的研究成果,在理解聚类分析基本框架的基础上对当前聚类算法在处理多样化数据类型的能力、处理超高维数据的能力、处理不均衡数据的能力、算法的可拓展能力、效果评价的指标选择问题等方面出现的挑战性问题进行了论述,并分析了未来有待重点解决的一些问题。这些工作将为后续聚类分析和数据挖掘的深入研究提供有价值的参考。  相似文献   

18.
基于聚类分析的变压器局部放电智能诊断的研究   总被引:2,自引:0,他引:2  
现场局部放电在线监测系统所检测的原始信号一般包含多种干扰信号和不同类型的局部放电信号,不同类型的局部放电信号叠加同样也会给局部放电的诊断造成困难。聚类分析是将相似的数据对象组成多个簇的过程,通过聚类能够从大量数据中提取有价值的知识和模式,同时还可以有效地处理噪声数据。根据大量的现场测量,提取工频周期上局部放电特高频(UHF)检波信号的特征参数,采用模糊聚类的方法,排除了脉冲干扰信号。采用灰评估以及关联分析的方法,提取不同类型局部放电所对应的相位统计谱图(PRPD)的特征参数,对比实验室建立的标准局部放电类型模式库和状态模式库,智能化诊断出现场局部放电信号所表征的放电类型和放电状态。  相似文献   

19.
一种加权欧氏距离聚类方法   总被引:5,自引:0,他引:5       下载免费PDF全文
聚类是数据挖掘的一种常用技术,最常用的距离度量方法是欧几里得距离,但运用加权欧氏距离需要对数据的实际意义有一定了解,并且要求分析者具有相关的专业知识,而在实际操作中这一点很难保证。本文提出了一种在对数据没有任何先验信息的情况下,如何运用加权欧氏距离有效进行聚类的方法。并结合实例,说明在一定条件下,这种加权欧氏距离聚类方法能显著提高聚类质量。  相似文献   

20.
针对关系数据库及其应用中多个区域查询的并发处理,提出了一种区域聚类的方法,其基本思路是将多个查询中相近的区域分成若干组,每组构成较大的区域,从较大的区域中检索元组.这种方法避免了多个区域中相同部分的多次访问,减少了数据库I/O操作的次数.对于低维和高维数据,此方法与一一查询的朴素方法相比,其性能都有明显提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号