首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
基于粗糙集的加权朴素贝叶斯邮件过滤方法   总被引:5,自引:3,他引:2  
邮件过滤中有两个关键问题,一是如何选择有效的邮件特征集,二是设计较好的邮件过滤算法。在对邮件特性进行分析的基础上,综合邮件头及邮件内容的主要形象特征给出了一种新的邮件特征集提取方法。用粗糙集的信息观点度量了各属性的重要性,并以此为权重进行加权朴素贝叶斯垃圾邮件过滤,有效地解决了朴素贝叶斯分类中的条件依赖性问题。通过在中英文邮件集上的测试实验,证明了所提出的邮件过滤方法的有效性。  相似文献   

2.
基于熵和相关系数的直觉模糊多属性决策方法   总被引:1,自引:0,他引:1  
王翠翠  姚登宝  毛军军  孙丽 《计算机应用》2012,32(11):3002-3017
针对决策信息为直觉模糊信息且属性权重完全未知的多属性决策问题,提出了一种基于直觉模糊熵和得分函数的决策方法。为了准确度量直觉模糊集的直觉性和模糊性,首先提出了一种新的直觉模糊熵,并讨论其相关性质。其次为了减少不确定信息对决策的影响,结合直觉模糊熵建立规划模型,从而确定属性权重。 同时从隶属度,非隶属度和犹豫度三方面构建论域对象与理想对象之间相关系数,并在此基础上根据决策者的决策态度定义得分函数进而得到最优决策。 最后给出一种基于直觉模糊信息的多属性决策方法,并通过候选人评估实例验证了该方法的可行性和有效性。  相似文献   

3.
拼盘料单拼盘主料:TNMPOP3控件的使用方法和属性介绍拼盘辅料:使用Delphi实现电子邮件接收程序的详细介绍拼盘材料:程序代码在Windows2000+Del鄄phi6.0环境下调试通过一、程序概述本程序通过TNMPOP3控件实现了简单的邮件收取程序。程序运行后,输入相关信息(包括主机、端口、用户名和密码后),单击“连接”按钮可连接服务器,连接成功后,单击“列出信息”按钮可列出所有的邮件信息,然后可单击“获取信息”或“获取摘要信息”来收取邮件或者浏览邮件的内容(包括来信人、主题、大小、邮件头、邮件正文和附件信息)。单击“删除”按钮可删除…  相似文献   

4.
序贯三支决策方法是一种能够表示问题中的多重层次粒度,并将多粒度结合起来解决不确定决策问题的有效途径。优势-等价关系粗糙集则是针对条件属性具有偏好关系的分类问题,提取有序信息,对目标概念进行近似,从而形成决策知识。利用传统的优势关系粗糙集方法进行知识约简和提取的效率低下,而目前大部分序贯三支决策方法则局限在符号值属性的信息系统中,对连续值和有序值不能进行有效处理,造成一定程度的信息丢失。因此,将序贯三支决策的思想应用于优势关系粗糙集模型中,定义了一种新的基于序贯三支决策的属性约简及相应的属性重要度,对具有偏好值属性的信息系统进行更加高效的处理,通过多粒度的表示和关系的研究,加速了知识约简过程。选取了多组UCI数据进行实验,结果表明所提出的基于优势关系的序贯三支决策方法能够在保证约简质量的基础上明显降低时间耗费。  相似文献   

5.
为了改进已有邮件过滤算法的不足之处,提出一种新的邮件过滤算法。以往的大部分过滤算法采用的都是邮件属性精确匹配算法,并未使用模糊匹配思想,因此邮件的漏检率较高,并且发现未知邮件的效率较低。针对以往邮件过滤算法中漏检率比较高的不足之处,文中提出的邮件过滤算法的改进思路是:首先使用传统的黑白名单过滤技术对已知的邮件进行分类,那些是正常邮件,那些是垃圾邮件。在此基础之上使用相似性算法来计算未知邮件与已知邮件的相似度,从而达到对未知邮件分类目的,最后使用MMTD算法对的邮件相似度的好坏做出衡量,并且以此为邮件过滤提供有效的依据,经过以上的三个步骤之后,最后进行邮件的过滤。  相似文献   

6.
服务器端存在多个用户,且人们对邮件内容的理解和认可程度不同,因此邮件过滤中涉及到不确定信息的处理。就邮件内容来看,邮件过滤通常涉及到隐私,不利于大量收集样本并评价打分。因此提出了一种基于改进的一分类支持向量机的邮件过滤方法。该方法优点在于:(1)用户只需为不确定性很强的待区分邮件给出隶属度;(2)只需收集和训练一类邮件样本,便可以建立邮件分类模型;(3)把隶属度首次引入到1-SVM中,并且由隶属度的值的大小来确定惩罚因子的值。通过仿真实验验证了该方法的有效性。  相似文献   

7.
薛占熬  朱泰隆  薛天宇  刘杰 《计算机科学》2015,42(8):265-268, 272
针对传统决策过程中权重规则确定的主观性和参数数值计算的不确定性问题,在粗糙集和三支决策理论的基础上,对条件属性权重构造方法进行了研究。重新定义了属性确定度和属性约简度,提出了一种属性权重构造方法,通过实例将该方法与其它条件属性权重构造方法进行了分析比较,证明了其有效性。该方法基于数据本身,不需要先验信息,从客观的角度对属性进行判断,决策者通过该方法可以得到更加合理的权重分配,做出符合实际的决策。该论文对研究属性权重分配问题,具有一定的理论价值。  相似文献   

8.
阐述邻域粗糙集和邻域信息熵的基本定义及性质,为避免数值属性信息系统属性约简过程中,属性离散化造成特征信息的丢失,提出一种新的基于邻域信息熵度量数值属性约简算法。扩展邻域信息系统核属性集生成约简属性集,邻域信息熵度量不仅关注约简属性集正域变化,而且考察负域样本空间约简属性邻域等价类在决策属性划分的分布,具备更好的邻域关系度量细粒度。实验表明,对比邻域粗糙集近似度量、邻域有效信息率度量、邻域软间隔度量的属性约简方法,该算法能有效进行邻域信息系统属性约简的同时,也保持了约简属性集更好的分类精度。  相似文献   

9.
邓维斌  洪智勇 《计算机应用》2010,30(8):2006-2009
如何将邮件的头信息和内容信息有效结合起来进行垃圾邮件过滤备受研究人员的关注。基于粗糙集具有很好地处理不确定信息的特点,提出了一种基于粗糙集的两阶段邮件过滤方法,首先根据邮件头信息将其分为正常邮件、垃圾邮件和可疑邮件,再根据邮件内容将可疑邮件分为正常和垃圾邮件。通过在中英文邮件集上的测试实验,证明了所提出的邮件过滤方法不仅能提高垃圾邮件过滤的准确率,而且能大幅降低误杀率。  相似文献   

10.
张曼  李弼程  林琛 《计算机工程》2008,34(11):270-272
在邮件服务端和邮件客户端,重复邮件浪费了大量资源。该文提出一种基于SHA-1的邮件去重算法,将邮件按大小分开处理,根据Hash值快速去除正文相同或相似的重复邮件。实验结果表明了该算法的有效性,其运行速度比传统方法快。  相似文献   

11.
Paw lak粗糙集模型没有对正域、边界域和负域赋予语义,不能进行再决策,而三支决策对边界域赋予了新的语义,可以对边界域做出进一步刻画,对于边界域的进一步划分,依据属性的重要性,使满足条件的样本划入再决策域,不满足条件的样本继续保留在边界域中,降低了边界域样本处理的失误率.本文在对概率粗糙集模型、三支决策粗糙集的理论、贝叶斯理论的决策过程和决策粗糙集模型进行研究的基础上,提出了一种三支决策与决策粗糙集融合模型,与Paw lak-三支决策模型相比,其划分损失更小,处理结果更优.该模型运用三支决策理论对决策粗糙集的边界域赋予延迟决策的语义,对于延迟决策再运用三支决策理论进行迭代操作,对边界域样本进一步处理.在迭代的过程中,依据属性的重要程度将属性排序,从而客观的得到迭代过程中每次优先依据哪个属性进行划分.实验结果表明,该模型比单一运用决策粗糙集模型进行决策代价小,三支决策通过迭代对边界域处理的正确率有所提高,这为准确决策提供了一种新的方法.  相似文献   

12.
实体关系抽取作为信息抽取研究的重要研究课题之一,对知识图谱数据层的构建有着重要的意义。提出一种基于三支决策的两阶段分类技术实现实体关系抽取,首先构建SVM三支决策分类器实现第一阶段实体关系抽取,采用softmax多分类函数作为三支决策概率函数,然后采用KNN分类器对三支决策分类后的中间域样本进行二阶段分类。以ACE2005的语料作为实验数据,将三支决策两阶段分类结果与传统SVM方法分类结果进行比较,实验结果表明,基于三支决策的两阶段实体关系抽取方法取得了很好的分类效果。  相似文献   

13.
考虑到区间二型模糊数在描述高度不确定性信息方面的优势,将区间二型模糊数拓展到决策粗糙集中,提出两种区间二型模糊三支决策方法.在没有类标签的区间二型模糊信息系统中,解释损失函数与确定条件概率是需要解决的两个关键问题.首先,根据区间二型模糊数的性质,将其引入决策粗糙集中,为损失函数提供一种新的解释.其次,基于贝叶斯决策过程...  相似文献   

14.
针对二支决策TAN分类器在处理不确定数据时有较高的错误率,提出一种新的三支扩展TAN贝叶斯分类器(3WDTAN).首先通过构建TAN贝叶斯分类模型,采用先验概率和类条件概率估计三支决策中的条件概率;其次构建3WD-TAN分类器,制定3WD-TAN分类器中正域,负域和边界域的三支分类规则,结合边界域处理不确定性数据的优势,在一定程度上纠正了传统TAN贝叶斯分类器产生的分类错误;最后通过在5个UCI数据集上选取NB、TAN、SETAN算法进行对比实验,表明3WD-TAN具有较高的准确率和召回率,且适用于不同规模数据集的分类问题.  相似文献   

15.
Based on decision-theoretic rough set model of three-way decisions, we augment the existing model by introducing linguistic terms. Considering the two types of parameters being used in the three-way decisions with linguistic assessment, a certain type of novel three-way decisions based on the Bayesian decision procedure is constructed. In this way, three-way decisions with decision-theoretic rough sets are extended to the qualitative environment. With the aid of multi-attribute group decision making, the values of these parameters are determined. An adaptive algorithm supporting consistency improvement of multi-attribute group decision making is designed. Then, we optimize the scales of the linguistic terms with the use of particle swarm optimization. The values of these parameters of three-way decisions are aggregated when proceeding with group decision making. Finally, the proposed model of three-way decisions with linguistic assessment is applied to the selection process of new product ideas.  相似文献   

16.
三支决策依托的条件概率只具有相对性,绝对性度量的引入与集成有利于规则提取.文中挖掘绝对条件概率建立三支关注,研究三支决策与三支关注的双量化集成.提取相对条件概率与绝对条件概率,分析2种度量的系统关系,得到异质性与互补性.利用绝对条件概率建立三支关注,与三支决策进行双量化集成,得到集成区域类型与基本语义(粒)体系.利用一个统计决策表案例进行说明.三支关注依托绝对条件概率成为新型三支模式,与三支决策的双量化集成呈现系统性与应用性.  相似文献   

17.
针对典型的支持向量机增量学习算法对有用信息的丢失和现有支持向量机增量学习算法单纯追求分类器精准性的客观性,将三支决策损失函数的主观性引入支持向量机增量学习算法中,提出了一种基于三支决策的支持向量机增量学习方法.首先采用特征距离与中心距离的比值来计算三支决策中的条件概率;然后把三支决策中的边界域作为边界向量加入到原支持向量和新增样本中一起训练;最后,通过仿真实验证明,该方法不仅充分利用有用信息提高了分类准确性,而且在一定程度上修正了现有支持向量机增量学习算法的客观性,并解决了三支决策中条件概率的计算问题.  相似文献   

18.
现有三支决策主要针对各类完备信息系统或不完备单一型信息系统进行研究,而现实应用领域中数据往往呈现不完备性和复杂性等特征,为此,构建面向不完备混合决策系统的三支决策模型与规则获取方法。首先,计算不完备混合数据的完备邻域容差类,并将其代替等价类计算三支决策模型的条件概率;然后,根据扩展的损失函数区间概念获取各对象在乐观、折中和悲观决策下的不同阈值,进而针对不完备混合决策系统构造三种决策风险下的三支决策模型。最后,通过理论分析和医疗诊断实例详细分析了算法的有效性和可解释性,并通过实验比较和分析可知,所构模型较其他已有模型的分类过程更加合理有效,同时该模型也扩充了三支决策模型和知识发现的理论与应用研究。  相似文献   

19.
曾婷    唐孝    谭阳    丁本香   《智能系统学报》2020,15(6):1068-1078
在三支决策模糊粗糙集模型中,一些学者基于相似度三支决策模糊粗糙集模型建立了目标函数来得到最优阈值对 $\left( {\alpha ,\;\beta } \right)$ 的计算方法,但在该过程的研究中,学者并没有在相似度三支决策模糊粗糙集模型中讨论关于决策代价的描述问题。基于模糊信息系统用新的函数来描述决策代价成为计算阈值对 $\left( {\alpha ,\;\beta } \right)$ 的一种方法,首先,在模糊信息系统中,通过建立一个描述决策代价的函数,将模糊信息系统中的模糊数与三支决策的决策代价联系在一起;然后对隶属频率进行拟合,得到了三支决策中决策代价的数值描述;最后,通过两个实例说明了该方法的可行性和适用性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号