首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
董林  舒红  李莎 《计算机应用研究》2013,30(8):2330-2333
为简化空间频繁模式挖掘的预处理步骤并提高挖掘效率, 提出一种可以直接以空间矢量和栅格图层作为输入的挖掘算法FISA(fast intersect spatial Apriori)。该算法利用图层求交和面积计算操作实现谓词集支持度计数进而实现频繁谓词集和关联规则挖掘。相对于基于事务空间关联规则挖掘算法, FISA不需要预先进行空间数据事务化处理, 并且所得结果均有对应图层, 便于实现结果的可视化; 相对于其他基于空间分析的挖掘算法, FISA支持空间数据的矢量和栅格格式, 且引入了快速求交方法以保证其可伸缩性。实验结果表明该算法可以直接从空间数据中高效正确地挖掘出频繁模式。  相似文献   

2.
基于模糊c-means算法的空间数据分类和预测   总被引:2,自引:0,他引:2  
空间分类和预测是空间数据挖掘中一个非常重要的方法,但对它们的研究目前尚处于初始阶段.通过引入空间对象对模糊聚类的模糊隶属度的概念,提出了基于模糊c-means算法的空间数据分类和预测的方法(SFCM),该方法首先用模糊c-means方法对数据集论域空间进行聚类,但由于空间数据具有空间自相关的特性,在用模糊c-means算法进行空间聚类时加入了空间信息,然后计算每个空间对象对所有聚类的模糊隶属度并从中找出模糊隶属度最大的聚类,最后用该聚类中心对象的因变量的值作为该空间对象的因变量的估计值,理论分析和实验结果表明,该算法是有效可行的.  相似文献   

3.
使用基于树核函数的方法来进行语义角色标注,有效的树核空间的设计是影响系统性能的关键。探索树核空间在中文语义角色标注上的应用,考虑到同一谓词的各论元间的相互影响,提出多论元-谓词特征(AAPF)空间,并在此基础上提出了三种受平面特征启发的树核空间设计方法。基于中文PropBank语料的实验表明,加入一些重要平面特征信息的树核空间,性能有了明显的提高,分类精确率由90.96%提高到92.54%。最后使用复合核将特征启发的树核与特征向量结合起来,精确率达到95.21%,性能高于同类系统。  相似文献   

4.
基于灰度共生矩阵的思想分析光线空间数据特征,在此基础上提出一种基于主方向匹配的光线空间插值方法。实验结果表明,新的插值方法插值生成的光线空间与传统的线性插值方法和自适应滤波插值方法生成的光线空间相比在PSNR上分别提高了3.44dB和1.97dB。  相似文献   

5.
空间数据库的广泛应用给人们的生活带来极大便利的同时,也带来了严重的安全威胁.空间应用要求授权系统支持灵活的细粒度授权策略以及否定策略,提供高效的授权实现技术.针对这些安全需求,提出一种基于谓词的矢量数据授权模型,并依据空间数据库管理系统在实现上的特征,采用谓词改写的方法实现对矢量数据的有效授权.和现有工作相比,该模型利用授权谓词表示授权区域,具有更灵活的表达能力,且支持否定授权;所提出的谓词改写的方式不仅避免授权判定时额外增加的一次空间查询,而且可以保证与空间数据库管理系统的低耦合度,还有利于空间谓词的优化,减少空间谓词的冗余.实验证明,该授权模型和实现方法能够满足空间应用的安全需求,实现对空间数据库矢量数据的访问控制和有效授权.  相似文献   

6.
空间结构化查询语言-G/SQL   总被引:7,自引:0,他引:7       下载免费PDF全文
传统的地理信息系统对空间数据的处理是过程化的,并且不能将空间数据作为一个整体来对待。这种处理方法限制了空间数据应用的发展。空间结构化查询语言扩展了关系数据库的SQL语言,朝着结构化的空间数据统一处理迈出了重要的一步。该文讨论了空间结构化查询语言的理论,在OGIS的概念和数据模型之上,提出了一套创新的地理数据模型,采用统一的方法存储和管理空间数据库中的属性数据和几何数据。根据这个模型,实现了一种空间结构化查询语言——G/SQL。G/SQL通过研究地物关系的9-交叉模型确定面向空间数据的扩充的空间算子,为应用程序提供空间拓扑关系谓词和空间函数。应用G/SQL成功地开发了一个基于Web 的地理信息应用系统WebGIS。实践表明,G/SQL提供的空间关系谓词和空间函数完备而且易于使用。还给出了G/SQL语法的BNF表示。  相似文献   

7.
基于向量空间模型的中文文本层次分类方法研究   总被引:8,自引:0,他引:8  
肖雪  何中市 《计算机应用》2006,26(5):1125-1126
在文本分类的类别数量庞大的情况下,层次分类是一种有效的分类途径。针对层次分类的结构特点,考虑到不同的层次对特征选择和分类方法有不同的要求,提出了新的基于向量空间模型的二重特征选择方法FDS以及层次分类算法HTC。二重特征选择方法对每一层均进行一次特征选择,并逐层改变特征数量和权重计算方法;HTC算法把分别对粗分和细分更有效的类中心向量法与SVM方法相结合。实验表明,该方法相对于平面分类和一般的层次分类方法,有较高的准确率。  相似文献   

8.
多个子空间直和能保证多个子空间数据融合时多个子空间得到的特征向量相互两两正交,融合数据采用该特征表示时冗余最小,更有利于分类识别。本文基于多子空间直和进行特征融合,提出了一种新的人脸识别算法。通过 2DPCA算法,首先分别计算所有训练样本归一化后正脸、左侧脸及右侧脸图像的协方差矩阵的各P个最大特征值对应的P个相互正交的特征向量,然后通过选取3个子空间的部分满足直 和条件的特征向量组成各自的特征空间(投影空间),再将样本正脸、左侧脸及右侧脸图像分别向各自特征空间投影得到3个特征矩阵,最后将此3个特征矩阵融合为该样本的特征矩阵用于最近邻分类器进行分类识别。最终通过本文3组实验数据的对比说明了该 算法能减少计算量并且提高了识别率。  相似文献   

9.
目前,主流的空间数据查询语言都是在SFA SQL或SQL/MM Spatial这两大国际标准的基础上进行扩展的.然而,这两大标准对于空间查询和空间分析都是函数式的,所以当查询条件增多时,其复杂的查询表达式既不适合普通用户使用,也不利于提高查询的效率.提出了一种基于GIS系统的空间查询语言SQDL-G,将空间谓词表示为空间运算符,将子查询结构引入查询表达式中,并在ArcGIS平台上建立了该语言的执行引擎.实验表明,该语言表达灵活,结构清晰,易于被用户接受.  相似文献   

10.
基于S-CART决策树的多关系空间数据挖掘方法   总被引:1,自引:0,他引:1  
郑向群  赵政 《计算机应用》2008,28(3):749-752
针对空间数据关系复杂的情况,提出了一种改进的多关系数据挖掘结构分类与回归树(S-CART)算法,该算法首先利用空间关联索引表抽取不同主题图层之间的关系原子命题,然后基于逻辑谓词创建多关系二叉决策树,抽取空间关联规则,同时基于我国湖北大冶部分地区土壤污染数据验证算法的有效性。  相似文献   

11.
谓词的自动识别是浅层句法分析的重要内容。本文提出了基于支持向量机分类算法的谓词自动识别方法,重点描述了在特征构建过程中基于信息增益的特征筛选方法与基于同义词词林的特征词度量方法。信息增益方法选取对分类影响较大的特征,降低了特征维度;同义词词林的度量方法将特征词映射为深层次的语义概念,增强了特征的表达能力,强调了属性特征与模型的相关度。在小规模语料库上的实验表明,谓词识别的最好F-Score达到了84.0%,相较于对数据无任何处理的情况F-Score提高了4.6%。结果表明,这种新的特征筛选与特征度量方法在谓词识别中十分有效,可以极大提高分类器的性能。  相似文献   

12.
实际应用中,数据常常表现出不完备性和动态性的特点。针对动态不完备数据中的特征选择问题,提出了一种基于相容粗糙集模型和信息熵理论的增量式特征选择方法。首先,建立了不完备信息系统中特征值动态更新时论域上条件划分与决策分类的动态更新模式,分析了作为特征重要度评价准则的不完备相容信息熵的增量计算机制,并将该机制引入到启发式最优特征子集搜索过程中特征重要度的迭代计算,进一步设计了不完备数据中面向特征值动态更新的增量式特征选择算法。最后,在标准UCI数据集上从分类精度、决策性能和计算效率3个方面对文中所提出的增量算法的有效性和高效性进行了实验验证。  相似文献   

13.
张永  李晓红  樊斌 《计算机工程》2009,35(18):182-184
不等式最大熵模型较为成功地缓解了文本分类任务中的过拟合问题,但它使用的特征选择算法不能完全发挥不等式最大熵的最大优势。针对该问题提出采用改进的顺序前进式选择算法,提高文本分类任务中的识别率,试验结果证明该算法能够更准确地选出文本代表特征,对不等式最大熵模型的分类成绩有一定的改善。  相似文献   

14.
目的 针对大型图像检索领域中,复杂图像中SIFT特征描述子的冗余和高维问题,提出了一种基于字典重建和空间分布关系约束的特征选择的方法,来消除冗余特征并保留最具表现力的、保留原始空间结构性的SIFT特征描述子。方法 首先,实验发现了特征选择和字典学习方法在稀疏表示方面的内在联系,将特征选择问题转化为字典重构任务;其次,在SIFT特征选择问题中,为了保证特征空间中特征的鲁棒性,设计了新型的字典学习模型,并采用模拟退火算法进行迭代求解;最后,在字典学习的过程中,加入熵理论来约束特征的空间分布,使学习到的特征描述子能最大限度保持原始SIFT特征空间的空间拓扑关系。结果 在公开数据集Holiday大型场景图片检索数据库上,通过与国际公认的特征选择方法进行实验对比,本文提出的特征选择方法在节省内存空间和提高时间效率(30%~ 50%)的同时,还能保证所筛选的特征描述子的检索准确率比同类特征提高8%~ 14.1%;在国际通用的大型场景图片拼接数据库IPM上,验证本文方法在图像拼接应用中特征提取和特征匹配上的有效性,实验表明本文方法能节省(50% ~70%)图像拼接时间。结论 与已有的方法比较,本文的特征选择方法既不依赖训练数据集,也不丢失重要的空间结构和纹理信息,在大型图像检索、图像拼接领域和3D检索领域中,能够精简特征,提高特征匹配效率和准确率。  相似文献   

15.
基于多最小支持度的空间关联规则发现   总被引:5,自引:0,他引:5  
吴安阳  赵卫东 《计算机应用》2005,25(9):2171-2174
空间关联规则挖掘可应用于发现空间数据库中大量空间谓词与非空间谓词之间的特定空间关系。论文针对区县道路交通数据提出了一种基于多最小支持度的空间关联规则挖掘算法,并给出了在GIS中进行空间关联规则挖掘的一般方法和流程。该挖掘算法可以从城市道路地理信息数据库中发现用户感兴趣的空间关联规则,经实际应用于城市道路规划管理系统,证明该算法是有效、可行的。  相似文献   

16.
特征选择是用机器学习方法提高转发预测精度和效率的关键步骤,其前提是特征提取.目前,特征选择中常用的方法有信息增益(Information Gain,IG)、互信息和卡方检验(CHI-square test,CHI)等,传统特征选择方法中出现低频词引起的信息增益和卡方检验的负相关、干扰计算等问题,导致分类准确率不高.本文首先针对低频词引起的信息增益和卡方检验的负相关、干扰计算等问题进行研究,分别引入平衡因子和词频因子来提高算法的准确率;其次,根据微博信息传播的特点,结合改进的IG算法和CHI算法,提出了一种基于BIG-WFCHI(Balance Information Gain-Word Frequency CHI-square test)的特征选择方法.实验分析中,本文采用基于最大熵模型、支持向量机、朴素贝叶斯分类器、KNN和多层感知器5种分类器对两个异构数据集进行了测试.实验结果表明,本文提出的方法能有效消除无关特征和冗余特征,提高分类精度,并减少运算时间.  相似文献   

17.
在卷积神经网络模型中,空间金字塔池化方法将空间信息融入到深度特征的生成过程中,最终生成的图像表示可以有效地用于提高图像检索性能,但是此方法会导致生成的图像表示中不同维度之间描述的信息存在重复且相同维度描述的图像内容不匹配。为此提出了一种基于多尺度特征映射匹配(multi-scale feature map matching,MFMM)的图像表示方法,此方法首先利用深度特征的方差与协方差矩阵提出了一种特征映射选择算法,用于增强图像表示中不同维度特征的独立性。其次,依据相同通道特征映射中高响应值位置有较高匹配性的特点,结合激活映射中最大响应位置的深度特征提出了一种优化的特征映射中心点选择方法。最后,按照不同的中心点通过多尺度窗口采样的方式,从特征映射中提取出带有空间信息的深度特征用于表示图像内容。实验结果表明,提出的方法在图像检索任务中能够取得良好的效果。  相似文献   

18.
黄琴    钱文彬    王映龙  吴兵龙 《智能系统学报》2019,14(5):929-938
在多标记学习中,特征选择是提升多标记学习分类性能的有效手段。针对多标记特征选择算法计算复杂度较大且未考虑到现实应用中数据的获取往往需要花费代价,本文提出了一种面向代价敏感数据的多标记特征选择算法。该算法利用信息熵分析特征与标记之间的相关性,重新定义了一种基于测试代价的特征重要度准则,并根据服从正态分布的特征重要度和特征代价的标准差,给出一种合理的阈值选择方法,同时通过阈值剔除冗余和不相关特征,得到低总代价的特征子集。通过在多标记数据的实验对比和分析,表明该方法的有效性和可行性。  相似文献   

19.
空间连接运算是空间数据查询中最重要、最耗时的基本操作之一,其中基于R树的空间连接(RJ)被认为是一种高效的处理机制,但在空间连接的精化阶段处理复杂的空间数据时需要很大的系统开销。基于MBR及直接查询谓词,提出了一种加权处理方法,并扩展了R树结构及MRJ算法。从而优化了多路R树连接的筛选处理,能得到更加有效的候选集;同时,减少了磁盘访问次数,可节省CPU及I/O的时间开销。还通过应用实例验证了其在空间数据库查询优化方面的优势。  相似文献   

20.
属性选择通常作为一个主要的预处理步骤,在机器学习和数据挖掘领域有着广泛的应用。选择出能够表征数据集分形特征的属性子集,对研究数据集的分形规律具有重要的价值。根据数据集的分形特征,引入了密度分析方法,指出了当前基于分形维数的属性选择方法的不足,提出了一种基于分形和邻接空间密度变化的属性选择方法。为了分析实验结果的有效性,利用SVM分类算法和K-fold交叉验证相结合的方法对3个数据集属性选择前后的分类性能进行了测试。实验证明该方法在属性选择方面有较好的性能,能够得到较优的属性子集。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号