首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
针对文件中存在字符属性和数值属性特点的数据,提出一种基于B+树的2层混合索引结构。在索引创建过程中,将文件中的数据根据其类型进行分类,第1层是为数据属性建立B+树索引结构,第2层是根据不同的数据类型建立不同的索引结构。实验结果表明,该索引结构能实现跨数据范围的检索,提高索引的创建速度和空间利用率。  相似文献   

2.
哈希技术被视为最有潜力的相似性搜索方法,其可以用于大规模多媒体数据搜索场合。为了解决在大规模图像情况下,数据检索效率低下的问题,提出了一种基于分段哈希码的倒排索引树结构,该索引结构将哈希码进行分段处理,对每段哈希码维护一个倒排索引树结构,并结合高效的布隆过滤器构建哈希索引结构。为了进一步提高检索准确性,设计了一种准确的排序融合算法,对多个哈希算法的排序结果分别构建加权无向图,采用PageRank的思想对基于多个哈希算法的排序列表的融合技术进行了详细的说明。实验结果表明,基于分段哈希码的倒排索引树结构能极大地提升数据的检索速度。此外,相比于传统的单个哈希算法排序技术,基于多个哈希算法的排序列表融合技术的检索准确率优势显著。  相似文献   

3.
为实现安全高效的云端数据密文检索,提出基于Huffman树的密文索引构建及检索方案。将Huffman树形结构及其编码的思想引入密文索引结构的构建方案中,改进基于知识理解的中文分词算法提取明文关键词,通过改进的TF-IDF规则对检索结果集进行排序以返回最符合用户需求的Top-K个结果,并增加伪造的索引结点以增强索引结构的抗统计分析攻击能力。通过实验测试和性能对比分析可得出结论:方案在保证密文和索引信息安全性的同时,可以提高密文检索的效率。  相似文献   

4.
针对云存储环境下的密文检索问题,面向精确密文检索需求设计了一种新型的精确密文全文索引方案D RD I (Different Rationality for Dual‐Indexing)。该方案在密文检索技术和传统全文检索技术的研究基础上,对传统的倒排索引结构进行了改造,建立多属性双索引,可高效检索出包含对应关键字的文件目录信息。实验结果表明该方案具有可行性和高效性的特点。  相似文献   

5.
提出了一种新的高维数据空间的索引结构XSA—tree.它扩展了现有索引结构SA—tree,提出了卫星数据域的思想,以增强索引的过滤能力.通过对根节点中数据点选取进行优化,以得到相对平衡的索引树.文中给出了该索引结构并详细介绍了相关索引算法.实验结果表明,该索引结构显著提高了高维数据空间中相似性检索性能.是一种有效的高维索引结构.  相似文献   

6.
结合网格索引和R树索引的特点,提出了一种基于网格与R树的多级混合索引.该方案首先将矩形地理空间进行粗网格划分建立多级网格索引.然后针对每个小网格建立基于R树的空间索引.详细讨论了该索引的结构、建立算法、删除算法以及应用该索引的检索算法,并进行了算法分析.与网格索引和R树索引相比,该索引以略大的空间开销换取了更高的查找性能.  相似文献   

7.
面向应用集成的内存数据索引算法的实现   总被引:1,自引:0,他引:1       下载免费PDF全文
本文通过分析企业实施信息化建设和应用集成对于内存数据处理的要求和特点,提出了一种面向企业信息化、适合于应用集成和分布式处理的内存数据索引结构及算法,并对该算法的实现加以详细阐述;最后,通过与CMap映射和SQL语言检索效率的比较,分析了该索引算法的性能。  相似文献   

8.
建立文物图像数据库是建立文物数字博物馆的基础,在基于物理特征检索的图像数据库系统中应用了FAC-file这种索引方法,并对系统的检索性能进行测试。对采用索引结构和未采用索引结构的检索时间进行了对比,同时也对FAC-file索引方法的焦点数和索引文件大小进行了分析。测试结果验证了这种索引方法的有效性。  相似文献   

9.
吴海辉  吴建国 《微机发展》2004,14(4):18-21,24
在编制汉字输入法的过程中遇到了字符串的存储和检索问题,对此提出了一种基于有序二叉树的高效优化索引树,给出了优化索引树的生成算法和搜索算法。在该高效优化索引树中,采用特定的非定长结构存储树节点,并把索引树存放在一个字节型逻辑数组中,从而大大减少了索引树中儿子指针和兄弟指针的个数,使得索引树中不存在空指针。优化后的索引树不仅占用存储空间少,而且检索速度极快,非常适合存储编码信息。  相似文献   

10.
将粗集理论引入基于案例的推理系统,充分利用案例库中冗冗余属性的简化,形成案例的多个索引,从而可根据不同问题按不同索引进行检索并得出结论。计算实例表明,该方法既能有效地解决不确定问题,又能提高系统的性能。  相似文献   

11.
联盟结构的生成问题中由于搜索空间的联盟结构数目太大,因而搜索联盟结构的最底两层建立一个最坏情况下的边界值是必要的,边界值将最优的联盟结构限制在某个限界内,通过进一步的搜索可以在任意时间内得到一个较优值。根据联盟的溢出性质,文中提出了一种新的建立边界值的方法,即对任意不相交的联盟集合计算其上下边界的值,通过搜索特定的联盟结构集合建立最坏情况下的边界值。联盟的边界值建立以后,可以在任意时间内得到一个较优值,通过搜索剩余的联盟结构集合,可以对边界值和返回的联盟结构进一步优化。在此基础上文中提出了基于溢出性质的任意时间算法。实验结果表明,采用新的方法建立边界值,使得算法的收敛速度更快,效率更高。  相似文献   

12.
设计了在数据库中化学结构的存储方式,并在系统分析化学结构在计算机中的不同描述法的基础上,提出了一种基于Web的化学结构搜索法。该方法由Robot抓取Web文档中的化学结构信息,利用Oracle建立化学结构数据库,通过建立化学结构的索引,实现对化学结构的全结构、子结构、结构相似性检索。  相似文献   

13.
《Information Systems》2005,30(5):333-348
The tree index structure is a traditional method for searching similar data in large datasets. It is based on the presupposition that most sub-trees are pruned in the searching process. As a result, the number of page accesses is reduced. However, time-series datasets generally have a very high dimensionality. Because of the so-called dimensionality curse, the pruning effectiveness is reduced in high dimensionality. Consequently, the tree index structure is not a suitable method for time-series datasets. In this paper, we propose a two-phase (filtering and refinement) method for searching time-series datasets. In the filtering step, a quantizing time-series is used to construct a compact file which is scanned for filtering out irrelevant. A small set of candidates is translated to the second step for refinement. In this step, we introduce an effective index compression method named grid-based datawise dimensionality reduction (DRR) which attempts to preserve the characteristics of the time-series. An experimental comparison with existing techniques demonstrates the utility of our approach.  相似文献   

14.
给定限界的势结构生成算法   总被引:1,自引:1,他引:0       下载免费PDF全文
李少芳  胡山立 《计算机工程》2009,35(21):186-188
在联盟结构生成过程中,同势的2个联盟通常具有相同值或相似值。在同势同值情况下建立不同联盟的限界时,必须搜索势结构图的最底两层。研究最优势结构生成问题,提出一种给定限界的势结构生成算法,确定需要进一步搜索的势结构。分析结果表明,搜索势结构图的最底两层和顶层后,通过搜索势结构集合,可以得到符合要求的限界。与其他势结构生成算法相比,该算法需要搜索的势结构数最少。  相似文献   

15.
在联盟结构生成过程中,同势的2个联盟通常具有相同值或相似值。在同势同值情况下建立不同联盟的限界时,必须搜索势结构图的最底两层。研究最优势结构生成问题,提出一种给定限界的势结构生成算法,确定需要进一步搜索的势结构。分析结果表明,搜索势结构图的最底两层和顶层后,通过搜索势结构集合,可以得到符合要求的限界。与其他势结构生成算法相比,该算法需要搜索的势结构数最少。  相似文献   

16.
基于化学位移的结构编码及其应用   总被引:1,自引:0,他引:1  
采用系统编码以一原子为中心逐层扩展的思想,在形式上加以改进,同时用核磁共振中最重要的参数一化学位移值表征碳原子所处的状态,实现了结构的数值化,使化学结构更易被计算机存储和处理,也使判断两结构是否全同(两图同构)的难题简化为比较两者化学位移值之和CSS(Chemical Shift Sum)是否相等的简单问题。进而针对两类子结构检索各自的特点提出了新的基于广度优先的匹配算法,此算法以特征原子作为初始匹配点能大大减少匹配的盲目性。C^13-NMR是一个已积累了大量知识和规律的领域,碳化学位移值又是碳原子核周围电子云分布情况的直接反映,从这些已有的知识和规律出发正确地获取所需信息将会对计算机辅助有机合成路线设计和分子设计等诸多方面起到积极的推进作用。  相似文献   

17.
随着策略集的不断膨胀,现有的过滤结构造成了采用不同过滤算法的软件防火墙时间或空间利用率下降,同时防火墙过滤结构方面的研究仍然不足。针对这一问题,提出了一种分向、分步及分层的防火墙过滤结构,其中分向、分步结构是过滤结果正确性的保证,而分层结构能提高防火墙时间或空间的使用效率。对本过滤结构进行了功能和性能分析,并和采用现有结构的防火墙进行了对比。最后给出了测试结果,实验证明本过滤结构应用效果明显。  相似文献   

18.
目的 基于现有的研究提出一种细节感知的纹理去除算法,在去除图像纹理时,能够很好地保持图像的结构信息,尤其是诸如细长结构和边角信息等在其他方法中容易被模糊化的特殊细节。方法 首先,本文提出一种能够识别细长结构的结构检测方法,对细长结构进行检测并增强其结构特征。其次,为了估计每个像素点的最优滤波核尺度,改进原有的相对总变差模型,多方向寻找最小相对总变差,使它能够更好地区分纹理和边界,并且将边角信息从纹理中区分出来。然后,将检测出来的细长结构归一到改进的相对总变差的度量尺度上,估计滤波核尺度,生成引导滤波图像。这样就能够在平坦或有纹理的区域运用大尺度的滤波核,并在结构边缘和边角附近减小滤波核。最后,通过联合双边滤波器得到纹理去除后的图像。结果 实验测试了马赛克图像和艺术画作,对比了相对总变差和尺度敏感的结构保护滤波等方法,本文方法在去除纹理的同时保留了细长结构和边角细节,并且具有良好的普适性和鲁棒性。利用本文算法处理一幅含10万像素的图像,仅通过一次迭代计算就能够去除大量纹理且效果优于已有的方法,本算法的计算时间为3.37 s,其他算法为0.07~3.29 s。结论 本文设计的纹理滤波器不仅在保持诸如细长结构方面的性能更好,而且使纹理去除后的图像在边角细节处更尖锐,为图像的后续处理提供了一种强有力的图像预处理方式。  相似文献   

19.
蛋白质-蛋白质作用面上的结构特征对于研究蛋白质功能具有重要意义。提出了一种新的、基于统计直方图提取蛋白质作用面特征的方法,并且利用提取出的作用面特征,结合概率神经网络,实现了对作用面结构类型的分类预测。从预测结果来看,统计直方图提取出的特征,对蛋白质作用面结构具有很好的区分能力,而且可以通过调节划分的区间个数和节点的选取方式,达到对作用面结构的不同粒度的描述,以适用于不同目的的研究,这可能对与结构有关的某些生物信息学问题的研究具有启发性。利用概率神经网络对作用面结构进行分类预测,避开了费时的结构比对和数据库搜索,且训练快速,扩展能力强,正确率高,对独立测试集的911个蛋白复合物视在正确率达到90.67%。基于该算法的MATLAB分类器软件可以通过E-Mail与作者联系获取。  相似文献   

20.
支持Web信息分类的高性能蜘蛛程序   总被引:1,自引:0,他引:1  
随着Web信息的快速增长,如何提高信息检索的准确率,如何展示检索结果,成为Web信息检索的重点研究内容,本文设计一种新的蜘蛛程序T—Spider,采用分布式两级并行控制,在获取Web信息的同时,获取网站结构,从而支持基于网站结构的信息分类.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号