排序方式: 共有25条查询结果,搜索用时 0 毫秒
21.
路径表达式查询是XML数据查询处理的核心研究问题之一,研究者开展了大量的研究工作.但这些研究更多关注XML数据上路径表达式的匹配,忽略了谓词"包含".研究XML查询处理中谓词"包含"的查询处理方法.采用了两种方法,第一种是采用跳跃表的方法,在XML分枝模式匹配时动态地对结点数据进行读取和关键字匹配.第二种是为XML文档中的词语建立倒排索引,来实现关键字的匹配.并从分枝模式路径长度、查询关键的数量和"包含"谓词判断结点的类型,对两种方法进行了分析和比较. 相似文献
22.
由于使用方便等优点,数据库上的关键字检索技术使用户可以得到所需信息而不必书写复杂的SQL语句.但大部分现有的检索方法都关注通过连接操作得到包含所有关键字的元组连接树,忽略了对于检索结果的信息整合,这从某种程度上影响了用户对于检索结果的判断.文中提出并实现一种改进的关键字检索系统框架,在具有层次结构的属性指导下对得到的元... 相似文献
23.
在传统的关系数据库上进行关键字查询已经成为近来数据库领域的研究热点,现有的工作都是以单个元组作为结果单元来返回.为了满足用户对于返回多元组的要求,提出了基于元组组合的关键字查询的概念,并通过返回元组组合来响应查询.通过对问题的分析得到了一系列启发式剪枝策略,设计了一个综合的优化算法.通过一系列真实数据集和人工数据集上的实验,验证了优化算法在绝大部分情况下比最初的算法在性能上有了显著的提高. 相似文献
24.
热词查询是指在一个特定的时间范围内,从文本数据中搜索热点词汇。查询一组词汇成为热词的最长时间范围是话题检测与追踪的一个重要任务。现有的热词提取算法具有较高的时间复杂度,未考虑不同偏好的用户的查询需求,难以用于热词的在线提取以及最长时间范围的在线查询。为此提出一种在线查询算法,在类别和时间的二维区间上提取热词并查询用户指定词汇成为热词的最长时间范围。该算法基于Prefix Cube技术,对传统的TF~*PDF算法加以改进,在空间复杂度不变的情况下,降低TF~*PDF算法的时间复杂度。实验表明,与传统的TF~*PDF算法相比,该算法在路透社、纽约时报和BBC三个语料库上提取热词并查询最长时间区间的运行时间减少了81%,验证了该算法的高效性。 相似文献
25.
设计并实现了H IT-DML数字音乐图书馆.H IT-DML采用一种新的框架结构,以数据库系统为核心,一方面将音乐数据结构化存储在数据库中,另一方面在数据库系统内部实现了音频计算,从而将数据库技术和多媒体技术有机结合起来.H IT-DML还使用了一种新的特征匹配算法以及n-gram倒排索引结构,能够基于内容检索音乐信息,并且可以针对不同乐器进行查询. 相似文献