首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
基于短信的移动搜索二次排序算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张林  郭兵  张传武  沈艳 《计算机工程》2008,34(10):43-45
针对基于短信的移动搜索软件平台中的中间软件模块,提出一种能够适应多种搜索引擎的二次排序算法ISEH。该算法考虑移动终端屏幕小、存储及处理能力弱等特点,对搜索引擎第1次查询返回的结果集从内部相似度和外部热度进行综合评估,得出最终的排序结果。基于Linux平台的算法仿真实验表明,该算法能克服传统搜索引擎海量信息返回、准确度低等缺陷,将查询满意度因子提升到63.57%,并提高了移动搜索效率。  相似文献   

2.
目前大部分搜索引擎对于用户查询返回结果的差异依赖于查询词.而实际上,即便查询词相同,不同的用户潜在的信息需求可能不同.搜索引擎并不能针对用户的特点提供个性化的服务,大多数返回的文档都是与用户的需求不相关的.提出"搜索系统错误的目标定位是导致用户体验不佳的根本原因".因此,设计一个面向用户的排序算法来解决个性化服务的问题是十分必要的.提出的面向用户排序算法将概率排序原则返回的原始列表重新排序,将用户兴趣向量作为列表重排的参数之一,使之能够向用户提供特定服务,满足用户潜在信息需求.通过分析用户的查询和浏览的文档,为用户建立并维护一个用户兴趣向量,以此作为面向用户排序的基础.实验证明了该方法具有更优的性能.  相似文献   

3.
刘兵  张鸿 《计算机应用》2016,36(2):531-534
针对基于内容的图像检索(CBIR)中低层视觉特征与用户对图像理解的高层语义不一致以及传统的距离度量方式难以真实反映图像之间相似程度等问题,提出了一种基于卷积神经网络(CNN)和流形排序的图像检索算法。首先,将图像输入CNN,通过多层神经网络对图像的监督学习,提取网络中全连接层的图像特征;其次,对图像特征进行归一化处理,然后用高效流形排序(EMR)算法对查询图像所返回的结果进行排序;最后,根据排序的结果返回最相似的图像。在corel数据集上,深度图像特征比基于场景描述的图像特征的平均查准率(mAP)提高了53.74%,流形排序比余弦距离度量方式的mAP提高了18.34%。实验结果表明,所提算法能够有效地提高图像检索的准确率。  相似文献   

4.
元搜索引擎的调度算法是研究如何从庞杂的独立搜索引擎中选择出与查询字串相关度最高、与用户的查询需求最贴近的合适数量的独立搜索引擎。现在,在原有的元搜索引擎调度算法基础上,提出了一种个性化调度算法。该算法根据用户兴趣类对所有独立搜索引擎进行文档分类,然后根据用户查询串所属的兴趣分类,计算出查询串与该分类下文档的相关度这一调度算法的主要影响因素,再结合成员搜索引擎的平均响应时间性能评价,返回结果数量,以及以用户反馈为基础的用户兴趣度经验,计算出独立搜索引擎的排序,从而实现个性化的调度。  相似文献   

5.
林欣  温传林  韩立新 《微机发展》2013,(2):41-43,48
元搜索引擎并行地向各个成员搜索引擎发出请求,合并及处理所有成员引擎的返回结果。相对于传统搜索引擎,元搜索引擎具有更好的查全率但在结果相关度排序及查准率方面仍需要改善。就相关度排序及查准率方面的问题元搜索成员引擎对于各个不同主题具有不同的检索质量并就此提出一种基于主题偏好的排序方法。利用Beeferman聚类方法对检索主题划分,通过Borda排序算法对元搜索引擎获得条目进行基于主题的分类排序,以此来提高元搜索查询质量和改善用户体验。  相似文献   

6.
基于语义理解的智能搜索引擎研究   总被引:1,自引:0,他引:1  
本文提出了一种基于自然语言理解的搜索引擎模型.它的核心技术是基于自然语言理解的相关技术,包括从 关键词、提问方式、提问重点三个层次对用户查询进行语义分析、特征向量提取及基于该思想建立了面向Web网页内容 的特征库,提出返回文档排序的算法,基于Lucene全文索引工具包建立了搜索引擎,对库中已收入的特征词进行了查询 测试,查准率为86.7%.实验表明,该模型基本实现了对查询短语的理解,对提高搜索引擎的查准率有显著的效果.  相似文献   

7.
在许多应用中,Skyline查询是一种十分重要的查询类型,它在潜在的巨大的数据空间中返回不被其他元组支配的用户感兴趣的元组,但是Skyline查询无法控制返回结果的数量。处理一个新的top-k Skyline查询问题,该查询返回支配分数最大的k个Skyline元组,从而控制了需要向用户返回的查询结果数量。分析发现,大多数现有算法忽略了利用支配分数作为限制Skyline查询的结果数量的度量。提出一个新的基于表扫描的RSTS(ranked Skyline with table scan)算法来有效计算海量数据上的top-k Skyline结果。RSTS算法首先对表执行预排序操作,保证预排序表的元组按照对有序列表的round-robin扫描的顺序排列。RSTS算法包括两个阶段。阶段1利用对预排序表的顺序扫描来获得候选元组。阶段2计算候选元组的支配分数并返回结果。可以证明,RSTS算法具有早结束特性,并给出其扫描深度的理论分析。提出对于候选元组的剪切操作,理论剪切效果表明,绝大多数的Skyline结果可以直接丢弃。实验结果表明,RSTS算法可以有效计算top-k Skyline结果。  相似文献   

8.
基于遗传算法的专业元搜索引擎   总被引:1,自引:0,他引:1  
赵大明  鱼滨 《计算机工程》2009,35(21):192-194
元搜索引擎返回的查询结果来自独立搜索引擎,要评价此类结果的专业相关性,必须挖掘其位置信息以外的其他信息。研究并实现面向培训领域的元搜索引擎,在充分挖掘网页文本信息的基础上,提取专业网页样本特征,结合遗传算法给出网页专业相关度算法。实验结果表明,该引擎具有较高的专业信息筛选和排序能力。  相似文献   

9.
提出了利用大量用户评价结果来进行特征权重的计算方法,用于解决搜索引擎中查询串与搜索结果的相似度分析。该方法完全利用用户对搜索结果的“潜在评价”来进行。用户对输入查询串所做的点击反映了其内部的关联性,该文提出的方法可获取这种关联性,对该问题建立了数学模型,利用EM算法解决了特征权重的计算。由于模型的函数比较复杂,难于计算其收敛性,因此,使用了模拟退火算法作为EM算法的补充,用于验证算法的收敛性。实验使用百度搜索引擎在竞价广告上进行,提取的测试数据样本为100个广告和144 132个query,获得的数据结果显示,所有特征收敛到全局最优解,抽样部分数据获得检索相似准确率为93.32%,召回率为87.43%。  相似文献   

10.
当前主流的搜索引擎主要是以与用户查询的相关度来顺序返回搜索结果的,用户往往需要花费较长的时间从结果列表中进行选择.为了解决这个问题,针对搜索引擎返回的标题和摘要信息,构造有向图表示,并在此基础上实现了一种高效的网页聚类原型系统(efficient web clustering system,EWCS).该系统将搜索引擎返回的结果按照一定的标准分类呈现给用户,用户选择感兴趣的类别进行浏览,从而较好地满足了用户对查询速度和准确度的需求.试验结果表明该算法具有一定的可行性和较高的准确率.  相似文献   

11.
This paper presents a novel evolutionary algorithm entitled Dynamic Partition Search Algorithm (DPSA) for global optimization problems with continuous variables. The DPSA is a population-based stochastic search algorithm in nature, which mainly consists of initialization process and evolution process. In the initialization process, the DPSA randomly generates an initial population of members from a specific search space and finds a leader. In the evolution process, the DPSA applies two groups to balance exploration ability and exploitation ability, in which one group is in charge of exploring new region via a dynamic partition strategy, and the other group relies on Cauchy distributions to exploit the region around the best member. Later, numerical experiments are conducted for 24 classical benchmark functions with 100, 1000 or even 10000 dimensions. And the performance of the proposed DPSA is compared with a state-of-the-art cooperative coevolving particle swarm optimization (CCPSO2), and two existing differential evolution (DE) algorithms. The experimental results show that DPSA has a better performance than the algorithms used for comparison, especially for high dimensional optimization problems. In addition, the numerical computational results also demonstrate that the DPSA has good scalability, and it is an effective evolutionary algorithm for solving large-scale global optimization problems.  相似文献   

12.
针对定式变论域模糊控制精度不高,自适应能力有限,控制函数在遗传到后代时存在畸变而造成算法本身误差等问题,设计了一种基于双精度搜索算法的变论域模糊控制器。在基本万有引力算法全局搜索的同时,采用序列二次规划进行局部搜索避免算法陷入局部最优,提出具有“全局-局部”双重搜索机制的双精度搜索算法。在变论域模糊控制基础上提出了一种利用伸缩因子、等比因子相互协调来调整论域的构想,且通过双精度搜索算法来寻优参数,降低控制过程中的函数畸变,从而进一步改善控制器性能。对比实验表明DPSA在参数寻优中稳定性突出,控制器不但收敛速度快,且与其他控制方式相比,其精度和效果都有所提高。  相似文献   

13.
Data integration systems on the Deep Web offer a transparent means to query multiple data sources at once. Result merging– the generation of an overall ranked list of results from different sources in response to a query– is a key component of a data integration system. In this work we present a result merging model, called Active Relevance Weight Estimation model. Different from the existing techniques for result merging, we estimate the relevance of a data source in answering a query at query time. The relevances for a set of data sources are expressed with a (normalized) weighting scheme: the larger the weight for a data source the more relevant the source is in answering a query. We estimate the weights of a data source in each subset of the data sources involved in a training query. Because an online query may not exactly match any training query, we devise methods to obtain a subset of training queries that are related to the online query. We estimate the relevance weights of the online query from the weights of this subset of training queries. Our experiments show that our method outperforms the leading merging algorithms with comparable response time.  相似文献   

14.
对网络多个信息源跨库检索的结果进行Ontology建模,实现异构分布式数据源的数据抽取与合并.数据抽取首先将信息源的检索结果页面映射成有限标号树,其次应用抽取规则得到所需数据;给出按库合并算法,使得网络多数据源返回的结果得以高效合并.实验数据表明将Ontology建模应用于跨库检索结果处理有效而且正确,抽取准确率可以达到100%.  相似文献   

15.
为了对图像中的显著目标进行更精确的识别,提出了一种基于边界先验和自适应区域合并的显著性检测算法。采用超像素分割算法对图像进行过分割,把超像素看做图的一个顶点来进行构图;定位和消除错误边界,使背景基准集中存在很少的噪声,减小目标接触图像边界时造成的误检;采用单通道索引颜色直方图度量区域相似度并进行区域合并得到显著图。对比实验表明该算法相比其他算法取得了较高的查准率,说明了算法的有效性。  相似文献   

16.
随着高通量测序技术的应用与发展,基于测序的缺失变异检测方法大量涌现。然而,单一检测方法仍存在适用的局限性以及检测精度与敏感度不足的问题。为此,提出一种基于多检测理论融合的特征挖掘与机器学习算法集成的基因组缺失变异综合检测方法。该方法将多种工具应用于个体缺失变异检测,得到变异检测初始集;再根据多种检测理论对初始集中的缺失变异进行序列特征挖掘与特征提取;最后,将检测工具与机器学习算法相融合以获得集成的检测方法,剔除初始集中的假阳性变异,获得最终的结果集。基于千人基因组计划数据的实验表明,相较于单个工具的检测结果,该方法在检测精度和敏感度上均占优势;相较于多个工具检测结果的直接组合,该方法在损失少许检测敏感度的前提下显著地提高了检测精度。  相似文献   

17.
High latencies in FPGA reconfiguration are known as a major overhead in run-time reconfigurable systems. This overhead can be reduced by merging multiple data flow graphs representing different kernels of the original program into a single (merged) datapath that will be configured less often compared to the separate datapaths scenario. However, the additional hardware introduced by this technique increases the kernels execution time. In this paper, we present a novel datapath merging technique that reduces both the configuration and execution times of kernels mapped on the reconfigurable fabric. Experimental results show up to 13% reduction in the configuration and execution times of kernels from media-bench workloads, compared to previous art on datapath merging. When compared to conventional high-level synthesis algorithms, our proposal reduces kernels configuration and execution times by up to 48%.  相似文献   

18.
就经典分水岭图像分割算法中存在的过分割问题,提出一种结合位图切割和区域合并的彩色图像分割算法。对原始彩色图像通过空域梯度算子求其梯度图像,并利用位图切割重建梯度图像;对新梯度图像进行分水岭预分割;对预分割图像基于异质性最小原则进行区域合并,并获得最终分割结果。相比于现有的同类方法,该算法引入位图切割,抑制噪声对分割结果的影响,在边缘模糊处分割准确,得到符合人类视觉的较小分割区域数目,同时在运行效率上提高。  相似文献   

19.
Major problems exist in both crisp and fuzzy clustering algorithms. The fuzzy c-means type of algorithms use weights determined by a power m of inverse distances that remains fixed over all iterations and over all clusters, even though smaller clusters should have a larger m. Our method uses a different “distance” for each cluster that changes over the early iterations to fit the clusters. Comparisons show improved results. We also address other perplexing problems in clustering: (i) find the optimal number K of clusters; (ii) assess the validity of a given clustering; (iii) prevent the selection of seed vectors as initial prototypes from affecting the clustering; (iv) prevent the order of merging from affecting the clustering; and (v) permit the clusters to form more natural shapes rather than forcing them into normed balls of the distance function. We employ a relatively large number K of uniformly randomly distributed seeds and then thin them to leave fewer uniformly distributed seeds. Next, the main loop iterates by assigning the feature vectors and computing new fuzzy prototypes. Our fuzzy merging then merges any clusters that are too close to each other. We use a modified Xie-Bene validity measure as the goodness of clustering measure for multiple values of K in a user-interaction approach where the user selects two parameters (for eliminating clusters and merging clusters after viewing the results thus far). The algorithm is compared with the fuzzy c-means on the iris data and on the Wisconsin breast cancer data.  相似文献   

20.
In this paper, we introduce a new error measure, integrated reconstruction error (IRE) and show that the minimization of IRE leads to principal eigenvectors (without rotational ambiguity) of the data covariance matrix. Then, we present iterative algorithms for the IRE minimization, where we use the projection approximation. The proposed algorithm is referred to as COnstrained Projection Approximation (COPA) algorithm and its limiting case is called COPAL. Numerical experiments demonstrate that these algorithms successfully find exact principal eigenvectors of the data covariance matrix.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号