首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
赵双柱 《福建电脑》2010,26(1):86-86,90
分词方法是中文搜索引擎系统中最为基础和最为重要的技术,它直接影响搜索引擎对用户搜索结果的准确性与快速性。本文采用链栈存储用户按搜索目标分割好的搜索关键字,利用链栈先进后出的操作特点,用逆向最大匹配分词法实现中文搜索引擎中搜索关键字的快速与准确分词,从而实现系统对用户搜索的快速与准确反应。  相似文献   

2.
XML数据包含丰富的语义信息,但现有的大多数XML搜索引擎并未利用这一信息.如何利用XML数据的语义信息提高检索质量已成为当前研究所关注的问题.设计并实现了一个基于语义相关的XML关键字搜索引擎:Ropeway. 对于用户给定的关键字,Ropeway分析了XML数据的语义和用户信息需求,推断用户的查询主题,然后从XML数据中搜索与该主题相关的结果,并根据主题相似度对结果进行排序.结果证明: Ropeway具有良好的检索性能.  相似文献   

3.
提供个性化服务的搜索引擎页面排序算法   总被引:3,自引:0,他引:3  
张俊伟  张岭  马范援 《计算机工程》2003,29(19):58-59,126
目前搜索引擎的技术发展迅速,但仍然存在一些问题。当用户输入关键字进行查询时,机器有时无法确知用户真正想要的信息。该文提出了一种对用户进行聚类的分析方法,将关键字和用户的个人偏好结合起来的算法,利用机器学习的方法来推测用户想要看到的信息。将最可能的相关链接排在最前面,以此来提高用户查询的效率。  相似文献   

4.
学习研究了搜索引擎的工作原理,对办公系统及部分信息管理系统建立了统一的索引信息,针对检测业务查询关键字及基于字典词库的中文分词技术,建立了检测中心内部办公及相关信息系统的搜索引擎查询机制,并将中文分词技术应用于企业级的知识库软件confluence,实现系统的专业中文词汇检索查询功能。  相似文献   

5.
传统搜索引擎是基于关键字的检索,然而文档的关键字未必和文档有关,而相关的文档也未必显式地包含此关键字。基于语义Web的搜索引擎利用本体技术,可以很好地对关键字进行语义描述。当收到用户提交的搜索请求时,先在已经建立好的本体库的基础上对该请求进行概念推理,然后将推理结果提交给传统的搜索引擎,最终将搜索结果返回给用户。相对于传统的搜索引擎,基于语义Web的搜索引擎有效地提高了搜索的查全率和查准率。  相似文献   

6.
为了更好地利用中文搜索引擎系统,需要了解搜索引擎的一些关键性技术。笔者选择了国内知名度最高的搜索引擎系统百度作为研究对象。介绍了几种常用的中文分词算法以及中文分词在搜索引擎中的作用,并在此基础上采用黑盒的方法推导出百度的中文分词算法——正向最大匹配分词算法。该算法是最常见的一种中文分词算法,比较符合人的思维习惯。了解了搜索引擎的分词算法有益于搜索词设置的优化以及搜索引擎系统的研究和改进。  相似文献   

7.
巧用黑盒法逆推百度中文分词算法   总被引:1,自引:0,他引:1  
为了更好地利用中文搜索引擎系统,需要了解搜索引擎的一些关键性技术.笔者选择了国内知名度最高的搜索引擎系统百度作为研究对象.介绍了几种常用的中文分词算法以及中文分词在搜索引擎中的作用,并在此基础上采用黑盒的方法推导出百度的中文分词算法--正向最大匹配分词算法.该算法是最常见的一种中文分词算法,比较符合人的思维习惯.了解了搜索引擎的分词算法有益于搜索词设置的优化以及搜索引擎系统的研究和改进.  相似文献   

8.
(接上期)垂直搜索技术的发展方向首先,支持自然语言查询。目前的搜索引擎都是基于关键字的。人们总会发现一个有趣的现象:用户坐到电脑前,打开某个搜索引擎页面,输入一个关键词,常常会发现毫无收获,然后再换另一个关键词……这种现象的频繁出现说明当前的搜索引擎对自然语言支持不够。现在是用户去适应搜索引擎,而不是搜索引擎适应用户。垂直搜索有其独有的领域限制,相关性、分词的发展使得支持自然语言查询的研究相对容易,因此是未来的一个发展方向。其次,利用专家系统。由于垂直搜索只针对某一特定领域,因此可以增加人工智能或者专家系统…  相似文献   

9.
全二分最大匹配快速分词算法   总被引:29,自引:1,他引:29  
分词对于中文信息处理的诸多领域都是一个非常重要的基本组成部分,对于诸如搜索引擎等海量信息处理的应用,分词的速度是至关重要的。该文在对中文编码体系和中文分词的算法进行研究的基础上,提出一种新的分词词典,基于这种分词设计了一种快速的分词算法,给出了算法的实现过程。  相似文献   

10.
当分词算法优化到接近极限时,分词器的性能指标就较多地取决于训练语料的覆盖度和完备程度。因此,如何快速、省力、自动化地构建具有较完备的分词语料库是一个亟待解决的问题。该文对用户输入过程中留下的大量可用且珍贵的自然分词信息进行了探索和研究,为自动构建分词语料库提供了一种新的观点。前人的研究中,对用户在输入过程中留下的自然分词标记信息并没有关注,而该文通过实验验证了这些分词标记信息确实可以用于构建分词语料库,并且具有相当好的效果。其中经过甄别优秀用户在输入时留下的分词标记十分接近标准的分词结果。该文使用分类模型结合投票机制的方法找到三个此类优秀用户,获取了他们带有输入标记的文本,快速构建了分词训练语料库,极大地提升了分词器的精度;更重要的是,揭示并验证了自然输入分词标记信息的有效作用。  相似文献   

11.
基于局域网组播技术的并行图像处理系统   总被引:2,自引:0,他引:2  
提出了在Windows环境下利用组播技术实现并行图像处理系统的方法。服务器根据当前的网络中各客户机的运行状态确定参与并行处理的客户机个数及任务分配方案 ,客户机则由服务器消息驱动完成指定的任务。实验结果表明该方法可以提高图像处理的运行效率  相似文献   

12.
PVM是目前最有影响的基于消息传递的并行软件,它为用户提供了一种以较小的代价实现高性能计算机的有效途径。本文提出了一种基于PVM平台的数字图象处理算法的平行化方法,该算法充分考虑了数字图象处理的特点,使用“群集”模型,有效提高了数字图象处理的速度,达到理想效果。  相似文献   

13.
在实时控制和数据处理系统中,对程序的运算速度要求很高.为避免复杂的现场运算,缩短运算时间,以适应实时处理的要求,本文介绍采用查表法完成复杂运算.可以大大提高运算速度.该方法已应用在电子海图系统雷达图像实时转换中.  相似文献   

14.
MS SQL Server7.0的数据仓库设计原则   总被引:3,自引:0,他引:3  
数据仓库技术作为联机分析处理系统的基础越来越受到人们的关注。本文阐述了微软数据仓库技术的设计原则,并给出了一个应用于医药连锁企业销售分析的数据仓库实例。  相似文献   

15.
数据库自然语言查询接口可以使用户直接以日常生活中使用的自然语言提出查询请求,获取数据库中的信息。这是一个具有重要理论价值和巨大实用价值的研究领域。本文在总结数据库汉语查询的语言规律基础上,重点介绍了我们设计实现的一个数据库汉语查询接口系统WTCDIS,最后给出了对该系统进行初步测试的结果。  相似文献   

16.
Today, there is a growing demand for computer vision and image processing in different areas and applications such as military surveillance, and biological and medical imaging. Edge detection is a vital image processing technique used as a pre-processing step in many computer vision algorithms. However, the presence of noise makes the edge detection task more challenging; therefore, an image restoration technique is needed to tackle this obstacle by presenting an adaptive solution. As the complexity of processing is rising due to recent high-definition technologies, the expanse of data attained by the image is increasing dramatically. Thus, increased processing power is needed to speed up the completion of certain tasks. In this paper,we present a parallel implementation of hybrid algorithm-comprised edge detection and image restoration along with other processes using Computed Unified Device Architecture (CUDA) platform, exploiting a Single Instruction Multiple Thread (SIMT) execution model on a Graphical Processing Unit (GPU). The performance of the proposed method is tested and evaluated using well-known images from various applications. We evaluated the computation time in both parallel implementation on the GPU, and sequential execution in the Central Processing Unit (CPU) natively and using Hyper-Threading (HT) implementations. The gained speedup for the naïve approach of the proposed edge detection using GPU under global memory direct access is up to 37 times faster, while the speedup of the native CPU implementation when using shared memory approach is up to 25 times and 1.5 times over HT implementation.  相似文献   

17.
目前并行数据库的研究已经进入了实际应用阶段,而数据仓库的大数据量处理更需要并行处理能力的支持。针对数据仓库的特点,提出了一种可操作的并行化数据划分方法和物理存储方案,同时对基于该种数据存储的数据操作做了详细的讨论,并对各种Join操作的具体处理方法进行了归类论述。  相似文献   

18.
一种基于TMS320VC33 DSP的通用图像处理系统设计   总被引:1,自引:1,他引:1  
张宁  张桂林  柳国普 《微计算机信息》2004,20(10):87-88,125
介绍了一种以美国TI公司推出的浮点DSP—TMS320VC33为处理器的通用图像处理系统,阐述了该系统的硬件设计思想及软件开发流程。该系统具备良好的算法通用性,是一种优良的图像处理平台。  相似文献   

19.
朱军  薛杰 《微机发展》2000,10(1):26-28
信号到达波方向估计要求实时笥强,运算速度快,估计精度高,单一的DSP或PC机处理已远远不能满足实进性要求。本文介绍了以20片TMS320C31芯片组成的多DSP芯片并行处理系统的设计实例,并给出了系统硬件组成和软件设计。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号