首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
通过研究和分析现有最大匹配分词算法,词库结构的设计和分词算法直接关系着分词的速度和效率,提出了一种改进的最大匹配分词算法--基于双字词的动态最大匹配分词算法,设计并实现了汉语分词词库和算法.实验结果表明,此算法相对于现有最大匹配分词算法有显著提高.  相似文献   

2.
目的利用领域本体来提高股票资讯新闻自动标注结果的质量。方法在构建股票资讯领域本体的基础上,首先使用最大正向匹配技术来提取股票资讯新闻中的关键信息,然后将关键信息与股票资讯领域本体进行匹配,最后利用领域本体标注出与该股票资讯新闻相关的股票。结果比较实验结果表明基于领域本体的股票资讯新闻标注技术的准确率明显高于基于关键字的标注技术。结论将股票资讯领域本体中的知识用于标注股票资讯新闻可以确定更多同股票资讯新闻相关的潜在股票,从而提高标注结果的质量。  相似文献   

3.
为提高情感词库在特定领域情感分析的性能,针对情感词的强度和极性随着领域不同而变化的问题,采用遗传算法构建特定领域专用的情感词库。提出了基于遗传算法的情感词库构建框架,将词库预测特定领域文本情感趋向的准确率作为优化目标,并不断对情感词分值进行调整。利用遗传算法强大的搜索能力,实现对情感词分值的调整,结合情感词对文本的影响,设计并改进了变异策略以提升情感分类的准确率。设计了精英策略以提升算法的收敛速度。通过在中文和英文评论数据集上的对比实验表明,相较于已有的情感词库,构建的词库在特定领域文本情感分类的准确率和F1值都在80%以上,具有明显优势,证明了方法的有效性。该方法构建的情感词库在特定领域具有良好的性能,有效提升了情感词的覆盖率,能很好地扩展到其他领域。  相似文献   

4.
本文针对当前股票资讯服务中存在的实时性差、个性化缺乏和准确性不足等问题,设计并实现了一个基于资讯价值的股票资讯移动订阅系统。系统应用开源的Lucene和Weblech工具进行垂直搜索获取资讯,根据经济学知识构建个性化股票本体,通过查询扩展、本体匹配生成个性化的RSS种子,依据资讯价值进行排序,在移动端使用KXML进行解析,实现了资讯订阅。实验结果证明,本系统提供的股票资讯服务是有效的。  相似文献   

5.
目的提高扩展词与用户查询在语义层面上的关联,解决歧义扩展问题。方法基于差分进化算法的语义查询扩展技术先利用领域本体提供的领域背景知识来获取候选扩展词集,然后通过分析用户日志来获取用户检索偏好信息,最后利用差分进化算法确定同用户检索意图最相符的扩展词集。结果比起前沿的局部上下文分析方法,基于差分进化算法的语义查询扩展技术能够确定更高质量的扩展词集。结论利用用户日志和本体中概念间的语义关系作为背景数据来过滤无关的扩展词可以有效提高后续语义扩展过程的效率,差分进化算法能够有效排除同用户检索意图无关的词集并确定高质量的扩展词集。  相似文献   

6.
基于优化最大匹配与统计结合的汉语分词方法   总被引:1,自引:0,他引:1  
汉语自动分词足中文信息处理的前提,如何提高分词效率是中文信息处理技术面临的一个主要问题.基于训典和基于统计的分词方法是现有分词技术的主要方法,但是前者无法处理歧义字段,后者需要大量的词频汁算耗费时间.本文提出优化最大匹配与统汁结合的分词方法,首先提出优化最大匹配算法,在此基础上提出了规则判断与信息量统计两种消歧策略.然后,给出了优化最大匹配与统计结合的分词算法,提高了分词的效率.最后,基十分词算法实现中义分词系统,并通过实验对算法进行了分析和验证.  相似文献   

7.
传统的基于关键词匹配的查询方法因查询词短少,微博博文短小,容易引起歧义性,对查询效率有较大影响.提出一种基于本体和局部查询反馈的微博查询扩展算法,首先结合安全领域文档构建安全领域本体知识库,然后利用本体提供的语义知识对初始查询词进行扩展,再结合局部查询反馈对候选扩展词集进行筛选,最后通过二次查询和迭代操作得到最终查询结果.实验结果表明,基于本体和局部查询反馈的微博查询扩展算法比基于关键词的查询扩展算法、基于本体的查询扩展算法和基于"伪相关反馈"的查询扩展算法有更好的查全率和查准率.  相似文献   

8.
基于SURF-RANSAC配准的三维重建   总被引:1,自引:0,他引:1  
为了提高三维重建中双目特征匹配的匹配效率和重建质量,在基于传统的加速鲁棒特征(SURF)匹配算法基础上,提出了一种基于SURF-RANSAC配准的三维重建算法。利用左右两幅图像来进行三维重建,首先通过Hessian矩阵来获取目标图像的初始特征点,并用邻近快速搜索算法完成初步的特征点匹配,然后融合随机抽样一致性算法(RANSAC)来优化匹配,最后利用三维坐标和纹理映射来完成三维重建。在Open CV上对该算法进行验证。结果表明,本文算法比传统的三维重建算法具有更高的精确度和更快的速度。  相似文献   

9.
提出了一种基于网络入侵检测的方案,即从结构上构造一个匹配集,优化入侵检测特征的存储结构,提高入侵检测的效率;并且改善了匹配检测算法,使系统具有学习性;加强了对数据的分析,提高了系统的准确性。  相似文献   

10.
针对传统网页排序算法PageRank和HITS中存在的主题漂移、检索效率低等不足,本文提出了一种改进算法PHIA(PageRank and HITS Improved Algorithm)。该算法继承了HITS算法获取根集和基本集的方法,并且使用根集中所有网页的PageRank值作为Hub和Authority初始迭代值,最后根据马尔可夫链求随机矩阵的特征向量的方式来获取网页排名的静态分布。基于随机关键词的检索结果可知,相比于传统的PageRank和HITS算法,改进PHIA算法具有更快的收敛速度,并且在一定程度上提高了网页排序的准确度。  相似文献   

11.
提出一种基于Gabor匹配的甚低比特视频编码算法 ,通过算法自学习优化Gabor匹配集提高编码效率 .实验测试结果表明 ,在甚低码率 ( 2 4kb/s和 10kb/s)下有效保证视频编码PSNR和编码效率 ,同时从根本上解决传统编码方法在甚低码率视频编码中的块效应问题 .  相似文献   

12.
为提高关系数据库上的关键词查询系统的准确性和查询效率,采用生成倒排索引文件和查询词的相关结果集相结合的方式建立关键词检索系统,并通过改善权重表以及相关记录的排名进行查询优化.提出的查询系统根据用户输入的关键词,可以动态生成用户表单,以此从不同用户表中返回相关记录来处理关键词.研究结果表明:该系统可以提高用户查询的准确性和查询效率,并对关系数据库中关键词查询的研究与应用具有一定的参考价值和借鉴意义.  相似文献   

13.
根据校园网的网络结构和资源分布特点,针对经典PageRank算法采用的平分页面自身PageRank值的策略,提出了基于关键词集的网页关联权重分配PageRank值的改进算法.权值由页面问的关联程度和用户的搜索关键词确定,从而提高了校园网搜索引擎的搜索匹配程度和结果页面的排序质量.  相似文献   

14.
提出一种异步请求匹配方案——当前匹配算法,介绍了当前匹配算法的算法思想以及算法实现.通过对异步请求特点的分析,得出影响当前匹配算法的因素,进而提出乱序因子的概念.乱序因子主要受服务器处理性能影响,可以通过提高服务器处理性能来降低乱序因子,进而提高算法效率.通过将当前匹配算法与顺序查询及其相关改进算法进行比较,得出当前匹配算法较其他算法更适用于iPhone中异步请求数据的匹配.当前匹配算法在保证质量的基础上提高了顺序查询算法的效率.最后通过试验对其进行了验证,说明了该方案的有效性.  相似文献   

15.
由于生物医学本体拥有规模庞大的概念和复杂概念间关系,已有本体匹配技术难以高效确定生物医学本体匹配结果。为解决这一问题,构建了生物医学本体匹配问题优化模型,提出基于进化算法的生物医学本体匹配技术来确定最优匹配结果。在求解生物医学本体匹配问题时,采用一种新的生物医学本体概念相似度度量来确保匹配结果质量,并通过基于推理的概念对剪枝技术缩小算法的搜索空间,提高算法效率。实验结果表明,基于进化算法的生物医学本体匹配技术能有效匹配生物医学本体。  相似文献   

16.
基于改进汉宁窗的信息检索模型   总被引:1,自引:4,他引:1  
基于关键词匹配的检索方法检索时间长,检索结果质量差,无法适应用户群体的多样性。在此考虑了检索词含义、顺序及词密度,首先对用户提出的检索词进行基于知网的概念扩展,从词所表达的概念意义层次上来认识和处理用户的检索请求,并提出了基于改进汉宁窗的信息检索模型。实验表明,基于改进汉宁窗的信息检索模型较传统的基于关键词匹配的检索算法有更高的查准率及召回率,有效地改善了检索性能,可以更好地为用户提供检索服务。  相似文献   

17.
案例检索是基于案例推理系统的关键环节,检索方法的优劣直接影响案例检索的效率和案例匹配的准确度.针对传统案例检索方法中存在的不足,提出了一种基于二次检索策略和改进的欧式距离算法的案例检索优化方案,并通过算例证明了该方案的有效性.研究成果有助于提高案例检索的效率和质量,同时具有较好的分辨率.该方案尤其适用于数值型案例的检索.  相似文献   

18.
目的为了提高无人机航拍图像拼接的精度,深入研究了航拍图像拼接中提取特征点的算法,并对原算法加以优化.方法在图像特征点提取的SIFT算法中,设计了一种将Harris角点检测算子融入SIFT特征点提取的优化算法,优化后可以突显获取到的特征点的独特性.结果利用优化算法获取图像特征角点,可以降低实验过程中所消耗的检测时间,有效地改善了SIFT算法中匹配数据量大及过程繁琐的弱点,同时优化算法简化了图像特征点匹配的计算过程,降低了计算量,提高了实验效率.结论优化算法可以去除大量的类匹配点,使图像特征点的独特性更加明显;也提高了图像的配准精度,增强了关键点的稳定性,在关键点的匹配速度和准确率上有积极的影响.  相似文献   

19.
基于夹具定位方案几何稳定性概念,推导了确定性定位下夹具定位方案的几何稳定性参数表达式,并针对装配过程中偏差控制目标,提出了定位点搜索算法并对夹具定位点布置进行优化设计.通过某车型仪表板定位方案设计实例验证该算法的有效性.结果表明,所提出的方法可显著提高夹具定位方案设计的质量和效率.关键词: 夹具设计; 几何稳定性; 定位优化  相似文献   

20.
当前的大规模数据分析通常在MapReduce框架下执行查询。由于MapReduce框架本身的冗余性以及查询之间的重叠性,复用已有查询的结果可以大幅提高查询的执行效率。复用查询的结果需要对其进行存储和匹配管理,产生高昂的系统开销,抵消复用的部分效果。本文针对目前先进的查询结果复用系统ReStore在管理查询结果和匹配中存在的效率低下的问题,提出森林结构的Job存储管理技术和与之相适应的匹配算法,提高查询的匹配效率,减少系统的开销。为了使系统能够充分复用已执行查询的结果,本文提出对多个查询进行预处理的方案,通过改变各查询进入Pig编译器进行编译的顺序,从而改变Job的执行顺序,使得加载相同数据集的Job同时执行,减少与存储库进行匹配的次数。实验表明:在构建存储结构与匹配已有结果过程中,本文提出的方法与ReStore相比,节约16.3%的时间开销,伸缩性也更好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号