共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
日志分析对于在用户搜索领域有着很重要的意义,目前的日志分析系统有着不少弊端,比如:海量数据无法处理、离线处理模式、处理时延长等。对日志数据采用分级归档,可以实现大数据的分级优化处理。本文通过提出在一种基于Hadoop的大数据日志分析模型,并对其业务处理流程以及功能架构进行深入分析,实验结果反映出该系统扩展性强、海量数据处理能力卓越、满足在线处理等,具有良好的可行性和有效性。 相似文献
3.
4.
随着数据库应用系统中数据量的急剧增大,对数据库系统性能的优化显得极为重要。本文讨论了影响基于SQL Server应用系统性能的几种因素,并对SQL Server的查询机制和查询优化进行了深入地探讨。 相似文献
5.
6.
7.
本文证明:当数据依赖集D由等值生成依赖组成并且数据库模式R关于D有无损连接时,已有的在覆盖型嵌套fd的假设下关于恒时维护模式的识别和省效查询处理的结果仍然适用。我们也将证明,当数据依赖由fd和一个jd组成时,对任何取自单个关系模式的属性集X,现有的计算恒时维护模式的X—完全投影的方法仍然适用。 相似文献
8.
9.
10.
PowerCaster是一种基于C/S架构针对音乐类广播节目类型化播出设计的自动播出软件,与S1相比,Power-Caster可实现广播节目的类型化播出,即可以根据事先制定节目策略智能化排播出单.但在为节目生产提供便捷的同时,该系统生产厂家未对系统播出日志设计查询功能,不便于在系统发生故障时及时查询播出日志.针对这一问题,利用面向对象的高级编程语言C#对该系统日志查询功能进行了二次设计. 相似文献
11.
分析现有垃圾邮件过滤分类算法的不足,根据垃圾邮件的概念漂移特性,提出了一种基于CBR的垃圾邮件过滤算法.针对中文垃圾邮件特点提取特征,设计基于CRN网络的实例检索算法,该算法增加了预计算阶段,从而提高检索速度.实验结果表明,与传统贝叶斯算法相比,该算法对于动态变化的中文垃圾邮件数据集有更好的过滤效果. 相似文献
12.
13.
14.
15.
为了改善自然语言处理应用中长期存在的主题漂移和词不匹配问题,本文首先提出一种加权项集支持度计算方法和基于项权值排序的剪枝方法,给出面向查询扩展的基于项权值排序的加权关联规则挖掘算法,讨论关联规则混合扩展、后件扩展和前件扩展模型,最后提出基于项权值排序挖掘的跨语言查询扩展算法.该算法采用新的支持度和剪枝策略挖掘加权关联规则,根据扩展模型从规则中提取高质量扩展词实现跨语言查询扩展.实验结果表明,与现有基于加权关联规则挖掘的跨语言扩展算法比较,本文扩展算法能有效遏制查询主题漂移和词不匹配问题,可用于各种语言的信息检索以改善检索性能,扩展模型中后件扩展获得最优检索性能,混合扩展的检索性能不如后件扩展和前件扩展,支持度对后件扩展更有效,置信度更有利于提升前件扩展和混合扩展的检索性能.本文挖掘方法可用于文本挖掘、商务数据挖掘和推荐系统以提高其挖掘性能. 相似文献
16.
17.
18.