排序方式: 共有113条查询结果,搜索用时 15 毫秒
41.
论文元数据信息的自由抽取 总被引:1,自引:1,他引:1
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者,摘要和关键宇等元数据信息,在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有的结构,在不采用语法分析等复杂的自然语言处理手段的情况下取得了很好的效果,为面向特定领域的元信息抽取作了有益的研究和探索。 相似文献
42.
半结构化数据查询重写 总被引:10,自引:1,他引:10
查询重写是数据库研究的一个基本问题,它和查询优化,数据仓库,信息集成,语义缓存等问题紧密相关,目前Internet上存在海量的半结构化数据,在信息集成过程中产生了大量半结构化视图,如何利用物化半结构化视图来重写用户查询,减少响应时间成为研究热点问题,上述问题本质上是NP问题,提出了一种半结构化查询重写的新方法,该方法在保证算法正确性和完备性的基础上,利用半结构化数据特点和查询子目标之间的关系,减少了指数空间的查询重写候选方案生成,理论分析表明,它极大地降低了算法的代价。 相似文献
43.
面向移动环境的时空数据挖掘研究现状与展望 总被引:3,自引:1,他引:3
移动通信与无线定位技术的迅速发展导致了大量时空数据的产生,面向移动环境的时空数据挖掘的目标就是从这些数据中抽取知识,为基于位置的服务、智能交通系统等提供有效的决策支持。文章分别从时空数据挖掘的理论基础研究和相关应用研究的现状、重点解决的问题以及进展情况展开论述,并展望了未来的发展方向。 相似文献
44.
45.
46.
47.
数据管理技术的重要方向 总被引:3,自引:0,他引:3
数据管理技术是信息技术发展的基础。据统计,企业数据规模正以每年200%的速度增长,且90%是非结构化内容数据(如文档、音视频流等)。与此同时,为了有效地利用数据,人们迫切需要一个经过整合的综合信息基础架构。为了满足这些需求, 相似文献
48.
49.
50.
朴素贝叶斯分类中的隐私保护方法研究 总被引:3,自引:0,他引:3
数据挖掘中的隐私保护方法,试图在不精确访问原始数据详细信息的条件下,挖掘出准确的模式与规则.围绕着分类挖掘中的隐私保护问题展开研究,给出了一种基于数据处理和特征重构的朴素贝叶斯分类中的隐私保护方法.分别提出了一种针对枚举类型的隐私数据处理与特征重构方法--扩展的部分隐藏随机化回答(Extended Randomized Response with Partial Hiding,ERRPH)方法和一种针对数值类型的隐私数据处理与特征重构方法--转换的随机化回答(Transforming Randomized Response,TRR)方法,并在此基础上实现了一个完整的隐私保护的朴素贝叶斯分类算法.理论分析和实验结果均表明:朴素贝叶斯分类中基于ERRPH和TRR的隐私保护方法具有很好的隐私性、准确性、高效性和适用性. 相似文献