排序方式: 共有65条查询结果,搜索用时 31 毫秒
1.
2.
在时空数据中有一类表示用户在某一时间到达某一地点的数据——到达数据,到达数据可以是社交网站的签到数据、轨迹数据中的停留点及公共交通中乘客抵达的位置数据,这些数据的聚簇可以反映用户的聚集行为.基于到达数据,提出一类新的时空数据查询——时空异常聚簇发现.将到达数据进行周期性划分,通过时空聚类算法对一个时间段的数据进行聚类,比较不同时间段内聚簇的差异度,发现具有最大簇异常度的前k个簇.通过该查询发现的时空异常聚簇可以应用于城市安全管理、基于位置的服务和交通调度等方面.定义了异常簇查询模型,提出了针对任意形状聚簇的簇差异度度量,将异常簇查询转化为二分图最大匹配问题,对二分图构建与匹配进行了优化并提出了高效的查询算法.利用真实数据集进行了充分实验,验证了查询结果的实际意义,评估了所提出的各查询算法在不同参数设置下的查询效率. 相似文献
3.
4.
基于张量分解的个性化标签推荐算法 总被引:1,自引:0,他引:1
基于互联网的社会标签推荐系统为广大用户提供了一个信息共享平台,让用户以"标签"的形式为其浏览的物品标注信息。标签既描述了物品语义,又反映了用户偏好。标签系统的最大优势在于可以发挥群体的智能,获得用户对物品比较准确的关键词描述,而准确的标签信息是提升个性化推荐系统性能的重要资源。然而,现存的标签推荐系统面临的问题是:由于兴趣的不同,不同的用户对于同一物品可能会打不同的标签,或者是同一标签对于不同用户可能会蕴含不同的语义。因此如何有效获取用户、物品、标签3者之间潜在的语义关联成为标签推荐系统需要解决的主要问题。为此引入三维张量模型,利用三维张量的3个维度来分别描述社会标签推荐系统中3种类型的实体:用户、物品、标签。在基于历史标签数据(标签元数据)构建初始张量的基础上,应用高阶奇异值分解(HOSVD)方法降低张量维度,同时实现3种类型实体之间潜在的语义关联分析,从而进一步提高标签推荐系统的准确性。实验结果表明,该方法较当前两种典型的标签推荐算法(FolkRank和PR)在准确率和召回率性能指标上有明显提升。 相似文献
5.
提高自我发展能力是农村弱势群体救助的必然选择 总被引:1,自引:0,他引:1
尽管政府对农村弱势群体的救济力度不断加大,却没能从根本上改变其弱势状态.贫困只是农村弱势群体的表象,自我发展能力的缺乏才是本质所在.因此,只有通过提升自我发展能力,让农村弱势群体成员积极主动地融入社会发展之中,才是解决农村弱势问题的根本出路. 相似文献
6.
近年来,越来越多的数据库查询研究工作开始致力于对模糊查询条件的概念化处理,称之为概念化查询.运用基于知识的数据查询方法可以实现这类查询,基本的方法是根据领域知识将用户的模糊概念转换成标准的SQL语句,实现概念化查询.但是,如果查询条件中包含了更高层次及多层次的模糊概念,则其概念转换非常复杂,查询的效率将受到严重影响.为了提高多层次数据查询的效率,以村镇住宅建筑产品查询为例,提出一种基于知识的多层概念化数据查询方法.首先需要建立描述模糊概念的知识库;然后,生成多层次的概念化数据,在概念化数据上实现基于知识库的多层数据查询处理.并采用人工数据集进行了实验分析,实验结果表明,在高层和多层概念化查询中,本文提出的方法与基本的方法相比查询效率至少提高40%.基于知识的多层概念化查询将为我国村镇住宅建筑产品查询提供高效的处理手段,能够满足不同知识水平用户的查询需求,具有较高的实用价值. 相似文献
7.
数据仓库环境下以用户为中心的数据清洗过程模型 总被引:7,自引:1,他引:7
数据清洗是数据仓库和数据挖掘中非常重要的一个环节。本文首先分析总结了数据清洗的有关概念,给出了数据清洗中需要解决的质量问题,并总结了解决这些问题的技术和方法。在此基础上提出了以人为中心的数据清洗过程模型。该模型集成了工作流技术、数据集成、数据转换和数据挖掘技术。给出了每个工具箱应该提供的基本功能。 相似文献
8.
星链ER模型:一种数据仓库概念设计模型 总被引:5,自引:0,他引:5
对于流程工业中的数据仓库建设,存在一贯性质量分析的需求,即前一个工序的工艺可能影响下一个工序的产品质量.针对这种需求,提出了一种数据仓库的概念设计模型,星链ER模型.其中引入了链式事实主题结构的概念,并把度量细分为传递型度量与非传递型度量,给出了星链ER模型的图形表示法以及由概念模型到逻辑模型的转换规则.该模型可以方便地转化成多种逻辑模型如星型模式、雪花模式以及星座模式. 相似文献
9.
IncSNN——一种基于密度的增量聚类算法 总被引:1,自引:0,他引:1
基于密度的聚类算法是一类重要的聚类算法,能发现任意形状的簇,但由于它的时间复杂度较高,因此设计有效的增量更新算法是一个重要研究方向.在SNN算法的基础上,提出一种基于密度的增量聚类算法-IncSNN.该算法将所更新对象的空间进行划分,定义了基于该划分的最近邻居的概念,进而确定了受影响对象的集合,当算法更新时,只需要对受影响的数据进行处理.由于受影响对象的集合远小于原数据集合,因此显著提高了算法的效率.实验结果验证了IncSNN的有效性. 相似文献
10.
在关系数据库中单表、星型模式或雪花模式之上建立一个逻辑结构,把要分析的数据及相关属性抽象成主题、立方体、事实、、维层次和度量等对象,相关的处理过程抽象成对象的行为,并介绍利用XML文档存储多维数据模型对象的信息方法及立体方体的创建过程,实现了多维数据模型的对象化,有利于OLAP及数据挖掘。 相似文献