排序方式: 共有33条查询结果,搜索用时 0 毫秒
1.
随着数据的极端稀疏性,仅仅依赖于传统的协同过滤相似性的度量方法已无法取得精确的推荐结果。针对这一问题,提出基于用户特征属性和云模型的协同过滤算法。首先,算法利用云模型计算用户评分云相似性,结合用户打分偏好对原矩阵进行填充,在此基础上得到用户的评分云相似性;其次,再结合用户特征属性相似性通过加权因子计算用户的最终相似性,得到一种新的相似性度量方法;最后,得到算法的评分预测。实验结果表明,该方法能够提高推荐质量。 相似文献
2.
一种基于粗糙集带支持信息的挖掘算法 总被引:1,自引:0,他引:1
本文根据直接利用粗糙集挖掘规则难以避免偶然性、以及求出所有约简与求最小约简的问题都是NP-难的问题,提出一种求精简规则的启发式算法DR。该算法根据实际数据挖掘的特点、充分利用属性支持信息直接从数据表中挖掘高支持度和描述长度小的规则集。算法DR计算简单,其效率主要与属性的个数相关,当属性取不同值的数目不大时是一个高效算法。 相似文献
3.
可视化挖掘是数据挖掘的重要研究领域,但目前的研究还主要集中在挖掘结果的可视化,用户对挖掘过程仍然缺乏可控性.本文利用focus context技术实现探索型交互式数据挖掘.充分利用人类用户的认知能力与计算机的数据处理能力,实现用户对挖掘过程的参与从而利用用户领域知识于挖掘过程.适应人类的认知心理,便于帮助用户对挖掘结果的定位、聚焦、理解与评估,进而快速找到相对于当前应用上下文的有价值信息.并实现了一个原型系统IMARFC. 相似文献
4.
基于BP神经网络的数据挖掘方法 总被引:4,自引:0,他引:4
神经网络的高度参数化特征使它特别灵活,以至于它可以精确的对数据进行分类,成为目前公认的高精度分类器。本文介绍一种基于BP神经网络的数据挖掘的分类方法,并提出了改进思想。 相似文献
5.
6.
基于正文特征的网页正文信息提取方法 总被引:2,自引:0,他引:2
利用正文字数多、标点符号多两个特征,提出一种基于正文特征的网页正文信息提取方法.谊方法利用HTML标签对网页内容进行分块,把具有正文特征的块保留,不具有正文特征的块舍弃,从而准确得到具有较高完整性的网页正文信息.实验结果证明该方法是有效的、通用的. 相似文献
7.
针对粗糙集确定性模型缺乏处理不确定信息的特点,Z.Pawlak等提出了粗糙集的概率模型,但该模型没有包括如何处理生产数据集纷繁复杂数据的方法,因此提出了应用粗糙集于生产环境数据挖掘的一种系统方法,并应用UCI的数据集对该方法进行了检验,实验结果体现了它的性能与有效性。 相似文献
8.
为了高效、准确、科学地分析数据,以便找出隐藏在数据背后的宝贵信息进而作出科学的决策,力图通过Excel的数据透视表组件实现OLAP多维数据库的数据分析与动态网页数据展现。利用由Excel的数据透视表组件快速开发出的OLAP网站,业务人员不需要额外培训即可通过IE浏览器实时、全方位分析与浏览多维系统中的数据。 相似文献
9.
个性化信息检索中,设计用户兴趣模型是一个关键问题.通过分析Web环境下用户的特点和浏览行为,提出一种基于层次向量空间模型的用户兴趣建模和更新方法,以满足用户个性化的服务需求.根据用户对页面的浏览速度来计算用户的兴趣度,使模型便于实现,且更新及时、简单. 相似文献
10.
随着计算机的发展,为了能更好地搜索到所需的内容,全文检索引警已经变得越来越重要.Lucene作为当前最流行的开源Java索引工具包,索引性能的提升是非常关键也是值得研究的,同时索引过程快慢是衡量一个搜索引擎的重要指标.在Java的基础上,通过更改Lucene提供的内置参数来适应不同计算机的硬件达到性能调节的作用.其次,更是提出了一种修改源代码的方法,主要是对Hits进行改进,提出了一种在结果非常多的情况下加速查询的方法,通过对索引过程和Hit结果集进行两方面的设置和改进达到性能提高的双重效果.仿真实验结果表明该改进方法不仅提高了索引工具性能的优化,同时减少了负载.通过这两方面的改进,可以使Lucene开发的搜索引擎达到更高的效率. 相似文献