首页 | 官方网站   微博 | 高级检索  
     

OAI-PMH中元数据重复问题解决方法
引用本文:赵治军,王秀慧. OAI-PMH中元数据重复问题解决方法[J]. 电脑开发与应用, 2011, 24(1): 27-29
作者姓名:赵治军  王秀慧
作者单位:赵治军(张家口卷烟厂有限责任公司信息中心,河北张家口,075000);王秀慧(山西大同大学教育科学与技术学院,山西大同,037009)
基金项目:山西大同大学校级科研项目
摘    要:针对OAI-PMH框架中存在的元数据重复问题,根据重复元数据出现的两种情况给出了相应的解决方法.对于SP中来自同一个数据提供方中的元数据,根据元数据记录的标识符和时间戳去重;对于SP中来自不同数据提供方中的元数据,采用向量空间模型计算元数据间的相似度,进而达到去重目的.通过对OAI-PMH框架中元数据的去重,不仅减少了...

关 键 词:OAI-PMH  元数据  去重  向量空间模型

A Method to Solve the Problem of Metadata Duplication in the OAI-PMH
Abstract:There are two reasons that lead to the problem that a large number of duplicate metadata exist in the OAI-PMH.Firstly,a service provider has twice harvested from a Data Provider and we can remove the duplicate metadata by the identifier and datestamp of metadata records.Secondly,different Data Provider may have same metadata and the duplicate metadata is deleted by calculating the similarity among metadata based on vector space model.By removing the duplicate metadata in the OAI-PMH,not only the data redundancy is reduced combined with the saving of storage space,but also the query efficiency is greatly improved.
Keywords:OAI-PMH
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号