首页 | 官方网站   微博 | 高级检索  
     

相似性连接查询技术研究进展
引用本文:庞俊,谷峪,许嘉,于戈. 相似性连接查询技术研究进展[J]. 计算机科学与探索, 2013, 0(1): 1-13
作者姓名:庞俊  谷峪  许嘉  于戈
作者单位:东北大学信息科学与工程学院
基金项目:国家自然科学基金 Nos.61173027,61272179;国家重点基础研究发展规划(973) No.2012CB316201;中央高校基本科研业务费专项资金 Nos.N110404006,N100704001~~
摘    要:相似性连接查询,即查找相似的数据对象对,具有广泛的应用领域,例如相似网页检测、实体解析、数据清洗和相似图像检索等。相似性连接查询是当前大数据处理领域的热点问题之一。讨论了相似性连接查询面临的挑战;根据不同的标准对现有的相似性连接查询进行了分类;总结并比较了现有的字符串、集合、向量和图相似性连接算法;探讨了今后的研究重点和发展趋势。

关 键 词:相似性连接查询  相似性度量  海量数据

Research Advance on Similarity Join Queries
PANG Jun, GU Yu, XU Jia, YU Ge. Research Advance on Similarity Join Queries[J]. Journal of Frontier of Computer Science and Technology, 2013, 0(1): 1-13
Authors:PANG Jun   GU Yu   XU Jia   YU Ge
Affiliation:+ School of Information Science and Engineering, Northeastern University, Shenyang 110819, China
Abstract:Similarity join query is to find similar data object pairs for a wide range of applications, such as near duplicate Web page detection, entity resolution, data cleaning and similar image retrieval. Nowadays, similarity join query becomes one of the hot topics in the field of big data processing. This paper discusses the challenges of similarity join query. Meanwhile, it analyzes and classifies the existing similarity join queries according to different standards, then summarizes and compares the existing string, set, vector and graph similarity join algorithms respectively. Finally, it explores the research focus and trend of this area.
Keywords:similarity join query   similarity metrics   massive data
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号