首页 | 官方网站   微博 | 高级检索  
     

XML文档实体识别技术研究
引用本文:赵震,张龙昌.XML文档实体识别技术研究[J].计算机技术与发展,2014(10):84-87.
作者姓名:赵震  张龙昌
作者单位:渤海大学信息科学与技术学院,辽宁锦州121013
基金项目:教育部人文社会科学研究一般项目(12YJC870030);辽宁省教育科学“十二五”规划(JG12DB149);辽宁省社会科学规划基金项目(L12CTQ008)
摘    要:随着XML文档的广泛应用,使用实体识别技术对XML文档数据质量进行管理变得非常重要。 XML中实体识别技术主要用于在XML文档中发现同一实体的不同描述,其在数据质量管理中可以用于错误检测、数据集成等。由于XML文档是半结构化的, XML文档上的实体识别与纯文本和关系数据上的实体识别有着很大不同。文中介绍了XML文档上实体识别的概念和应用,分别讨论了 XML文档上几种实体识别技术的概念和原理,给出了相应的树匹配算法,最后得出结论并展望了未来的研究方向。

关 键 词:XML文档  实体识别  数据质量

Research on Entity Identification Technology on XML Documents
ZHAO Zhen,ZHANG Long-chang.Research on Entity Identification Technology on XML Documents[J].Computer Technology and Development,2014(10):84-87.
Authors:ZHAO Zhen  ZHANG Long-chang
Affiliation:(College of Information Science and Technology,Bohai University,Jinzhou 121013 ,China)
Abstract:
Keywords:XML documents  entity recognition  quality of data
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号