首页 | 官方网站   微博 | 高级检索  
     

基于启发式规则的多媒体主题信息挖掘
引用本文:邱鹍,封化民,庞宗强,宋国森.基于启发式规则的多媒体主题信息挖掘[J].北京电子科技学院学报,2007,15(2):65-69,73.
作者姓名:邱鹍  封化民  庞宗强  宋国森
作者单位:燕山大学,信息工程学院,秦皇岛,066004;北京电子科技学院,信息安全与保密重点实验室,北京,100070
基金项目:国家自然科学基金资助项目(60472082)
摘    要:随着Internet的发展,Web上信息呈爆炸式增长趋势,呈现方式也愈发多种多样,这就给多媒体内容的检索,信息提取等计算机处理带来了巨大困难。针对信息提取后,网页的多媒体内容的不一致性,本文提出了一种Web网页多媒体信息提取的融合算法。该算法通过对图像和文本的语义融合,判断信息提取后的网页中的各种形态的内容是否一致,并通过网页中的文字更加准确地表示图片所传达的内容。对来自30个网站的307个网页进行测试后的实验表明,本文提出的方法是可行的。

关 键 词:内容挖掘  融合模型  自信息量
文章编号:1672-464X(2007)02-0065-05
修稿时间:2007-01-31

Heuristic Rules Based Multimedia Information Mining
QIU Kun,FENG Hua-min,PANG Zong-qiang,SONG Guo-sen.Heuristic Rules Based Multimedia Information Mining[J].Journal of Beijing Electronic Science & Technology Institute,2007,15(2):65-69,73.
Authors:QIU Kun  FENG Hua-min  PANG Zong-qiang  SONG Guo-sen
Affiliation:1.Key Laboratory for Security and Secrecy of Information, Beijing Electronic Science and Technology Institute, Beijing 100070, China; 2.School of Information Engineering, Yanshan University, Qinhuangdao Hebei 066006, China
Abstract:With the development of Internet, the information on the Web has been exploded and the presentations of the Web documents are also diverse, the later brings tremendous troubles for the information processing, such as multimedia information retrieval, information extraction etc. Considering the multimedia content's incoherence after the web information extraction, a fusion method of the web multimedia content is proposed. This method can judge if the web's multimedia contents are coherence via fusing the image semantic and the text semantic. Testing on 307 web pages from 30 web sites shows that the method is effective.
Keywords:Content mining  fusion model  self-information
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号