首页 | 官方网站   微博 | 高级检索  
     

一种使用文档对象模型的AJAX爬行方案
引用本文:张雪松,王鸿磊. 一种使用文档对象模型的AJAX爬行方案[J]. 河北工程技术职业学院学报, 2014, 0(2): 44-47
作者姓名:张雪松  王鸿磊
作者单位:[1]徐州工业职业技术学院,江苏徐州221140 [2]徐州市工业信息网络工程技术研究中心,江苏徐州221000
基金项目:2013年徐州市科技发展基金计划(XF13C035);2012年徐州工业职业技术学院科研课题(XGY201213)
摘    要:许多WEB应用程序采用AJAX技术来增强用户体验。但是AJAX的一些特性使它在传统搜索引擎实施抓取操作时非常困难。如谷歌的AJAX爬行方案需要网站改变架构并添加额外的代码,因此只被谷歌支持。针对这种情况,提出了一种基于文档对象模型和广度优先爬行算法的AJAX爬行方案,它可以通过跟踪由AJAX事件引发的DOM树的变化,来建立AJAX WEB应用程序的状态转换图,进而生成原始AJAX WEB应用程序的静态镜像站点。实验证明,该AJAX爬行方案确实可以爬行AJAX应用程序。

关 键 词:AJAX爬行  文档对象模型  广度优先  算法

An AJAX Crawling Scheme Adopting Document Object Model
ZHANG Xue-song,WANG Hong-lei. An AJAX Crawling Scheme Adopting Document Object Model[J]. , 2014, 0(2): 44-47
Authors:ZHANG Xue-song  WANG Hong-lei
Affiliation:1.Xuzhou College of Industrial Technology, Jiangsu Xuzhou 221140,China; 2.Xuzhou engineering research center for information network of industrial, Jiangsu Xuzhou 221000, China)
Abstract:Many web applications employ AJAX to enhance their user experience. But many properties of AJAX can make traditional search engines crawl web applications hardly. Google’s AJAX crawling scheme was currently sup-ported only by Google, because it suggests webmasters change their website architectures and add additional code. In view of this, the paper presented an AJAX crawling scheme based on document object model and breadth-first crawling algorithm. It can establish a state transition graph of an A-JAX web application, through tracking the changes of the DOM tree. Then it builds a static mirror site of the original AJAX web application. Experimental results show that the AJAX crawling scheme can really crawl Ajax application.
Keywords:Ajax crawling  Document object model  Bread-th-first  Algorithm
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号