一种使用文档对象模型的AJAX爬行方案 An AJAX Crawling Scheme Adopting Document Object Model期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一种使用文档对象模型的AJAX爬行方案

引用本文：	张雪松,王鸿磊. 一种使用文档对象模型的AJAX爬行方案[J]. 河北工程技术职业学院学报, 2014, 0(2): 44-47

作者姓名：	张雪松王鸿磊

作者单位：	[1]徐州工业职业技术学院,江苏徐州221140 [2]徐州市工业信息网络工程技术研究中心,江苏徐州221000

基金项目：	2013年徐州市科技发展基金计划（XF13C035）;2012年徐州工业职业技术学院科研课题（XGY201213）

摘要：	许多WEB应用程序采用AJAX技术来增强用户体验。但是AJAX的一些特性使它在传统搜索引擎实施抓取操作时非常困难。如谷歌的AJAX爬行方案需要网站改变架构并添加额外的代码，因此只被谷歌支持。针对这种情况，提出了一种基于文档对象模型和广度优先爬行算法的AJAX爬行方案，它可以通过跟踪由AJAX事件引发的DOM树的变化，来建立AJAX WEB应用程序的状态转换图，进而生成原始AJAX WEB应用程序的静态镜像站点。实验证明，该AJAX爬行方案确实可以爬行AJAX应用程序。
关键词：	AJAX爬行文档对象模型广度优先算法
An AJAX Crawling Scheme Adopting Document Object Model

ZHANG Xue-song,WANG Hong-lei. An AJAX Crawling Scheme Adopting Document Object Model[J]. , 2014, 0(2): 44-47

Authors:	ZHANG Xue-song WANG Hong-lei

Affiliation:	1.Xuzhou College of Industrial Technology, Jiangsu Xuzhou 221140,China; 2.Xuzhou engineering research center for information network of industrial, Jiangsu Xuzhou 221000, China)

Abstract:	Many web applications employ AJAX to enhance their user experience. But many properties of AJAX can make traditional search engines crawl web applications hardly. Google’s AJAX crawling scheme was currently sup-ported only by Google, because it suggests webmasters change their website architectures and add additional code. In view of this, the paper presented an AJAX crawling scheme based on document object model and breadth-first crawling algorithm. It can establish a state transition graph of an A-JAX web application, through tracking the changes of the DOM tree. Then it builds a static mirror site of the original AJAX web application. Experimental results show that the AJAX crawling scheme can really crawl Ajax application.

Keywords:	Ajax crawling Document object model Bread-th-first Algorithm
本文献已被维普等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏