首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 281 毫秒
1.
XML与HTML整合     
XML与HTML都是重要的网络标识语言,但各自具有优缺点,XML侧重于数据的描述,HTML侧重于数据的显示,若将两者整合则可以取长补短。主要介绍如何使用数据岛技术来实现XML与HTML的整合。  相似文献   

2.
“可扩展标记语言”(XML)是一种简单的与平台无关并被广泛采用的结构化化语言标准。XML相对于HTML的优点是它将用户界面与结构化数据分隔开来,XML不是要替换HTML,实际上XML可以视作对HTML的补充。以下从两个方面浅谈XML与HTML的结合。  相似文献   

3.
本文主要围绕HTML和XML两种标记语言,通过比较,指出了它们之间的相同和不同之处。虽然均为标记语言,HTML主要长于显示数据项,便于数据信息在Web上的显示;而XML更方便数据信息的存取、处理、交换、转换,适宜不同系统和应用程序之问进行数据交流和整合。  相似文献   

4.
随着Internet的发展,以HTML格式显示的Web数据越来越不适应新的发展需求,而用来描述和存储数据的XML语言有着许多优于HTML的技术,于是将HTML格式的数据用XML格式表示出来,是现在网络应用中需要解决的问题。这里介绍的基于Web的HTML到XML数据转换方法能够有效地把HTML格式的文件转换成XML(XHTML)格式的文件。  相似文献   

5.
“可扩展标记语言”(XML)是一种简单的与平台无关并被广泛采用的结构化化语言标准。XML相对于HTML的优点是它将用户界面与结构化数据分隔开来,XML不是要替换HTML,实际上XML可以视作对HTML的补充。以下从两个方面浅谈XML与HTML的结合。  相似文献   

6.
吕锋  余丽 《微机发展》2007,17(6):53-55
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。  相似文献   

7.
基于XML的Web数据抽取研究   总被引:1,自引:0,他引:1  
文中介绍了三种常用的Web数据抽取的方法:直接解析HTML文档的方法,基于XML的方法(也称作为分析HTML层次结构的方法)以及基于概念建模的方法。重点研究其中的基于XML的数据抽取方法,基本做法是将原始的HTML文档通过一个过滤器检查并修改HTML文档的语法结构,从而形成一篇基于XML的XHTML,然后利用XML工具来处理这些HTML文档。实现了从非结构化的HTML文档向结构化的XML文档转化的预处理过程,给在Web挖掘中使用传统的数据抽取方法进行数据抽取创造了有利条件。  相似文献   

8.
HTML到XML转换研究   总被引:1,自引:0,他引:1  
网络上的许多信息都是由HTML编写的,但HTML语言本身具有不足,使得其不能处理网络上的许多需求,而XML可以弥补很多HTML的不足,因此网络应用的传统数据和XML标记数据的转换变得日趋重要。本文对从HTML到XML的转换技术进行研究,并用Java语言实现该转换系统。  相似文献   

9.
XML数据岛通过特定的标签把 XML数据直接嵌入到 HTML文档中 ,采用数据岛作为交互手段 ,不仅可以使数据具备一定的语义信息 ,同时还能保持 HTML原有的特色 ,如利用用户端脚本程序实现动态信息交换等。给出了通过 XML的数据岛来快速创建自定义的上下文菜单  相似文献   

10.
杨绍方 《软件世界》2000,(12):120-121
一、XML的概念XML(eXtended Markup Language,扩展标记语言)被设计用于描述数据,它关心数据的内容是什么,而HTML被设计用于显示数据,它关心数据如何显示。在XML中没有定义XML标记,我们必须自己定义标记。XML可扩展的含义主要是指:在HTML中,标记(tags)和文档的结构是预定义,HTML文档的作者只能使用HTML标准中定义的标记,而XML允许作者定义自己的标记和自己的文档结构(使用DTD)。首先,让我们通过一个简单的XML文档来认识XML。1: 2: 3: Tove4: Jani5: 相似文献   

11.
一种基于内容的HTML到XML转换策略   总被引:6,自引:0,他引:6  
互联网应用系统中传统HTML内容数据的重用及其与Web中标准XML格式数据的互交换非常重要。通过对HTML结构和语法特点的分析,文章定义了一种分离HTML格式信息与表达有效语义的内容数据的标记规则,建立了该标记规则到XML模式的一种影射,从而实现了一种从HTML内容到XML结构数据的转换策略。最后,在网页在线维护系统WOMS中应用该策略实现网站管理者对网页的在线维护。  相似文献   

12.
一种新的Web数据模型-EOEM   总被引:1,自引:0,他引:1  
随着XML的普及,开发具有同时查询XML文档和HTML文档能力的新一代Web查询语言已是当务之急.但现有的Web数据模型存在种种局限.本文提出了一种新的Web数据模型,能够同时支持HTML和XML等半结构化文档的查询.  相似文献   

13.
可扩展标记语言XML的产生与应用技术   总被引:11,自引:2,他引:9  
可扩展标记语言 XML是一项新兴的网络技术,它由 W3C制订并于 1998年正式发布。 XML的产生源于 HTML和SGML,文章对这一背景给予了简要的讨论,并从可扩展性、结构描述和有效性确认三个主要方面介绍了XML的优点.文章重点讨论了基于 XML的网络应用,给出了一个通用的应用模式,详细探讨了其中的若干关键技术问题。  相似文献   

14.
《Computer》1998,31(10):120-122
Called “the emerging technology of the year” after it was endorsed by the World Wide Web Consortium (W3C), XML burst onto the scene in February. It was called the successor to HTML and, according to some, the future lingua franca for the exchange of structured data. As XML emerged from the obscurity of its W3C beginnings, it was perhaps inevitable that this new data format would begin generating misconceptions as fast as it has attracted enthusiasts. The article heads off four myths about XML before they become permanent misunderstandings: XML is a conspiracy led by Microsoft; XML is an extension of HTML; XML can drive Web browsers by itself; and XML is just for data  相似文献   

15.
《Computer》2003,36(5):14-16
XML's growing implementation has raised several key concerns. First, because they provide considerable information about a document's content, XML files include much more data than HTML files. This can burden a company's network, processor, and storage infrastructures. In addition to extensively describing a document's contents, XML files typically appear in plain text. These factors create security concerns. And many developers may not be cooperating with the effort to transition the Web from HTML to XML via XHTML (Extensible HTML).  相似文献   

16.
当前的Web信息大多数都是HTML格式的,由于HTML文件中没有严格的结构性,故很难能用一种有效的方法来检索或提取隐藏其中的数据.针对HTML的这种缺陷,本文提出了基于多叉树的HTML到XML转换方法,把对HTML的信息检索问题转化为对XML的检索问题,以便简化下一步的检索问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号