排序方式: 共有11条查询结果,搜索用时 304 毫秒
1.
2.
3.
基于HTML模式代数的Web信息提取方法 总被引:3,自引:0,他引:3
高效地生成提取Web信息的包装器有着广阔的应用前景,同时也是至今没有得到有效解决的难题.为此,提出了基于HTML文档的模式代数,该代数包括一致模式集等重要概念以及模式的加法运算.在此基础上,提出了一种提取Web信息的新方法,该方法采用在整个训练例子中学习表示各属性提取规则的一致模式集,再由多个模式组成的一致模式集提取数据,适用于提取具有缺省属性、多值属性、属性具有多种不同顺序的袁结构网页和层次结构网页,其有效性在原型系统中通过实验得到验证. 相似文献
4.
5.
6.
7.
云计算的蓬勃发展为Web服务带来了新的机遇和挑战.一方面是用户日益增长的服务需求,另一方面是互联网上大量功能相似、质量各异的具体服务,如何合理利用这些服务来满足大规模的用户需求成为一个亟待解决的问题.传统服务组合技术侧重于服务功能的扩展,并未考虑服务的非功能属性提升.本文根据抽象服务的概念,提出平衡遍历方法聚合具有相似功能的具体服务提升整体性能.这不仅满足了用户的规模化需求,而且提高了具体服务的利用率.此外,本文还针对服务的多维非功能属性,提出可扩展的skyline抽象服务选择算法,并通过一系列实验验证了所提出方法的有效性和可扩展性. 相似文献
8.
9.
提出了一种适用于服务代理端的服务代码生成与调用的新技术,以满足Web服务发展对Web服务代理端的功能提出的更多要求。该方法基于新的服务存储模式,支持服务调用代码、界面、测试数据的生成。可以与UDDI系统,以及其他的各类服务检索系统进行良好的融合,并支持服务语义描述、多媒体与多语言。陈述了该方法的技术实现方案,并进行了与主流软件的效率对比实验,实验结果验证了该方法的高效性。 相似文献
10.
大量的不规范表结构信息是当前Web信息提取所必须解决的问题.在现有方法基础上,给出了归纳学习相邻属性间上下文规则集算法,提出了以Web页为粒度的属性转换机和有限状态自动机包装器概念,最后介绍了采用有限状态自动机包装器提取不规范表结构Web信息的算法. 相似文献