排序方式: 共有12条查询结果,搜索用时 0 毫秒
1.
2.
3.
基于HTML模式代数的Web信息提取方法 总被引:3,自引:0,他引:3
高效地生成提取Web信息的包装器有着广阔的应用前景,同时也是至今没有得到有效解决的难题.为此,提出了基于HTML文档的模式代数,该代数包括一致模式集等重要概念以及模式的加法运算.在此基础上,提出了一种提取Web信息的新方法,该方法采用在整个训练例子中学习表示各属性提取规则的一致模式集,再由多个模式组成的一致模式集提取数据,适用于提取具有缺省属性、多值属性、属性具有多种不同顺序的表结构网页和层次结构网页,其有效性在原型系统中通过实验得到验证. 相似文献
4.
5.
云计算的蓬勃发展为Web服务带来了新的机遇和挑战.一方面是用户日益增长的服务需求,另一方面是互联网上大量功能相似、质量各异的具体服务,如何合理利用这些服务来满足大规模的用户需求成为一个亟待解决的问题.传统服务组合技术侧重于服务功能的扩展,并未考虑服务的非功能属性提升.本文根据抽象服务的概念,提出平衡遍历方法聚合具有相似功能的具体服务提升整体性能.这不仅满足了用户的规模化需求,而且提高了具体服务的利用率.此外,本文还针对服务的多维非功能属性,提出可扩展的skyline抽象服务选择算法,并通过一系列实验验证了所提出方法的有效性和可扩展性. 相似文献
6.
7.
8.
9.
镜河地处北京城市副中心,为副中心办公区主要景观带。受温度、光照、气压等影响,镜河半封闭水体在春季易爆发水绵污染事件,采用生物应急措施(投加生物制剂)治理水绵,同时监测应急治理水环境质量的变化。本研究分别采用单因子水质标识指数法、综合营养状态指数法和三维荧光光谱对镜河水绵治理过程中水质进行分析,结果表明生物治理对镜河水质和水体富营养化状态均有改善效果,治理过程会导致氨氮阶段性升高但不造成持久性风险,污染物最终归趋于沉积物中,但水绵再次爆发可能性较大,需要更进一步开展稳定化处理和生态修复。本研究采用的水环境综合分析结合溶解性有机质形态表征可以精确识别水环境演变过程,为半封闭水体水绵类污染治理提供参考。 相似文献
10.
大量的不规范表结构信息是当前Web信息提取所必须解决的问题.在现有方法基础上,给出了归纳学习相邻属性间上下文规则集算法,提出了以Web页为粒度的属性转换机和有限状态自动机包装器概念,最后介绍了采用有限状态自动机包装器提取不规范表结构Web信息的算法. 相似文献