首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
企业相关信息抽取技术研究与系统实现   总被引:9,自引:0,他引:9  
从企业网页中抽取与企业相关的信息是商业上的实际需求,与之相关的研究既有挑战,又有理论意义。文章提出了一个能对中文网页中企业的各种不同类型的属性信息进行抽取的模型,并实现了一个企业相关属性信息抽取系统—CAIES。对该系统进行的测试结果统计表明,它不仅能够满足从网上获取企业竞争情报的实际需求,而且具有较高的抽取正确率与精确率。  相似文献   

2.
一种基于Agent的中文Web信息自动检索系统   总被引:1,自引:1,他引:0  
通过分析现有中文检索系统存在的缺陷,提出了一种基于agent的中文Web信息自动检索系统。分析了系统的工作原理和体系结构,介绍了系统中使用的关键技术,将支持向量机引入智能过滤子系统,有效解决了中文Web信息的智能分类和检索。实验结果表明,该系统有效提高了检索系统中的查全率和查准率,取得了满意的个性化检索效果。  相似文献   

3.
《现代电子技术》2016,(17):112-115
设计并实现了中文领域术语抽取系统,提出了基于前后缀的中文领域术语抽取算法,该算法独立于具体的领域,并且对包含常用前后缀的领域术语具有较好的抽取效果;通过对领域本体构建中关键技术的研究,提出了适用于不同领域的领域本体半自动构建方法;最后,数字图书馆气候变化领域本体的成功构建验证了基于多源数据的领域本体半自动构建方法的有效性,并且该方法可以很方便地移植到其他领域。  相似文献   

4.
《现代电子技术》2017,(10):46-49
为了提高的Web交互网络环境下的信息获取和引擎搜索能力,提出基于Android的大型Web交互网络平台设计方法。通过Web服务器建立Cloud-P2P信息融合模型,在Hadoop,MongoDB,Storm三种开源的底层计算框架下进行大型Web交互网络平台的服务系统设计,基于Android操作系统进行Web交互网络平台软件开发。采用种子URL信息爬取方法进行互联网上的信息搜索和网页信息处理,并设计垃圾信息过滤模块,提高信息识别的效率。测试结果表明,该平台具有较好的Web信息爬取能力,信息召回率等测试指标表现较好。  相似文献   

5.
针对搜索情况来分析每位用户搜索信息的需求,而提出了基于用户搜索意图视角下的Web网页动态化的模型,主要就是为了搜索出的Web网页动态化建立关键词、文档格式等之间的层次,这样就可以根据每位用户访问提供搜索导航,但其并不是为了获取用户搜索的意图,而是为了建立用户搜索意图视角下的Web网页动态泛化。因此,文章主要针对用户搜索意图视角下的Web网页动态泛化研究而探讨的。经过探讨可以得出该模型是可以获取用户访问信息的意图。  相似文献   

6.
随着Web技术的发展,越来越多的信息需要通过异步Web传输来获取,提出一种基于Msxml2的异步信息搜索方法,通过采集Web侦听页,分析XML信息结构,达到信息传送的目的。  相似文献   

7.
针对目前deep Web数据集成在数据获取方面存在代价大和查询选择效率低等问题,提出了一种基于循环策略和动态知识的deep Web数据获取方法,该方法根据同领域数据源之间的关联关系,提出使用循环策略分多次完成数据源的数据获取,同时利用集成系统已获取的数据动态构建知识,并设计了基于集成系统动态知识的查询选择方法。与现有方法比较该方法能降低数据获取的代价,提高查询选择的准确性。实验结果表明,该方法有效地提高了deep Web数据集成的数据获取效率。  相似文献   

8.
文中研究如何从HTML文档中提取图片相关信息,保证高效和准确的实现图片检索。在对图像搜索引擎检索模式分析的基础上,提出了若干关键技术,设计并实现了一个基于文本的Web图片搜索引擎,给出了系统的总体结构图.并对获取网页、提取信息、图片抓取、建立索引和提供查询进行了详细的描述,分析了图像搜索引擎的检索模式。  相似文献   

9.
随着Web技术的发展,越来越多的信息需要通过异步Web传输来获取,提出一种基于Msxml2的异步信息搜索方法,通过采集Web侦听页,分析XML信息结构,达到信息传送的目的.  相似文献   

10.
为了更加准确有效地从海量的互联网网页中获取感兴趣的信息,设计并实现了一个面向互联网新闻的话题追踪与检测系统,并在该系统的基础上提出了面向海量互联网网页时话题检测中聚类算法选择策略以及一个基于多重特征的话题追踪模型,该模型能够很好地区分相似与相同的话题,并且话题追踪正确率达到了85.7%,实验结果表明文中系统能够有效地检...  相似文献   

11.
从客户需求信息入手,提出了一个基于语义Web的客户需求获取与分析框架,在此基础上采用OWL本体语言对产品的信息模型和客户需求信息进行了描述.然后讨论了基于语义Web的客户需求的推理过程,并通过推理机对客户需求信息进行自动推理,从而获取具体、真实的客户需求.最后结合某企业的电饭煲实例对该方法的有效性进行了验证.  相似文献   

12.
人类社会现已进入了一个信息大爆发的新时代,如何利用计算机新技术从互联网上自动获取特定主题信息并实时提供服务,成为信息技术研究领域的热点之一.在网络爬虫、数据抽取、文本智能分类等关键技术研究及实现的基础上,研制集成了全球油气行业动态信息系统PetroDIS.该系统在信息获取、信息分类、网页构建等多方面做到了自动化,极大地提高了信息收集效率.  相似文献   

13.
在企业中,报表集中展示了企业发展各方面信息,为企业决策提供重要参考.传统报表生成工具功能复杂,需要专业业务人员才能使用,与企业整个信息系统集成不足,为此企业需要耗费人力物力进行二次开发.本文依据报表生成在企业办公中的流程性特点,提出一种基于工作流的面向报表生成流程的web构件框架.在该框架内可以通过配置Web构件,无需编码即能进行快速开发报表,降低了报表开发难度,提高了报表生成效率,开发的报表系统易于维护.最后,实现了一个基于该Web构件框架的年报系统,验证了框架的可行性.  相似文献   

14.
事件抽取是信息抽取研究领域中的一个关键问题。针对采用传统的自我训练方法进行泰语新闻事件抽取,具有错误从上向下传播导致事件抽取系统性能不高的问题,针对这一问题,文中提出一种新的引导框架来进行泰语新闻事件抽取,即跨语言信息投影。该方法将从中文事件抽取系统中获取的信息映射为泰语,并采用结合单语与跨语言半协同训练的方法进行泰语新闻事件抽取。最后通过实验验证了本文所提方法是可行的,并且显著地提高了泰语新闻事件抽取的性能。  相似文献   

15.
针对基于模板生成Web页的基本特点,结合Ontology知识,探索Deep Web垂直搜索中,复杂Web页面的Wrapper自动化生成的解决方案.对实际复杂Web页面抽取的实验结果表明,该方法达到了较高的抽取准确率.  相似文献   

16.
邱春艳  孙铁利 《通信学报》2005,26(B01):284-288
针对目前常见搜索引擎搜索结果过多,而且很多与用户需求并不相关现象,提出了基于Web的特征提取搜索引擎。该搜索引擎既具有robot的更新及时、无须人工干预,又具有director的信息准确的特点,并给出了基于Web的特征提取搜索引擎的实现策略。  相似文献   

17.
卫莉莉  王煜 《电子世界》2012,(21):80-81
本文以机械领域挖掘机为主题,介绍了一种面向领域的Web文本采集与分类系统实现方法,将专业词库与特征选择相结合,逐步筛选和更新主题特征词,扩充专业词库,通过由主题特征词构成的向量来明确表示主题;采用基于内容分析的方法抽取网页正文,去掉干扰主题相关度判断与文本分类的广告、导航等干扰文本;根据现有的机械主题类别信息,采用基于KNN的机械主题文本分类算法对文档集合进行多子类分类。  相似文献   

18.
孟新光  王倩 《电子设计工程》2011,19(11):100-102
为了实现电力SCADA(数据采集与监控)系统与电力调度其他相关应用系统的集成,提出了基于SOA(面向服务架构)实现跨平台的集成的应用框架和体系架构。该应用框架以SOA思想为指导,借助Web Service和J2EE平台技术的特性优势来实现。将电力SCADA系统分为用户层、Web层、业务逻辑层和企业信息系统层,对每一层做了具体的设计说明。该基于SOA的集成方法较之其他的集成方法,展现了更广泛的软硬件兼容性、灵活的功能部署和简易的系统扩性。  相似文献   

19.
基于SOA的企业应用集成研究   总被引:9,自引:0,他引:9  
吴晓  吕爽  马新强 《信息技术》2007,31(4):97-99
分析了企业信息系统集成的必要性和传统EAI解决方案所面临的不足。介绍了面向服务架构(SOA)的基本概念、基本工作原理,并从SOA架构模型出发,提出了一种基于Web Ser-vice的SOA集成方案。论证了基于SOA实现企业信息集成的优越性:将应用系统看作一组服务构件的集合,对服务构件有序编排融合便能够部署到现有的应用系统中,从而支持动态实现将来未知的企业应用集成。  相似文献   

20.
李向阳  陆建江  张亚非 《电子学报》2004,32(11):1915-1917
提出一种基于竞争分类的Web信息抽取方法,以信息片段与样本之间的相似度作为竞争力,通过信息片段对信息模板槽的竞争实现对信息片段的分类和噪声信息的过滤,直接从分类的角度抽取Web信息.较之基于规则的信息抽取方法,竞争分类法只需用户提供少量的标记样本.测试表明,该方法在没有用户提供特征提示信息的情况下,抽取信息仍能保持较高的准确率,适应性强;对数据项缺失和顺序变化较大的数据源,竞争分类法也具有较好的健壮性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号