首页 | 官方网站   微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   383篇
  国内免费   27篇
  完全免费   136篇
工业技术   546篇
  2020年   2篇
  2018年   6篇
  2017年   8篇
  2016年   4篇
  2015年   20篇
  2014年   35篇
  2013年   23篇
  2012年   43篇
  2011年   54篇
  2010年   65篇
  2009年   59篇
  2008年   58篇
  2007年   51篇
  2006年   39篇
  2005年   31篇
  2004年   14篇
  2003年   14篇
  2002年   14篇
  2001年   5篇
  1999年   1篇
排序方式: 共有546条查询结果,搜索用时 46 毫秒
1.
基于双层级联文本分类的简历信息抽取   总被引:2,自引:1,他引:1  
本文提出了一种基于双层级联文本分类的方法,用于简历信息的自动抽取。本方法将简历文本分解为文本块和文本串,并将简历中包含的信息分解为概要信息与详细信息。首先对简历文本中的文本块进行切分与分类,抽取出概要信息,然后选择可能包含详细信息的文本块,将其切分为文本串,再通过对文本串的分类抽取出详细信息。对1200份中文简历的实验结果表明,本方法适用于简历信息的自动抽取和管理。  相似文献   
2.
基于时空分析的线索性事件的抽取与集成系统研究   总被引:5,自引:0,他引:5  
信息抽取技术能够提供高质量的检索服务。本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成。系统中采用了如下的方法、策略:(1)利用句型模板构造抽取规则,然后直接从经过时间短语和空间短语识别和规范化处理的文本中抽取事件信息,从而跳过了深层句法分析,降低了实现系统的难度;(2)利用事件的规范化的时空信息关联不同文档中的同一事件,进行事件合并;(3)文档发生事件转移时对文档进行事件切分,从而解决了文档内不同事件信息的归并问题。初步实验结果表明:本文采用的方法和策略是有效的。  相似文献   
3.
基于事件框架的信息抽取系统   总被引:8,自引:1,他引:7  
信息抽取技术能够提供高质量的检索服务。本文提出一种基于框架的信息抽取模式并建立统一的灾难性事件框架,利用框架的继承-归纳特性简化系统实现过程,概括事件信息,并提出按时间流顺序的线索性文件抽取的输出方式。本文使用这种方法建立了一个灾难性事件信息抽取系统。实验证明本文中的方法是有效的。  相似文献   
4.
企业相关信息抽取技术研究与系统实现   总被引:9,自引:0,他引:9  
从企业网页中抽取与企业相关的信息是商业上的实际需求,与之相关的研究既有挑战,又有理论意义。文章提出了一个能对中文网页中企业的各种不同类型的属性信息进行抽取的模型,并实现了一个企业相关属性信息抽取系统—CAIES。对该系统进行的测试结果统计表明,它不仅能够满足从网上获取企业竞争情报的实际需求,而且具有较高的抽取正确率与精确率。  相似文献   
5.
论文元数据信息的自由抽取   总被引:2,自引:1,他引:1  
为了实现在Web上电子版论文结构的查询,必须提取这些论文的标题、作者,摘要和关键宇等元数据信息,在北京大学数字图书馆科技文献检索系统中利用正则表达式规则对论文数据信息进行自动抽取。该文介绍的这种方法充分利用了论文所特有的结构,在不采用语法分析等复杂的自然语言处理手段的情况下取得了很好的效果,为面向特定领域的元信息抽取作了有益的研究和探索。  相似文献   
6.
基于标记树表示方法的页面结构分析   总被引:15,自引:1,他引:14  
页面内容结构分析在WEB信息检索、分类和抽取等方面有重要作用。文章从页面布局和内容之间关系出发,根据WEB文件中标记之间关系,用标记树表示页面文件。采用自底向上的算法,抽取出具有不同语义的页面内容,提出用树形层次结构表示它们之间关系的方法。在此基础上,通过模仿人们浏览页面的习惯,成功地将其应用于页面的计算机屏读系统。实现自动朗读页面主题的功能。  相似文献   
7.
基于Ontology的文本信息抽取   总被引:9,自引:1,他引:8  
网络中的电子文档以爆炸式的速度增长,其中很多数据是没有结构的或者半结构的,使信息的查询非常困难。提出一种基于Ontology的信息抽取方法。对需要信息抽取的领域,抽出它的关键词和信息片,并将其组织成为数据库的元组属性值,以方便查找。其实验数据来自WWW。  相似文献   
8.
网页信息抽取及建库系统C#实现   总被引:1,自引:0,他引:1       下载免费PDF全文
刘华 《计算机工程》2006,32(16):49-51
围绕网页内容解析、数据清洗、语料库信息字段定义和XML数据存储4个方面,该文介绍了网页信息自动抽取及建库的原理,并使用C#语言在微软.NET Framework下完成了一个网页信息自动抽取及建库系统,该系统具有智能性和个性化的特点,适合构建文本分类、话题识别和信息检索的大型训练(测试)语料集。  相似文献   
9.
基于包装器模型的文本信息抽取   总被引:5,自引:0,他引:5       下载免费PDF全文
在分析基于标志和基于文本模式两类算法的基础上,提出了一种新的包装器归纳学习算法。新算法综合上述两类算法的优点,不但能利用页面的标志信息进行信息定位,而且能利用文本的模式信息来进行信息抽取和对抽取结果进行必要的过滤。实验结果表明,新算法具有较高的信息抽取精度与信息表达能力。  相似文献   
10.
分析了RoadRunner的核心算法,针对RoadRunner的不足,综合自动和半自动抽取阶段的各项研究成果,设计并实现了基于相似页面的Web信息抽取系统。介绍了系统结构和实现的关键技术,包括如何获取相似页面,可靠的噪声处理和自动归纳抽取规则的算法。  相似文献   
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号