首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 687 毫秒
1.
基于最大熵模型的组块分析   总被引:39,自引:0,他引:39  
李素建  刘群  杨志峰 《计算机学报》2003,26(12):1722-1727
采用最大熵模型实现中文组块分析的任务.首先明确了中文组块的定义,并且列出了模型中所有的组块类型和组块标注符号.组块划分和识别的过程可以转化为对于每一个词语赋予一个组块标注符号的过程,我们可以把它作为一个分类问题根据最大熵模型来解决.最大熵模型的关键是如何选取有效的特征,文中给出了相关的特征选择过程和算法.最后给出了系统实现和实验结果.  相似文献   

2.
基于最大熵模型的汉语问句语义组块分析   总被引:1,自引:0,他引:1  
问句分析是问答系统的关键,为降低问句完整语法分析的复杂度,该文应用浅层句法分析理论,采用问句语义组块方式来分析问句。以“知网”知识库为基础,提取和定义了表达汉语问句的6种语义块,定义了语义组块最大熵模型的特征表示,通过最大熵原理实现了语义组块特征抽取和特征选取学习算法,并以模型为基础实现了真实问句的语义块的标注,从而为在语义层面上理解汉语问句奠定了基础。实验结果说明最大熵模型应用于汉语问句语义组块分析具有较好的效果。  相似文献   

3.
基于Internet的军事演习信息抽取系统   总被引:3,自引:0,他引:3  
论文论述了Web文档的信息抽取的基本方法,设计并实现了一个基于Internet上的军事演习信息抽取系统—SBIES。在系统中引入了分装器的机器学习算法来获取网页抽取规则,采用基于最大熵模型的组块分析方法进行部分语法分析,利用模式匹配的方法实现信息的自动抽取,以数据库与XML相结合的方式组织信息库,并实现信息的Web表示和查询。系统测试结果表明,它具有较高的抽取召回率和抽准确率。  相似文献   

4.
在Java面向对象的程序设计中有效地利用模板设计模式,可以巧妙解决变化对系统带来的影响,使系统扩展性增强。本文重点讨论了模板设计模式的定义与结构,并对其应用进行了深入探讨。  相似文献   

5.
藏语句法功能组块能够很好地描述藏语句子的基本骨架,是连接句法结构与语义描述的重要桥梁。根据藏语句法特点,该文作者提出五种句法功能组块及功能组块边界识别策略。首先描述了藏语句法功能组块的基本特点和标注体系,然后在此基础上提出了一种基于条件随机域(CRFs)模型的功能组块边界识别算法。小规模训练语料的实验结果表明,该方法可以有效的识别出功能组块边界,值得进一步研究。  相似文献   

6.
在Java面向对象的程序设计中有效地利用模板设计模式,可以巧妙解决变化对系统带来的影响,使系统扩展性增强。本文重点讨论了模板设计模式的定义与结构,并对其应用进行了深入探讨。  相似文献   

7.
复杂类问题理解是中文问答系统研究的难点,基于组块的问句分析方法将整个问句转化为若干组块,降低了问句分析的难度和复杂性。针对以含有事件(动作)信息的复杂类问题,提出基于语义组块的中文问答系统问题语义表征模型,采用语义组块的思想将问题的语义成分定义为疑问焦点块、问题主题块和问题事件块三个语义组块,对问句中的事件语义信息,建立了问题事件语义结构,将一个问句表征为一个基于语义组块的问题语义表征结构,用于问答系统的问题理解。通过序列标注学习方法实现问题语义表征中语义组块自动标注。实验结果表明:问题语义组块标注效果较好,问题语义表征模型获取了问题的关键语义信息,为语义层面上的问题理解提供基础。  相似文献   

8.
周晶 《计算机工程》2010,36(24):192-194
针对信息抽取领域中存在的抽取结果难以满足需要的问题,给出基于条件随机域模型的方法,以解决组块标注和实体关系抽取问题。通过定义中文组块和实体关系的标注方式,选择比较通用的《人民日报》语料,训练出效率较高的二阶模板来抽取文本中的实体关系。实验结果表明,该方法可以获得更好的抽取效果。  相似文献   

9.
汉语组块分析是中文信息处理领域中一项重要的子任务.在一种新的结构化SVMs(support vectormachines)模型的基础上,提出一种基于大间隔方法的汉语组块分析方法.首先,针对汉语组块分析问题设计了序列化标注模型;然后根据大间隔思想给出判别式的序列化标注函数的优化目标,并应用割平面算法实现对特征参数的近似优化训练.针对组块识别问题设计了一种改进的F1 损失函数,使得F1损失值能够依据每个句子的实际长度进行相应的调整,从而能够引入更有效的约束不等式.通过在滨州中文树库CTB4 数据集上的实验数据显示,基于改进的F1 损失函数所产生的识别结果优于Hamming 损失函数,各种类型组块识别的总的F1 值为91.61%,优于CRFs(conditional random fields)和SVMs 方法.  相似文献   

10.
P-F模型的过程复用机制及工具   总被引:2,自引:0,他引:2  
P-F模型是一种利用Petri Net与形式化描述相结合描述软件过程的方法。P-F模型的模板、模式和元模式概念在不同层次上提供了进行过程复用的方法。模板复用的是过程的内容信息;模式复用的则是过程的结构信息,是更高层的复用;元模式是最小的结构单元,可以设计模式。文章介绍了P-F模型中的这三种过程复用方法,及其在P-F过程设计工具PSTools中实现的途径。  相似文献   

11.
基于模板技术的产品大规模定制信息发布模型   总被引:1,自引:0,他引:1  
提出了基于模板技术的产品定制信息发布模型,该模型根据产品定制系统页面输出样式,通过模板定义层定义页面输出模板,并由模板生成层生成并保存页面输出模板;系统输出数据通过页面输出发布程序,结合相应的页面输出模板生成Web发布页面。该模型实现了系统信息发布页面的灵活定制和信息输出发布软件的复用。  相似文献   

12.
服务组合是Web服务应用的一个重要研究方向,利用工作流与服务组合的相似性,提出了一种基于工作流模板的Web服务组合模型;该模型利用功能语义在服务匹配上的优点,对流程、服务进行较为准确的查询;并通过Agent技术来执行组合方案;最后结合服务发布算法,将组合后的服务和流程发布在注册库中.  相似文献   

13.
工程对象的定制与集成   总被引:3,自引:0,他引:3  
虎嵩林  唐荣锡 《计算机学报》2002,25(12):1434-1440
在工程CAD的应用过程中,经常会遇到一些特殊的工程对象,一方面,不同的用户对这类对象会采用不同的处理方法完成设计,出图等任务;另一方面,这些处理方法虽无一致标准,却又有一定模式可循,该文提出了工程模式的概念,讨论了用模板对工程模式进行描述的若干关键问题,并提出了一套模板的设计与实现方法,模板的目标就是组织系统中相关的基本对象以及图形库,公式库,规则库,标准件库等资源,为工程对象提供定制机制,满足多变的应用需求,同时保障定制信息同系统的无缝集成,文章最后以钢结构设计中的难点问题-节点设计为例,论述了基于模板的设计过程。  相似文献   

14.
郭四稳 《微计算机信息》2006,22(36):217-219
本文在对目前各种题库系统分析的基础上,设计了基于模板结构的测试模型。按知识点进行分类,并对其建立相应的模板结构。依据该模型在数据库存放模板数据,依据模板测试时,可以快速生成不重复的题目。系统结合符号演算系统,在生成试题的同时,能自动给出相应的答案。  相似文献   

15.
为实现CAD/CAE集成一体化设计,基于SimXpert开发ProE模型向CAE模型快速转化的模板系统.该系统通过特征命名的方式自动快速地进行CAD与CAE之间的信息传递,从而实现SimXpert模板对ProE模型的识别以及向有限元模型的转换.利用外部XML文件数据库对模型所需要的属性进行自动识别和创建,并对相应的部件赋予这些属性.CAD模型向CAE模型的流程式快速转化可以提高数值模拟的效率.  相似文献   

16.
EXT2文件系统分析   总被引:1,自引:1,他引:0  
Linux由于其源代码的开放性而得到越来越广泛的认同,针对其文件系统的编程成为其中最普遍最核心的应用。通过分析Linux文件系统源代码,给出了EXT2文件系统的硬盘布局,详细论述了超级块、组描述符、I节点、目录结构等与EXT2文件系统相关的数据结构,着重分析这些结构中的核心数据项以及它们之间的关系,并从编程的角度归纳了这些结构在文件系统中的作用。  相似文献   

17.
针对现有的组合指纹模板保护方法存在的认证性较差,导致检索错误率较高的问题,提出了一种基于组合指纹的Bloom过滤和分块的模板保护算法。该算法通过对原有的组合指纹模板进行MCC编码,再分块应用Bloom过滤器进行过滤,形成新的指纹模板。有效地提高了指纹模板的认证性,降低了指纹检索恢复时的错误率,提高了匹配的准确率。通过实验仿真与结果对比表明,该算法在保证了指纹模板私密性的同时,可以有效地提高指纹进行组合构成模板时所下降的认证性,使其在指纹匹配过程中的匹配时错误率降低,提高了指纹匹配的准确性。  相似文献   

18.
Templates are pieces of HTML code common to a set of web pages usually adopted by content providers to enhance the uniformity of layout and navigation of theirs Web sites. They are usually generated using authoring/publishing tools or by programs that build HTML pages to publish content from a database. In spite of their usefulness, the content of templates can negatively affect the quality of results produced by systems that automatically process information available in web sites, such as search engines, clustering and automatic categorization programs. Further, the information available in templates is redundant and thus processing and storing such information just once for a set of pages may save computational resources. In this paper, we present and evaluate methods for detecting templates considering a scenario where multiple templates can be found in a collection of Web pages. Most of previous work have studied template detection algorithms in a scenario where the collection has just a single template. The scenario with multiple templates is more realistic and, as it is discussed here, it raises important questions that may require extensions and adjustments in previously proposed template detection algorithms. We show how to apply and evaluate two template detection algorithms in this scenario, creating solutions for detecting multiple templates. The methods studied partitions the input collection into clusters that contain common HTML paths and share a high number of HTML nodes and then apply a single-template detection procedure over each cluster. We also propose a new algorithm for single template detection based on a restricted form of bottom-up tree-mapping that requires only small set of pages to correctly identify a template and which has a worst-case linear complexity. Our experimental results over a representative set of Web pages show that our approach is efficient and scalable while obtaining accurate results.  相似文献   

19.
讨论了Internet Web数据库发布ASP源码自动生成器的设计与实现方法,叙述了系统的工作原理,异构多类型数据库连接与用户表搜索,SQL自动生成器,典型类型模板框架设计与模板配置,ASP与ADO源码自动生成与拼装设计。  相似文献   

20.
2维加窗全相位图像滤波模板的设计   总被引:3,自引:0,他引:3       下载免费PDF全文
为克服常用滤波模板的缺陷,消除传统图像滤波中存在的振铃现象和方块效应,提出了任意正交变换下的2维加窗全相位滤波算法.在严格证明任意正交变换下的2维全相位模板的计算通式基础上,进一步推导出傅里叶变换下的加窗全相位模板的简化公式.通过对亚奈图像的恢复实验证明:相比于反傅氏变换法生成的模板,用全相位DFT(discrete Fourier transform)模板恢复出的图像PSNR(峰值信噪比)值要高出7dB以上,且消除了振铃现象.通过实验还证明,用全相位DCT(discrete cosine transform)模板滤波可完全消除传统分块滤波中的方块效应.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号