首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
为了有效利用句法信息指导翻译过程,提出了基于贪心搜索的树-串句法统计翻译模型的正向解码算法.该算法以对数线性模型为整体框架,采用翻译模型概率、语言模型概率和空译文罚分作为特征函数.在解码过程中首先生成初始译文,然后通过遍历句法分析树反复迭代来改进译文.重点研究了解码过程中译文片断的打分方法.实验在IWSLT2004数据集上进行并采用BLEU方法评价翻译结果.实验结果表明正向贪心解码算法在翻译质量和速度上均好于现有的反向解码算法,这说明正向贪心解码算法能够更为有效地利用句法结构信息,更适合于树-串统计翻译模型.  相似文献   

2.
长距离的实体间关系识别是语义关系抽取中的难点.从修辞结构理论出发,提出把语篇树与复杂句法树相结合的方法,进行了对照实验,结果表明语篇分析对于实体关系分类有一定的作用.语篇分析在关系抽取中的研究还处于起步阶段,本文的方法为以后的深入研究提供了一个基础.  相似文献   

3.
Domino和XML结构的相似性使XML文档可以方便有效地存储在Domino表单、域、页面、文件系统中,不需存储的XML数据可以在系统内存中处理.文章采用两种方法实现了XML文档在Domino中的存储:把XML原始数据存储在Notes域中,生成DOM(Document Object Model)树,通过遍历整个DOM树,按节点创建多个Notes文档;或者把XML原始文档调入系统内存,在内存中解析成DOM树,并只对包含所需数据的DOM树节点的子集进行处理,创建Notes文档.  相似文献   

4.
Fibrinogen-related proteins(FREPs) are lectins with at least a fibrinogen-like domain.They are widespread in Mollusca and play an important role as immune pattern-recognition receptors.These diverse molecules provide interesting models for the study of the evolution of innate immunity.Although oysters are among the most studied mollusks,there have been few investigations of this gene family in oysters.This paper reports the cloning of the first oyster FREP,named CgFREP,from the Pacific oyster Crassostrea gigas.Five types of FREP(CgFREP-1 to CgFREP-5) were obtained based on a single pair of primers,confirming their high diversity.The proteins deduced from these FREPs contained 253-363 amino acids and were divided into three subfamilies based on sequence identities(cutoff point <86%).The topological structure of the phylogenetic tree showed the five CgFREPs clustered together and were completely separated from the subgroup of FREPs obtained from Biomphalaria glabrata(BgFREPs).This implies that FREP diversity evolved before the BgFREPs branched off.An interesting aspect of the CgFREPs was their individual hypermutation.Ninety-three SNPs and five indels were characterized among CgFREPs.Some mutations(e.g.an insertion in CgFREP-5) could cause premature translation termination.Multiple alignments suggest recombination events might have occurred during exchanges between alleles,or by somatic diversification,or both.Individual sequence variability parallels the extraordinary complexity of the innate immune system,suggesting a potential capacity to recognize and eliminate many kinds of pathogens,even in a primitive system.The diversity of immune pattern-recognition receptors may offer an alternative strategy that functions in the absence of highly specific immune globulins,which only emerged in vertebrates.  相似文献   

5.
Some key issues in supporting collaborative design in product data management(PDM ) system and 3D computer aided design(CAD) system integrated environment are analyzed. The general architecture of the integrated environment is divided into five tiers and employs the transparently integrated mode, with the mode, function calling and information exchanging among independent PDM and CAD processes are carried out via message translation /parse approach. Product layout feature(PLF ) model definition is presented, PLF model is used to represent design intention at the preliminary design phase. The collaborative design methodology employing the PLF model in PDM/3D CAD integrated environment is analyzed. The design methodology can speed up the design process, reduce the investment and improve the product quality.  相似文献   

6.
提出在面向数据的英汉机译系统中,一种自动构建包含丰富语法与句法信息的树库的方法·即,基于词汇功能描述,将源语语料库中各句子转换为组成结构与功能结构的组合表示形式·其中,组成结构表示单词至较大单元或短语成分的分层组成,以一种比较简单的短语结构树的形式表示·而功能结构为语法功能如主语,宾语等等的表示·从目前的实验结果来看,已经达到比较令人满意的自动标注效果·因此,基于树库的成功构建,可有效且准确地进行源语分析·  相似文献   

7.
由于精馏分离序列与二叉树之间具有同构性,在数据结构上精馏分离序列可以抽象为二叉树,直接采用二叉树结构编码方案可以同时表达个体的基因型和表现型.借鉴生物界单亲父本可以经过无性繁殖得到子代的现象,对进化和遗传等重组算子进行设计.应用图论方法建立有效的二叉树结构演化重组机制,从而形成无性繁殖单亲交叉和变异算子.实例表明无性繁殖单亲遗传算法能够成功解算大规模精馏分离序列优化综合问题.  相似文献   

8.
构造与遍历一棵二叉树历来为数据结构中不可缺少的内容。构造二叉树经典的算法通常都是以遍历二叉树为基础的,先决条件已知二叉树结点的左右孩子情况,或者是由先序和中序遍历序列、中序和后序遍历序列惟一确定一棵二叉树。通过对二叉树结构特点的分析,提出了三种不同的构造二叉树的算法,并加以分析。  相似文献   

9.
在计算机辅助设计装配体设计中,必须建立一个有效合理的装配体数据结构。本文从装配体拆卸出发,构建了一个装配体的二叉树结构模型。通过对该结构的后序遍历,自动生成装配序列,能有效地描述装配体。  相似文献   

10.
Russ WP  Lowery DM  Mishra P  Yaffe MB  Ranganathan R 《Nature》2005,437(7058):579-583
Protein sequences evolve through random mutagenesis with selection for optimal fitness. Cooperative folding into a stable tertiary structure is one aspect of fitness, but evolutionary selection ultimately operates on function, not on structure. In the accompanying paper, we proposed a model for the evolutionary constraint on a small protein interaction module (the WW domain) through application of the SCA, a statistical analysis of multiple sequence alignments. Construction of artificial protein sequences directed only by the SCA showed that the information extracted by this analysis is sufficient to engineer the WW fold at atomic resolution. Here, we demonstrate that these artificial WW sequences function like their natural counterparts, showing class-specific recognition of proline-containing target peptides. Consistent with SCA predictions, a distributed network of residues mediates functional specificity in WW domains. The ability to recapitulate natural-like function in designed sequences shows that a relatively small quantity of sequence information is sufficient to specify the global energetics of amino acid interactions.  相似文献   

11.
提出了面向翻译研究的融合短语结构树和依存分析的短语依存树库(phrase dependency treebank,PDT)的构建思想,阐述了中英平行PDT的构建方法.PDT采用"扁平结构优先"的短语结构树和"基于语义"的依存句法功能标注原则,有别于传统依存分析的完全二分法.大连理工大学中英平行PDT(DUT-CEPDT)的生语料取自文本质量较高的政府工作报告和白皮书及其官方译文.首先,对文本进行分词和词性标注之后,利用专为语言学家开发的辅助工具LingTreeConstructor构建中文和英文的单语PDT;之后,在两个单语PDT之间从篇章到词的节点进行对齐,这种多层次的立体对齐比只有词、短语或句子的单层对齐能提供更丰富的翻译知识;最后,依据FrameNet进行双语平行的框架语义角色标注.DUTCEPDT将为译员培训和机器翻译研究提供所需的标准语料.  相似文献   

12.
基于EKEL的影评挖掘分析方法是从影评文本中自动获取电影基本知识与评价知识的一种数据挖掘方法.同时该方法是一种结合文法与本体的知识抽取方法,把设计好的影评文法体系与EKEL系统结合,形成一个文本知识挖掘系统,可以有效且准确地抽取影视领域中的基本知识与评价知识.首先设计影评文法,研究设计方法及设计原则,同时结合EKEL系统,对获取到的影评文本语料进行挖掘并分析,产生EKEL分析树,然后对EKEL分析树进行深入分析及后处理.接着进行影评挖掘实验,分析精确率和召回率,并总结本文所研究知识抽取方法的有效性.最后,并对该方法的通用性进行了展望.  相似文献   

13.
基于标记树的WEB页面净化技术研究   总被引:2,自引:0,他引:2  
根据Web页面标记建立标记树,通过分析,保留有用信息的标记子树,达到获取页面主要内容,净化页面的效果.  相似文献   

14.
为了有效解决精馏分离序列优化综合问题,研究邻域(超级)结构是成功实现寻优算法的前提。由于精馏分离序列与二叉树之间具有同构性,在数据结构上精馏分离序列可以抽象为二叉树,进而采用图论方法对其进行研究。本文运用组合数学理论深入研究了精馏分离序列综合问题.简明分析了有序剖分问题的计算复杂性;通过二叉树相邻切分点变换机制,实现了对精馏分离序列的随机搜索;提炼出后序遍历相邻变换的等价规则,从而构造出高效演化邻域结构。  相似文献   

15.
针对使用句法可控的复述生成模型生成对抗样本时模型性能受限于复述平行语料的领域和规模的问题, 提出仅需要单语语料训练的无监督的句法可控复述生成模型, 用以生成对抗样本。采用变分自编码方式学习模型, 首先将句子和句法树分别映射为语义变量和句法变量, 然后基于语义变量和句法变量重构原始句子。在重构过程中, 模型可以在不使用任何平行语料的情况下学习生成句法变化的复述。在无监督复述生成和对抗样本生成任务中的实验结果表明, 所提方法在无监督复述生成任务中取得最佳性能, 在对抗样本生成任务中可以生成有效的对抗样本, 用以改进神经自然语言处理(NLP)模型的鲁棒性和泛化能力。  相似文献   

16.
利用同源建模方法构建了Rhodobacter sphaeroides偶氮还原酶AZR的三级结构模型.结果表明,AZR为α/β型结构的黄素氧化还原蛋白,5个相互平行的β折叠形成分子中间的平面,5个α螺旋分列于平面的两侧;在β折叠的C端非共价结合的黄素单核苷酸(FMN)作为氧化还原反应中心.根据序列对齐分析,将依赖黄素的偶氮还原酶分为两个家族,但结构对比分析表明,它们具有类似的三级结构和活性区域.对AZR的结构研究为发现新的偶氮还原酶和深入研究其功能奠定了基础.  相似文献   

17.
在数据库上实现一种高效显示的任意树形结构   总被引:2,自引:0,他引:2  
根据树形结构的显示特征和线索二叉树的访问顺序,提出了一种新的表结构用来保存树,并在此表结构的基础上提出了新的树形结构显示算法,同时给出了增减节点以及求某个节点的所有子孙节点的算法。  相似文献   

18.
一种基于网格的工作流系统   总被引:2,自引:0,他引:2  
基于网格的工作流系统采用混合式的体系结构,在工作流引擎上集中管理,在任务处理上进行分布执行.工作流引擎通过解析树实现对过程模型中活动的处理,并给出遍历算法.工作流图形化建模工具支持模型向XML文件的转换,并支持XPDL标准.系统基于开放源码的Globus Toolkit 3.9.1实现,对于过程模型定义工具和工作流引擎,通过Web服务封装技术,把已有工作流系统的相关COM组件实现为网格服务,并把支持工作流的网格资源发布到协同设计环境中.对于工作流过程模型中的XML表示,采用C#实现为Web服务.多个Web服务结合在一起,实现网格环境下的工作流的布置.  相似文献   

19.
讨论了网页分类过程中数据预处理的相关技术,提出一种网页预处理方法,将网页解析为DOM树结构,通过分析、整理,得到噪音信息的特征,并依据判定规则,找出噪音信息并删除处理。网页去噪后,提取页面中的文本信息和每个相关链接目标URL、源URL及锚文本并存入数据库。实验结果证明,该去噪方法可以有效去除网页噪音,利用所提取的超链接结构信息分类网页,可以有效提高分类精度。  相似文献   

20.
一种基于支持向量机的蛋白质结构域边界预测方法   总被引:1,自引:1,他引:0  
提出一种基于支持向量机学习蛋白质结构域的边界预测方法. 在分析多序列比对结果的基础上, 定义了几种能够直接或间接反映蛋白质结构属性及结构域信息的新方法. 结果表明, 蛋白质序列信息预测边界信号的正确识别率达85%以上, 具有较好的泛化能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号