首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
基于最大熵模型的语义角色标注   总被引:1,自引:0,他引:1  
提出了基于最大熵模型的语义角色标注方法,该方法以浅层句法分析为基础,把短语或命名实体作为标注的基本单元,将最大熵模型用于句子中谓词的语义角色标注.该方法的关键在于模型参数估计和特征选择.具体应用中采用IIS算法学习模型参数,并选择基于句法成分的、基于谓词的、句法成分一谓词关系、语义四类特征作为模型特征集.将该方法用于信息抽取中事件表述语句的语义角色标注,对"职务变动"和"会见"两类事件的表述语句进行事件要素的语义角色标注,在各自的测试集上分别获得了76.3%和72.2%的综合指标F值.  相似文献   

2.
事件抽取是信息抽取研究领域中的一个关键问题。针对采用传统的自我训练方法进行泰语新闻事件抽取,具有错误从上向下传播导致事件抽取系统性能不高的问题,针对这一问题,文中提出一种新的引导框架来进行泰语新闻事件抽取,即跨语言信息投影。该方法将从中文事件抽取系统中获取的信息映射为泰语,并采用结合单语与跨语言半协同训练的方法进行泰语新闻事件抽取。最后通过实验验证了本文所提方法是可行的,并且显著地提高了泰语新闻事件抽取的性能。  相似文献   

3.
事件抽取是信息抽取领域一个重要研究方向,对信息检索、自动问答、舆情分析等领域均有很高的应用价值.传统事件抽取方法大多采用人工构建的方式进行特征表示,并通过分类模型进行事件触发词分类和论元角色识别.近年来,神经网络方法在图像分类、语音识别和自然语言处理等领域展现了突出的效果.神经网络方法的优势在于能够自动学习构建特征,从而避免了繁琐的特征工程.本文将对神经网络事件抽取技术进行系统论述,并展望未来的研究方向.  相似文献   

4.
基于隐马尔可夫模型的中文文本事件信息抽取   总被引:2,自引:2,他引:2  
提出了一种基于隐马尔可夫模型的中文文本事件抽取方法,该方法首先通过触发词探测从文本中发现特定的候选事件语句,然后利用隐马尔可夫模型从这些语句中抽取每个候选事件的事件要素,为每一类事件要素构建一个独立的隐马尔可夫模型用于该类事件要素的抽取,构建模型的关键是模型结构的学习和参数估计。实验结果表明,该方法能较好地实现中文文本事件抽取,较其他方法有更好的抽取性能。  相似文献   

5.
事件抽取作为信息抽取的重要一环,是非结构化文本转化为有价值的结构化文本的主要方式。针对目前事件抽取模型普遍训练时间长、模型体量大等问题,提出了一个基于ABBSAC的中文事件抽取模型。通过ALBERT预训练模型缩减模型体量,采用BiSRU++捕捉文本内部关联信息,并融合注意力机制提升模型精度,最后以CRF的输出作为抽取结果。基于新浪新闻自主构建了语料集,进行了对比实验。在获得较高准确率、召回率以及F1值的基础上,该模型训练速度提高了约10%,模型参数量裁剪了约82%,证明了所提模型的先进性。同时,在ACE05和DUEE基准测评数据集上,与前沿方法相比较,将触发词抽取的F1值分别提升了1.7%、0.3%,将论元角色抽取的F1值分别提升了5.4%、0.1%,有效提升了中文事件抽取任务的效能。  相似文献   

6.
地震应急工作中及时获取各类地震应急处置信息并直观展示,对震后抗震救援工作十分关键。随着信息技术的快速发展,震后网络资源中的各类灾害信息会随着时间变化呈现几何式增长且动态变化,但由于以上处置信息具有文本较长、语义内容繁杂散乱等特点,传统事件信息抽取方法在复杂长距离文本中的多类型事件抽取中容易出现嵌套实体和上下文语义复杂不明确的问题,从而影响到整体事件论元抽取的准确性。针对以上问题,采用基于Python的Selenium自动化技术+APScheduler定时模块进行数据多时段获取自动化获取,以近10年的历史灾情信息构建灾情信息语料库,并构建基于机器阅读理解框架,结合BiGRU网络的多轮问答式地震应急处置灾情信息抽取模型,对各类地震应急处置事件进行论元抽取。为了方便展示,基于WEBGL技术+VUE+PHP技术开发了地震应急处置灾情信息平台,在2023年多次地震的应用中,所提出的平台模型计算快速准确,为震后应急救援工作提供信息辅助。  相似文献   

7.
本文提出了一种新型的二进制框架BinaryEE。首先,利用相似度函数衡量句子中存在的事件类型,然后利用注意力机制的序列标注模型抽取事件触发词和事件元素。另在一个公共的事件抽取数据集FewFC进行评估。实验表明,与之前的方法相比,BinaryEE在重叠事件抽取问题上实现了良好的效果。  相似文献   

8.
针对传统方法不能有效抽取维吾尔语事件因果关系的问题,该文提出一种基于双向LSTM(Bidirectional Long Short-Term Memory, BiLSTM)的维吾尔语事件因果关系抽取方法。通过对维吾尔语语言以及事件因果关系特点的研究,提取出10项基于事件内部结构信息的特征;同时为充分利用事件语义信息,引入词嵌入作为BiLSTM的输入,提取事件句隐含的深层语义特征并利用批样规范化(Batch Normalization, BN)算法加速BiLSTM的收敛;最后融合这两类特征作为softmax分类器的输入进而完成维吾尔语事件因果关系抽取。实验结果表明,该方法用于维吾尔语事件因果关系的抽取准确率为 89.19%, 召回率为 83.19%, F值为86.09%,证明了该文提出的方法在维吾尔语事件因果关系抽取上的有效性。  相似文献   

9.
汉语句模对计算机在处理自然语言时具有重要作用,可以使其更好地理解和分析汉语文本、抽取文本信息,提高自然语言处理的准确性和效率。但由于中文文本表达存在一定的灵活性和多样性,使得目前现有的句模存在匹配精度低、句模数量多、难以完全覆盖所有句子等问题,阻碍了句模在具体领域实现广泛应用和发展。针对以上的不足,文章提出基于句子层次结构的语义句模(HSST)。该句模以句子是嵌套的、有层次结构的,句子结构并非单向线性的为构建依据,使用多个句模且根据句子的层次结构对这些句模进行组合,大大减少了句模的数量,提高句模的匹配精度,并使得其对中文文本的覆盖面更广,使机器能更准确有效地理解与抽取文本语义信息。  相似文献   

10.
文中提出了基于给定的查询词以新闻文档和具有额外情感极性评论信息为排名特征的新闻事件排名算法框架。首先,通过语义相似度交互模块将查询关键词、新闻文档和带有情感色彩的新闻评论转换为语义向量表示,并计算查询词和新闻文档相似度以及查询词和评论语句相似度。然后,基于特征提取查询关键词重要性特征、查询关键词频率特征和新闻事件相关性特征。最后,通过特征聚合模块将提取的特征与一些辅助相关特征合并,产生全局相关性分数,并基于所得出的全局相关性分数对新闻事件进行排名聚类。大型新闻数据集上的实验证明了该算法框架与常见排名算法相比具有明显的性能优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号