首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
随着互联网技术的迅猛发展,因特网成为目前新闻信息最丰富最主要的来源。本文在分析新闻网页的基础上,分析了目前现有的信息抽取技术和XML技术,提出了一个基于XML技术的Web新闻抽取系统。本文主要是充分运用XML中的XPath技术在数据定位方面的优势,并提出一种基于DOM树的XPath生成算法,使用XSLT语言用于描述抽取规则,并使用路径表达式XPath定位待抽取的信息点。  相似文献   

2.
随着社交媒体技术的快速发展,人们越来越喜欢在微博这个社交平台上发布信息。在这仅仅140个字的消息当中,蕴藏着大量嘈杂而有价值的文本信息。寻找一个有效的舆情事件抽取方法也越来越受到人们的关注,事件抽取也成为一个热门的研究领域。本文采用了一系列的方法用于事件抽取。主要是采用新浪微博作为语料数据,选取金融舆论事件作为事件语料,使用条件随机场对事件元素生成模型。并在预测结果中加入参数,使得抽取结果的准确率有所提高。  相似文献   

3.
基于隐马尔可夫模型的中文文本事件信息抽取   总被引:2,自引:2,他引:2  
提出了一种基于隐马尔可夫模型的中文文本事件抽取方法,该方法首先通过触发词探测从文本中发现特定的候选事件语句,然后利用隐马尔可夫模型从这些语句中抽取每个候选事件的事件要素,为每一类事件要素构建一个独立的隐马尔可夫模型用于该类事件要素的抽取,构建模型的关键是模型结构的学习和参数估计。实验结果表明,该方法能较好地实现中文文本事件抽取,较其他方法有更好的抽取性能。  相似文献   

4.
事件抽取作为信息抽取的重要一环,是非结构化文本转化为有价值的结构化文本的主要方式。针对目前事件抽取模型普遍训练时间长、模型体量大等问题,提出了一个基于ABBSAC的中文事件抽取模型。通过ALBERT预训练模型缩减模型体量,采用BiSRU++捕捉文本内部关联信息,并融合注意力机制提升模型精度,最后以CRF的输出作为抽取结果。基于新浪新闻自主构建了语料集,进行了对比实验。在获得较高准确率、召回率以及F1值的基础上,该模型训练速度提高了约10%,模型参数量裁剪了约82%,证明了所提模型的先进性。同时,在ACE05和DUEE基准测评数据集上,与前沿方法相比较,将触发词抽取的F1值分别提升了1.7%、0.3%,将论元角色抽取的F1值分别提升了5.4%、0.1%,有效提升了中文事件抽取任务的效能。  相似文献   

5.
利用语义角色分析的方法对动态新闻进行事件抽取研究。通过对句子进行论元结构标注,抽取出句子中以谓语动词为中心的论元结构,将其转化为具体的语义角色,并与事件要素进行匹配,完成事件抽取工作。论文提出并重点研究了如何利用VerbNet和SemLink资源对动词的论元结构与事件要素进行匹配。抽取系统基于该方法对1 000篇新闻语料进行了事件抽取实验,结果表明该方法的F值达到70.6%,具有一定的应用价值。  相似文献   

6.
采用基于BootStrapping的方法实现中文事件元素抽取系统。其中,将事件元素抽取定义为一个模式匹配问题。针对这一问题,首先构建了初始种子集,然后创新性地引入了BootStrapping方法构建模板集,并使用模式匹配的方法进行事件元素抽取。在模板构造过程中,提出了基于BestMatch的模板泛化算法[1]。对任意两个事件实例模板[2]进行匹配,计算其匹配代价并泛化,提高了模板的覆盖能力。所实现的系统在ACE 2005语料测试中取得了不错结果。  相似文献   

7.
本文提出了一种新型的二进制框架BinaryEE。首先,利用相似度函数衡量句子中存在的事件类型,然后利用注意力机制的序列标注模型抽取事件触发词和事件元素。另在一个公共的事件抽取数据集FewFC进行评估。实验表明,与之前的方法相比,BinaryEE在重叠事件抽取问题上实现了良好的效果。  相似文献   

8.
9.
查询翻译是影响跨语言信息检索(CLIR)性能的关键因素之一.查询中未登录词(OOV)译文的挖掘对改进CLIR性能具有重要意义.利用主题词译文查询扩展方法从搜索引擎自动获取有效双语摘要资源;采用频度变化信息和邻接信息从双语摘要资源中抽取多词候选单元,并与常见的基于统计的多词单元抽取方法进行了比较.实验中译文挖掘方法取得了TOP 1包含率62.02%,TOP 10包含率95.35%的效果.  相似文献   

10.
11.
具有结构化输出的学习任务(结构化学习)在自然语言处理领域广泛存在。近年来研究人员们从理论上证明了数据标记的噪声对于结构化学习的巨大影响,因此为适应结构化学习任务的去噪算法提出了需求。受到近年来表示学习发展的启发,本文提出将自然语言的子结构低维表示引入结构化学习任务的样本去噪算法中。这一新的去噪算法通过n元词组的表示为序列标注问题中每个节点寻找近邻,并根据节点标记与其近邻标记的一致性实现去噪。本文在命名实体识别和词性标注任务的跨语言映射上对上述去噪方法进行了验证,证明了这一方法的有效性。  相似文献   

12.
针对Web信息在抽取过程中数据精确率不足的问题,提出了一种基于领域本体的web信息抽取方法.该方法使得领域本体中概念的层次关系和属性的特点得到了充分利用,本体的构造在抽取过程中逐渐得到完善,从而增强本体对应用领域的描述能力.实验证明文中的方法对web页面的信息抽取具有较高的效率.  相似文献   

13.
针对面向投影环境的视觉交互信息获取问题,提出了一种基于前景检测和立体视觉的体感交互信息获取方法.该方法使用双摄像头实时完成投影环境下的人体前景检测、姿势识别以及三维空间定位,能够为人机交互提供人体位置信息、姿势信息.为了验证该方法的有效性,设计并实现了一套虚拟场景视点控制系统.实验证明,该方法能够满足用户与虚拟场景实时交互的需要.  相似文献   

14.
为提高视频运动物体提取的准确性,提出了一种新的基于运动矢量信息的视频运动物体提取方法.将与运动矢量信息相关的分割因子用于运动物体提取的判据,然后通过对每帧图像构建分割因子矩阵,对每一帧分割因子矩阵进行二维熵门限判决,实现对视频序列中的运动物体的提取.研究结果表明该算法对于全局运动比较稳定且运动物体的速度较慢的序列具有较好的提取效果,提取成功率达90%以上.  相似文献   

15.
针对当前精确制导面临的制导信息缺乏问题,提出了基于粒子滤波算法的制导信息提取算法研究。粒子滤波算法作为一种基于贝叶斯估计的非线性滤波算法,在处理非高斯非线性时变系统的参数估计和状态滤波问题方面有独到的优势。文中以弹目相对运动方程作为系统的状态方程,目标的机动模型采用Singer模型,以导引头的输出数据作为系统的量测,利用粒子滤波算法进行弹目相对运动状态估计,从而求解得到视线角速率等制导信息。仿真结果表明了,基于粒子滤波算法的制导信息提取能够有效的提取出制导信息,具有较高的制导精度,满足制导控制系统对于状态估计性能要求。  相似文献   

16.
徐晓彩 《信息技术》2012,(5):164-167
介绍了一种基于分布式语音识别(DSR)的语音信息提取系统的设计。在客户端提取语音特征向量,编码后经过信道传输至服务器端,在服务器端用HTK工具进行语音的识别,使用Stanford parser进行句法分析以提取关键信息。通过仿真实验,该系统实现了语音信息的提取。  相似文献   

17.
提出一种基于相位信息与边缘投影的车体定位新算法,先将RGB颜色模型与HSV颜色模型相结合,利用相位一致性检测出汽车图像中的车体边缘,再通过投影处理得到候选车体区域,然后对候选区域进行判别,最终得到车体的精确位置.实验结果表明,该算法鲁棒性强,受图像亮度、对比度和阴影的影响小,而且适用于包含多部车辆的图像,定位准确率高于其他常用算法.  相似文献   

18.
针对图像轮廓特征信息提取的特点,提出基因编码算法。首先把像素映射为基因个体表达式,用基因编码值区分为图像轮廓特征,接着对像素的每个基因所编码属性筛选进行特征提取,最后给出了图像轮廓特征信息提取的算法过程。实验仿真得出基因编码提取的图像轮廓边缘很清晰,抗噪声能力强,时效性快,边缘点保持指数最接近1。  相似文献   

19.
《现代电子技术》2017,(17):70-74
为了更好地发挥正念的应用价值,探索并揭示其作用机制已成为相关研究的重中之重。脑电信号是一种方便且非常有效的研究手段,几乎蕴藏着正念过程中心理状态变化的全部信息。结合信号处理技术,从时域、频域、时频结合以及非线性特征量等方面分析正念脑电信号在不同角度下的物理意义及应用方法,这些方法有望为挖掘正念的作用机制提供理论、技术上的支持。  相似文献   

20.
针对新型单光子线性APD器件获得信息维度多、灵敏度高的特点,提出了一种基于单光子线性APD的微弱回波信号距离信息提取算法。首先利用微弱信号的泊松分布特性对回波信号进行建模,随后对每纳秒内的回波光子数进行统计,利用与脉宽等宽的距离窗进行滑窗求和,将最大值位置作为信号脉冲接收时刻,进而反算距离信息。设计了跟踪前的目标搜索策略和稳定跟踪后的距离门匹配算法,有效降低了背景光干扰和计算资源消耗,在回波光子数分别为200、10、5个时分别获得了100、9993、9658的计算正确率。对单光子量级信号设计了脉冲积累算法,单个光子信号回波的计算正确率为995。同时对静止目标通过算法迭代实现了信噪比为0dB甚至负dB的信息提取,对003个光子信号回波探测的计算正确率为961。仿真结果表明该算法可以综合应用单光子线性APD的强度信息以及单光子灵敏度,实现了在极限灵敏域下的距离信息提取。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号