排序方式: 共有61条查询结果,搜索用时 15 毫秒
31.
基于双序列比对的中文术语语义相似度计算的新方法 总被引:1,自引:1,他引:0
针对中文术语的语义相似度计算问题,本文首先用数学语言对其进行了描述,然后仔细分析了求解该问题的传统计算方法,结果发现传统计算方法大都做了一个隐式假设:组成两个术语的原子术语的顺序必须大体一致.换句话说,传统计算方法并没有考虑原子术语顺序的差异对构建两个术语的原子术语间对应关系质量的影响.为克服这个问题,通过类比分析,本文认为可将该问题看作一个全局双序列比对问题,因而引入生物信息学领域中著名的全局双序列比对算法(NW算法).理论及实验研究均表明,在绝大多数情况下,该方法优于传统方法,或至少与传统方法的效果相当. 相似文献
32.
33.
34.
35.
探索专利文献中的化合物和生物知识变得至关重要。为了识别化合物实体和生物实体,开发了面向专利的化合物和生物实体识别系统。系统基于开源的机器学习和自然语言工具进行开发。系统按照流水线模式进行,本文将详细阐述其三个主要过程:预处理(句子分割、词条化),识别(基于条件随机场的方法),后处理(基于规则的方法)。最后,利用系统在已标注的化合物专利语料库进行大量实验,进行十折交叉验证,得到了 69.20% 的 F 值。但是,从结果可以看到,在专利文献上的实验表现,要低于论文和新闻语料库中的表现。 相似文献
37.
38.
39.
针对目前知识组织中存在的问题,将模块化本体引入到知识组织中,提出一个开放的知识组织方法,并分析开放知识组织结构、基本原则、本体模块间语义关系及知识组织算法等。该方法能够将知识分割,将其分配给独立的知识用户,使知识用户能够参与知识的共同构建、维护,从而实现知识的开放组织,在一定程度上降低知识组织的复杂性,提高知识组织的质量和协作能力。 相似文献
40.
文章在传统单视角知识组织系统的基础上,提出了多视角知识组织系统的概念与框架,即在传统知识组织系统的构建和服务过程中增加知识的适用语境--视角,并对视角的概念与表达作了简要阐述。此外,针对视角的构建方法,文章提出了基于属性聚类的视角生成方法,并用自建的金融语料与属性列表进行了实证研究,成功抽取出多个视角。 相似文献