排序方式: 共有6条查询结果,搜索用时 15 毫秒
1
1.
CCD语义知识库的构造研究 总被引:2,自引:0,他引:2
CCD(the Chinese Concept Dictionary)是一个WordNet框架下的汉英双语语义知识库(the Chinese—English WordNet).在制定语义规范后,作者提出了构造CCD的演化模型(the model of evolution).新的构造模型强调双语语义知识库构造中的继承(inheritance)和转换(transformation)思想,希望从WordNet现有的英语单语语义信息出发,通过词典编纂者的联机翻译(online translations)和可视化操作(visualized operations).逐步实现由WordNet到CCD的计算性转换,自然地得到一个双语语义知识库,从而大幅度提高构造此类语义知识库的效率和质量.针对该构造模型,作者设计并实现了可视化的辅助词典构造软件VACOL.该软件在北大计算语言所CCD项目中得到大规模的应用,取得了很好的成果. 相似文献
2.
宗莲松 《四川工业学院学报》2012,(4):42-48,69
基于模糊集合方法和Wordnet的查询扩展技术,提出了一种用户查询词扩展的信息检索方法。先用Wordnet找出查询词的同义词,再利用广义Jaccard系数来计算2个同义词之间的相似性,选取相似性较大的同义词进行查询词扩展后实现信息检索。此方法不仅保留了模糊集合方法对查询词处理简单且容易理解的特性,还很好地解决了模糊集合方法不能对文档进行精确排序的问题。最后,提出了基于矩阵的布尔式向析取范式转化的算法,该算法转换简单快速,解决了模糊集合方法中随着查询词数量的增加使得布尔表达式转化成析取范式变得很复杂的问题。 相似文献
3.
LDA(Latent Dirichlet Allocation)等基于隐含topic的模型在离散数据处理中的应用逐渐增多.然而LDA使用Dirichlet分布作为隐含topic的分布函数,未能很好表示各topic之间相互关系.目前常见改进方法是通过DAG(Directed Acyclic Graph)图或对数正态分布等其他分布函数表达topic之间的关系.本文通过参数有偏估计的方法,考虑topic混合过程中词项上的重叠关系,改变topic内部词项分布,最终改进LDA模型性能.在回顾一些基础内容后,重点介绍参数有偏估计及简化计算方法.最后通过LDA模型在信息检索中的实验验证这种改进的有效性,并初步分析模型参数选用规律. 相似文献
4.
中文词汇网络:跨语言知识处理基础架构的设计理念与实践 总被引:1,自引:0,他引:1
中文词汇网络(Chinese WordNet, 简称CWN)的设计理念,是在完整的知识系统下兼顾词义与词义关系的精确表达与语言科技应用。中文词义的区分与词义间关系的精确表征必须建立在语言学理论,特别是词汇语义学的基础上。而词义内容与词义关系的发掘与验证,则必须源自实际语料。我们采用的方法是分析与语料结合。结合的方式则除了验证与举例外,主要是在大量语料上平行进行词义标记,以反向回馈验证。完整、强健知识系统的建立,是兼顾知识本体(ontology)的完备规范(formal integrity)和人类语言系统内部的完整知识。我们采用了上层共享知识本体(SUMO)来提供知识的规范系统表征。 相似文献
5.
针对目前对于Web服务匹配的研究中所存在的不足,提出了一种轻量级的服务匹配算法.该算法利用了本体所提供的领域知识,并在服务的功能描述的匹配过程中利用了本体概念的词汇语义信息.实验表明,该算法在保证有良好性能的同时,较好地提高了查找效率. 相似文献
6.
1