首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
我们的目的是探索一个新的计算语义学理论——信息语义学,本文大体勾勒出它的总体构,论述其基础,即基本概念,基本假设,基本原理.  相似文献   

2.
文本之间在相似度比较时主要考虑关键词的匹配特性,缺乏对关键词间组合关系的深入分析。针对关键词间组合特性,按序组合的关键词数目越大,对文本之间相似度贡献越大,并提出基于关键词组合数目的非线性语义关联性函数,在LCS基础上提取文本中所有关键词组合块。将这种结合关键词组合关系的相似度比较方法运用于短文本的相似度比较中,数据采用微软语义释义语料库,实验结果表明,短文本相似度计算的准确率和F1值都有了提高,其中F1值的提高较为明显。  相似文献   

3.
在文本情感分析时,使用无监督的聚类方法,可以有效节省人力和数据资源,但同时也面临聚类精度不高的问题。相似性是文本聚类的主要依据,该文从文本相似度计算的角度,针对情感聚类中文本—特征向量的高维和稀疏问题,以及对评论文本潜在情感因素的表示问题,提出一种基于子空间的文本语义相似度计算方法(RESS)。实验结果表明,基于RESS的文本相似度计算方法,有效解决了文本向量的高维问题,更好地表达了文本间情感相似性,并获得较好的聚类结果。  相似文献   

4.
本文提出了一种基于语义词典的网络评论文本情感分类及极性值计算方法,用于自动识别网络评论中的情感倾向。首先利用爬虫技术采集真实的电子商务网站在线评论文本数据,然后对语料做预处理,接着完成各类语义词典的构建和基础情感词典的扩充,最后使用本文提出的基于词典的无监督分类方法对获取的评论文本进行情感分类及极性值计算。实验结果表明,本文提出的情感识别方法对网络舆论的分类效果较为理想。  相似文献   

5.
陈可佳  费子阳  陈景强  杨子农 《软件学报》2022,33(12):4668-4687
文本风格迁移是近年来自然语言处理领域的热点问题之一,旨在保留文本内容的基础上通过编辑或生成的方式更改文本的特定风格或属性(如情感、时态和性别等).旨在梳理已有的技术,以推进该方向的研究.首先,给出文本风格迁移问题的定义及其面临的挑战;然后,对已有方法进行分类综述,重点介绍基于无监督学习的文本风格迁移方法并将其进一步分为隐式和显式两类方法,对各类方法在实现机制、优势、局限性和性能等方面进行分析和比较;同时,还通过实验比较了几种代表性方法在风格迁移准确率、文本内容保留和困惑度等自动化评价指标上的性能;最后,对文本风格迁移研究进行总结和展望.  相似文献   

6.
文本风格迁移一直是自然语言处理(NLP)中的一个研究热点,近年来,随着文本生成方法的发展,越来越多的工作着眼于不成对(non-parallel)文本风格迁移这一任务.这一任务的目标是,利用不包含一一对应句子的两个或多个不同风格的文本集,学习一个迁移模型,实现改变句子的风格的同时保留句子其他的内容.目前针对该任务,已有一些基于生成对抗网络的迁移算法被提出,但是受限于对抗学习本身的训练不稳定,以及对句子的风格和语义的独立性假设本身不合理,这些方法无法高效的学到迁移效果好的模型.在这篇文章中,我们首次从统计学习的角度给出了文本风格的定义—文本集中语义向量的协方差矩阵,在这种新的观点下,文本的风格依赖于所有句子的语义向量.我们随后提出了一种无学习(learning free)迁移方法,我们只需要预训练一个自编码器来得到句子的语义向量,然后对这些向量进行白化和风格化变换,来实现风格迁移.  相似文献   

7.
TTFS:一个倾向性文本过滤系统的设计与实现   总被引:3,自引:0,他引:3  
以往文本过滤的研究主要集中于主题性过滤,然而随着网络的发展,倾向性文本过滤在网络信息安全方面的作用越来越大。论文阐述了一个倾向性文本过滤系统TTFS(Tenclency Text Filtering System),能够对具有关于某个主题的特定倾向的文本进行过滤。该系统充分利用了领域知识,采用了语义模式分析等技术,实验表明其查全率和查准率高,速度较快。  相似文献   

8.
传统语义文本分类方法难以高效地在云计算环境下进行中文文本快速分类。为解决该问题,提出一个在云计算环境下基于语义关键词提取的分布式中文文本自适应分类算法,在代理端对中文文本关键词进行基于语义的分布式提取,并将提取出的中文关键词传输到中心数据库端进行整合,从而确定文本本身类别。通过理论证明在关键词提取数量足够的情况下,提出的文本分类算法可以在保证中文文本分类效果的前提下,有效降低网络传输的代价,从而提高中文文本分类算法在云计算环境下的性能。实验结果验证了该算法在云计算环境下的可行性以及理论推导的正确性。  相似文献   

9.
文本相似度算法研究一直是文本挖掘领域非常重要的算法,指采用一定的策略比较两个文本之间的相似程度,目前文本相似度算法已经在文本分类、文本聚类、自然语言处理等多个领域崭露头角。本文主要就语义角度出发对文本之间相似度进行界定。  相似文献   

10.
产品语义学是研究产品语言的表达意义。产品造型除表达其功能性目的以外,还要透过其语义特征来传达产品的整体视觉感受,传递出企业产品特性,同时还包括使用方式、文化内涵,并体现特定社会的时代感和价值取向。正如法国著名符号学家皮埃尔·杰罗所说的,在很多情况下,人们并不是购买具体的物品,而是在寻求潮流、青春和成功的象征。本文从企业产品设计角度研究产品设计的差异化竞争,主要探讨产品语义学是如何帮助企业进行完成独特产品语言的塑造;如何向消费者传达整体的产品视觉感受,以达到独特的企业产品视觉识别的目的。  相似文献   

11.
The authors examine aspect and the semantic classification of verbs, two areas of concern for natural language processing not often studied in the context of computational linguistics. A five-way aspectual classification system is defined on the basis of three aspectual features, making use of the concept of predicates as event structures. The aspectual value of a sentence can differ from that of its predicate due to the operation of aspectual functions. Sentential aspect is ultimately derived from the operation of various components of the sentence on the aspectual properties of the predicate. A system of twelve semantic features describing the core meaning of verbs provides a level of specificity that can distinguish different senses of verbs and could be used to predict their consequent syntactic and semantic behavior. The computational utility of these models will be tested on a working machine translation system.Also affiliated with Siemens Public Switching SystemsThis paper is written in conjunction with a research project funded by the Texas Higher Education Coordinating Board Advanced Research Programs, Grant No. 1631. The paper is a collective effort of the five authors. Although individual members of the group wrote particular portions, the entire group discussed and revised all parts of this work. We are jointly responsible for its contents. We wish to thank the journal's anonymous referees for their extremely helpful comments.  相似文献   

12.
文本蕴涵是文本理解与语义推理的基础,近来在计算机语言领域受到了极大关注。矛盾关系是蕴涵关系的一种否定,二者都是语义学的主要研究内容。在文本蕴涵关系识别的基础之上,研究了如何识别文本矛盾关系,提出了一种基于语义规则的矛盾检测方法。实验表明,基于语义规则的矛盾检测方法对于中文矛盾关系识别是可行的,同时矛盾关系相对精确的识别也增强了文本蕴涵识别的准确性。  相似文献   

13.
Situation semantics proposes novel and attractive treatments for several problem areas of natural language semantics, such as efficiency (context sensitivity) and prepositional attitude reports. Its focus on the information carried by utterances makes the approach very promising for accounting for pragmatic phenomena. However, situation semantics seems to oppose several basic assumptions underlying current approaches to natural language processing and the design of intelligent systems in general. It claims that efficiency undermines the standard notions of logical form, entailment, and proof theory, and objects to the view that mental processes necessarily involve internal representations. The paper attempts to clarify these issues and discusses the impact of situation semantics’ criticisms for natural language processing, knowledge representation, and reasoning. I claim that the representational approach is the only currently practical one for the design of large intelligent systems, but argue that the representations used should be efficient in order to account for the system's embedding in its environment. The paper concludes by stating some constraints that a computational interpretation of situation semantics should obey and discussing remaining problems.  相似文献   

14.
音乐风格反映了音乐作品的总体基本特征,是音乐欣赏、分析、研究的基础。针对音乐风格流派分析技术的核心——旋律特征描述和特征匹配,发展了非毗邻层连接的前馈神经网络结构,给出了误差反传训练算法的分类器,并进行了实验研究。结果表明,非毗邻层连接的前馈神经网络结构有优越的识别性能和极快的收敛速度。  相似文献   

15.
王涛  陈敏翼  齐军 《计算机应用》2012,32(8):2333-2337
软件代码的功能提取是功能集成的最基本前提,但软件功能提取普遍存在正确率低的问题。为此,提出基于Clight形式语义的代码功能描述提取机制,并用Clight代码功能描述算法实现。该机制严格基于Clight自然语义推理规则,忽略代码执行的中间细节,只关注执行前后的存储状态,并以此作为代码的功能描述,提高了功能提取的正确率和关键领域软件开发的成功率。  相似文献   

16.
基于语义的单文档自动摘要算法   总被引:1,自引:0,他引:1  
章芝青 《计算机应用》2010,30(6):1673-1675
单文档自动摘要的目的是在原始的文本中通过摘取、提炼主要信息,提供一篇简洁全面的摘要。自动摘要的主流方法是通过统计和机器学习的技术从文本中直接提取出句子,而单文档由于篇章有限,统计的方法无效。针对此问题,提出了基于语义的单文本自动摘要方法。该方法首先将文档划分为句子,然后计算每一对句子的语义相似度,通过运用改进型K-Medoids聚类算法将相似的句子归类,在每一类中选出最具代表性的句子,最后将句子组成文档摘要。实验结果表明,通过融合语义信息,该方法提高了摘要的质量。  相似文献   

17.
By means of analysis of artificial intervention in ready-retrieved text, training set used to compare with new texts from large-scale real texts corpus is provided. It is based on the data-originated presentation of training set that a special formula to calculate semantic cohesion between new texts and training set is devised. The semantic cohesion of new text is the average value of semantic evaluation of all elements involved, and semantic evaluation of an element depends on its semantic relevance with the training set and on the semantic ratio of its domain to synonymous domain. In terms of empirical verification a conclusion is drawn that semantic cohesion is the key measurement standard of textual retrieval. Despite the advantages of textual retrieval, limitations of formula-raised condition and analyst's accomplishments make the analysis involved in this paper imperfect.  相似文献   

18.
为了解决基于VSM方法在进行短文本分类时存在的严重数据稀疏问题,提出了基于语义与最大匹配度的短文本分类方法.以《知网》为知识源,设计了基于义原距离、义原深度与区域密度的义原相似度计算方法,实现基于词类的词语相似度计算;提出了基于语义与最大匹配度的方法计算短文本相似度,应用KNN算法进行短文本分类.实验结果表明,该方法与基于语义、基于AD_NB等方法相比,正确率、召回率和F值均得到了明显的提高.  相似文献   

19.
基于语义的自然语言文本数字水印研究   总被引:1,自引:0,他引:1  
杨超  李仁发  蒋斌  雷衍凤 《计算机工程与设计》2005,26(6):1428-1430,1443
数字水印技术是信息隐藏技术研究领域的重要分支,也是当今网络信息安全和数字媒体版权保护研究的重要手段之一。目前数字水印技术的研究主要集中在静止图像和视频的保护等方面,文本数字水印研究较少。针对自然语言文本自身的特性,分析和比较了目前主要的文本数字水印方法及其技术特点,提出了文本数字水印的理论目标和攻击模型,给出了一种基于语义的文本数字水印算法,最后展望了文本数字水印技术研究的发展前景。  相似文献   

20.
基于地理空间本体的语义检索相关度研究   总被引:1,自引:0,他引:1       下载免费PDF全文
以地理信息领域为应用背景,面向地理空间语义检索,基于地球信息科学中的空间拓扑理论,以空间本体为语义检索的概念空间,提出了一种语义相关度的算法。其特点是考虑了传统字面匹配相关度与语义关系相关度两部分的融合,同时引入了本体关系权值的机制控制在不同语义检索应用中本体的关联程度,并体现了其与语义距离的反比关系。通过所作的相关实验,验证了该语义相关度算法在地理空间语义检索应用中可以达到良好的效果,并且也为其他领域应用提供了较好的参考和借鉴价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号