首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 421 毫秒
1.
语义链接构建原则包括链接来源确定、链接对象评价与链接属性选择,而链接类型则分为概念间的词汇型链接与实体间的关系型链接。基于此,图书馆可利用SPARQL查询从目标数据集中选择满足链接要求的术语变量,或通过基于本体映射的相似度计算在概念间构建词汇型链接。另一方面,关系型链接构建可利用SPARQL查询寻找与馆藏存在语义相似性的实体并判断其语义关系,或利用字符串相似度匹配对资源文本特征属性进行精确匹配,从而实现图书馆与外部关联数据集的链接构建与资源共享。  相似文献   

2.
早期针对语义网的自动问答主要是面向单一RDF数据集,随着网络上相互关联数据集的急速增加,迫切需要将自动问答扩展到多个RDF数据集,但同时在语义标注、答案整合方面也带来了更大的难度与挑战。本文提出了一种面向图书馆关联数据的自动问答新方法,通过将自然语言提问转换为结构化的SPARQL查询,从图书馆领域相互关联的五个RDF数据集中提取特定答案。该方法的创新点在于,将问句分为涉及一个数据集的简单句和涉及多个数据集的复杂句分别进行处理,又将简单句分为查询属性和查询实例两种类别分别制定SPARQL查询构建规则,将复杂句分解成若干个简单句进行处理,有利于SPARQL查询的构建和答案的整合。 通过实验测评,100个问句的回答精确率达到91%,表明这是一种行之有效的问答方法,对于促进关联数据在图书馆中的应用具有重要意义。图5。表5。  相似文献   

3.
丁亮  姚长青  何彦青  李辉 《情报工程》2017,3(3):064-076
统计机器翻译往往存在待翻译文本来源多样和领域不一致的问题。为了提升面向不同领域的文本的翻译质量,需要根据待翻译文本对训练语料进行筛选以达到领域自适应的目的。目前统计机器翻译的领域自适应方法以目标数据为基准,着重利用统计技术对训练数据或者翻译模型进行领域的适应调整,缺乏明确的领域标签。本研究在本组之前研究基础上利用深度学习中卷积神经网络 (Convolutional neural network, CNN)对短文本进行建模,构建合适的网络结构进行有监督学习,获取完整的句子语义信息,按照待翻译文本的领域信息对训练语料进行归类筛选,获取与待翻译文本领域一致的训练数据,并将其应用到统计机器翻译中。本文采用万方英文摘要在统计机器翻译系统上进行测试,仅利用部分训练数据就得到了超越原始训练数据BLEU 打分的翻译结果,证明了本研究的有效性和可行性。  相似文献   

4.
王小玉  董诚  曾文 《情报工程》2015,1(6):102-108
本文对科技政策及语义分析方法研究现状的进行了调研,重点对句子相似度匹配算法和段落相似度匹配算法,以及倾向性分析算法等几种语义分析方法进行了对比分析,并总结其各自的适用性和优缺点,为下一步科技政策语义分析模型的构建研究提供研究基础。  相似文献   

5.
重要句群是指最能表达文献主题的若干句子的集合,客观性强、生成效率高,可在利用自动文摘成果的基础上基于重要句群进行检索.在对句子进行预处理、文献语词权重计算以及句子权重计算后生成重要句群.利用基于向量模型的方法以及构建检索式和检索提问分别对基于文摘、重要句群和全文的检索性能进行对比分析.实验结果表明,基于重要句群的检索性能总体优于作者文摘,但是低于全文,可以将重要句群作为后台数据或搜索引擎的摘要等.句子级别的文本处理对提升文本检索效果的作用不大,而把文本处理提升至上下文的语义级别是可能的有效方法.  相似文献   

6.
利用语义角色标注技术对文献进行标注,以句子为最小单位进行文献的语义相似度检测。提取文献中所有词语的上位词,为每篇文献形成句子-词-语义角色-上位词四部图。语义相似的句子对比参照四部图确定,最终计算出两篇文献相似句子的Jaccard系数作为两篇文献的语义相似度。实验结果表明,所识别出的语义相似度较字粒度Jaccard系数法、词粒度Jaccard系数法、Winnowing Jaccard系数法等高出13%,然而受语料库限制,本方法还有很大的提升空间。  相似文献   

7.
[目的 /意义]将海量学术文本观点提取工作由人工转向机器,提高效率的同时又能够保证观点提取的准确性、客观性。[方法 /过程]使用UniLM统一语言预训练模型,训练过程中对模型进行精调,以人工标注数据集进行机器学习。将学术文摘作为长度为a的文本序列,经过机器学习,生成长度为b的句子序列(a≥b),并且作为学术论文观点句输出。[结果 /结论 ]研究结果表明:UniLM模型对于规范型文摘、半规范型文摘、非规范型文摘观点生成精准度分别为94.36%、77.27%、57.43%,规范型文摘生成效果最好。将机器学习模型应用于长文本观点生成,为学术论文观点生成提供一种新方法。不足之处在于本文模型依赖文摘的结构性,对非规范型文摘观点生成效果有所欠缺。  相似文献   

8.
基于单句粒度的微博主题挖掘研究   总被引:1,自引:0,他引:1  
针对现有主题挖掘方法的不足,本文提出一种以句子为粒度的微博主题挖掘方法.首先,以标点符号为依据进行微博文本的句子划分,选择名词和动词为特征词来表征句子;其次,以高频特征词在微博文本集中的共现频次为基础构建词语相似矩阵,辅助计算句子相似度,构建句子相似矩阵;然后,以句子相似矩阵为基础进行聚类分析,通过分析聚类结果实现主题发现;最后,利用改进的LexRank算法计算各主题句子的重要度值,组合重要度值高的句子生成主题摘要,以完成对主题的描述.文章通过实验证明了该方法的可行性.  相似文献   

9.
Study on Construction of Fuzzy Emotion Ontology Based on HowNet   总被引:1,自引:0,他引:1  
构建模糊情感本体是在线评论情感分析的基础.针对在线评论情感表达的多样性和模糊性,将情感本体划分为评价词本体和情感词本体,利用模糊理论和知网相关概念,构建模糊情感本体的基本模型.根据评价词和情感词的各自特点,运用模糊化处理和语义相似度的相关理论,分别对评价词模糊本体和情感词模糊本体的情感类型和隶属度进行了相应处理.并通过与点互信息方法比较,验证了情感本体模型在自动获取情感类方面的有效性,最后进行了相关数据统计.  相似文献   

10.
个性化语义TRIZ构建研究   总被引:2,自引:1,他引:1  
[目的/意义]研究构建个性化语义TRIZ的方法、流程与关键技术.该语义TRIZ可对专利中隐性技术信息进行深度揭示与语义关联.[方法/过程]设计一个开放性语义TRIZ框架.该框架从概念空间、索引空间、应用空间3个维度构建语义TRIZ;从微观层SAO、中观层技术主题、宏观层技术范畴3个层面描述语义TRIZ索引结构.基于该框架,以大口径光学元件专利为例构建领域个性化语义TRIZ.[结果/结论]针对中等规模专利数据集(数千条),本方法能有效地半自动构建领域个性化语义TRIZ,支持专利深度技术挖掘应用.  相似文献   

11.
文本情感摘要技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank 情感摘要方法。通过LDA 模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分组,使用传统多特征融合以及SE-TextRank 情感摘要算法对组内中心句抽取,最终获取目的摘要。实验表明,采用此方法能够更为高效的获取新闻文本摘要结果。  相似文献   

12.
基于OCC模型和LSTM模型的财经微博文本情感分类研究   总被引:1,自引:0,他引:1  
吴鹏  李婷  仝冲  沈思 《情报学报》2020,39(1):81-89
为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore&Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法 (support vector machine,SVM)和基于深度学习的半监督RAE方法 (semi-supervised recursive auto encoder)。  相似文献   

13.
句子情感分析及其关键问题   总被引:2,自引:0,他引:2  
情感分析关注具有情感倾向的评价性信息,具有广泛的应用。情感分析按照粒度的不同分为三种:词汇情感分析、句子情感分析和文档情感分析。文中对句子情感分析及其关键问题进行介绍,首先简要描述句子情感分析的任务,然后介绍句子情感分析中主客观句分类方法及两种主观句情感分类方法--基于情感词的方法和机器学习方法,最后对情感分析中的三个关键问题--词汇上下文极性判定、评价主题识别、意见持有者识别进行总结。  相似文献   

14.
[目的/意义]微博已成为大众情感表达的重要平台,微博的情感分析在舆情分析、用户体验、商机挖掘等方面有着重要的作用。[方法/过程]提出的情感倾向分类算法WE_SDAE使用单词嵌入的方式将微博表示成一个低维稠密向量,然后通过添加正则项和加噪处理的方式将基本的自动编码器算法优化成深层噪音自动编码器,并在顶层添加分类器,实现情感倾向分类。考虑到微博用词灵活,还从单字和词语两个粒度训练模型。[结果/结论]实验结果表明,基于单字粒度的模型表现优于基于词语粒度的模型。此外,对比实验显示WE_SDAE算法优于传统的SVM、Naive-Bayes、XgBoost等相关算法;单词嵌入的方式优于传统的向量空间模型表示方法,能在微博情感分析中取得较好的效果。  相似文献   

15.
As an important application in text mining and social media, sentiment detection has aroused more and more research interests, due to the expanding volume of available online information such as microblogging messages and review comments. Many machine learning methods have been proposed for sentiment detection. As a branch of machine learning, transfer learning is an important technique that tries to transfer knowledge from one domain to another one. When applied to sentiment detection, existing transfer learning methods employ articles with human labeled sentiments from other domains to help the sentiment detection on a target domain. Although most existing transfer learning methods are devoted to handle the data distribution difference between different domains, they only resort to some approximation methods, which may introduce some unnecessary biases. Furthermore, the popular assumption of existing transfer learning techniques on conditional probability is often too strong for practical applications. In this paper, we propose a novel method to model the distribution difference between different domains in sentiment detection by directly modeling the underlying joint distributions for different domains. Some of the important properties of the proposed method, such as the convergence rate and time complexity, are analyzed. The experimental results on the product review dataset and the twitter dataset demonstrate the advantages of the proposed method over the state-of-the-art methods.  相似文献   

16.
[目的/意义]以汽车论坛例,提出一种针对专业社交媒体文本的主题知识元抽取方法。[方法/过程]首先,通过LDA模型提取出汽车论坛中文本的主题,并进行去重,形成主题列表;其次,基于融合主题特征的深度学习模型T-LSTM模型构建适于汽车论坛本文的情感分析模型;然后,通过计算各词汇在图模型TextRank中的重要性与各词汇的Word2Vec主题相似度,抽取情感关键词与关键句,用于对文本主题与情感倾向的解释与补充;最后,对上述方法进行集成,输出结构化的主题知识元。[结果/结论]实验结果中,抽取得到的主题知识元合格率达到69.1%,表明本文提出的主题知识元抽取方法,能够围绕知识主题较为准确地抽取知识元,实现知识的结构化转换。  相似文献   

17.
��[Purpose/significance] By using corpus-based sentiment analysis, opinion word polarity can be predicted in accordance with its context. The method is significant in applications oriented to specific-domains sentiment analysis tasks since it can improve the prediction accuracy.[Method/process] In the paper, context-oriented sentiment polarity identification for emotion expressions was investigated. A Pointwise Mutual Information(PMI) based algorithm was proposed to solve the problem. In terms of PMI, polarity of an emotion expression "feature-opinion" was inferred according to the co-occurrence of the expression with contextual opinion seed words. Furthermore, employing dependence relation analysis to detect sentimental reverse in context; with the modified PMI algorithm, we can predict polarity of emotion expressions in a sentence more accurately.[Result/conclusion] The results indicate, compared with the Lexicon-based method and the classical PMI, the modified method performs better. With it, opinion-words unlisted in lexicons can be identified, and context-specific sentimental orientation of an expression can be detected precisely as well. Modifying the macro F1 value to 0.827 and 0.878 in cater-review corpus and electronic-product review corpus separately. The algorithm, supported by large-scale domain-specific corpus and based on statistics and dependency analysis, is efficient due to convenience for data acquisition, which make it easier be applied in other domain-specific sentimental analysis tasks.  相似文献   

18.
基于修正点互信息的特征级情感词极性自动研判   总被引:1,自引:0,他引:1  
[目的/意义]基于语料的情感词发现依语句上下文推断情感词极性,能显著提升情感分析的准确率,在面向领域的特征级情感分析任务中有重要应用价值。[方法/过程]对特征级情感极性研判问题展开探讨,提出基于点互信息的"特征-情感"对情感极性自动判别算法,算法借助大规模领域语料,根据观点表达"特征-情感"对与情感语义明确的种子词的共现关系,同时引入依存句法分析语句间的情感转折,通过修正经典的点互信息算法,对上下文约束下的用户观点表达进行褒贬预测。[结果/结论]实验证明,修正算法的性能显著优于词典匹配算法和经典的点互信息情感识别算法,不仅能够推断词典中未纳入的观点表达的情感指向,而且能较准确地推断"语境"中的情感词极性。在餐饮评论和数码产品评论两个评测语料集上,修正算法的F1宏平均指标分别达到0.827和0.878。该算法以领域相关的大规模语料为支撑,基于概率统计和句法分析,因数据获取便利,算法效率高,移植性好,具有普适性,尤其适用于面向领域的情感分析任务。  相似文献   

19.
挖掘图书评论不仅有助于用户了解图书内容,还可帮助出版社优化营销策略。图书评论摘要能够大幅提升用户获取信息的效率,用户只需简短阅读摘要即可了解评论的重点内容。如何为用户提供简洁、准确的图书评论摘要具有重要研究意义。目前的评论摘要研究多是采用句子抽取式的方法,忽视了评论中细粒度的情感信息。此外,不同的图书评论平台在评论内容方面存在较大的差异,仅基于单一平台的评论构建摘要,用户难以通过评论摘要全面了解图书。本文提出了一种包含属性信息和内容信息的图书评论摘要模型,并设计了基于细粒度评论挖掘的书评摘要方法。实证结果表明,本文提出的评论自动摘要方法,生成的评论摘要能够提供细粒度、多维度的图书评价信息。  相似文献   

20.
[目的/意义]以用户情感为线索的图像检索已成为机器学习研究的热点,但图像情感特征标注的语料数据多来源于对图像低层特征的抽取,从而导致图像检索过程单一化和程式化。本文提出了一种基于深度学习的图像情感特征抽取的算法,将图像底层特征融合到图像的高层情感语义当中,为实现图像的情感语义检索提供了参考。[方法/过程]利用改进的卷积网络模型,将数据集图像的颜色、纹理作为输入,经多层运算自动提取图像的情感信息,并通过反向传播算法计算出改进后模型的情感检索准确率,构造出准确率较高且过拟合程度低的图像情感特征提取模型。[结果/结论]应用改进的卷积神经网络模型,实现了对图像情感特征的抽取,相较于原模型提升了10%的检索准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号