首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 164 毫秒
1.
为实现产品意见挖掘中的隐式产品属性抽取,在传统主题建模思想的基础上,通过分析评论信息中不同产品属性对应的意见词分布以及意见词的主题依赖性假设,提出一种基于正则化思想的新主题建模框架.在该框架下,评论信息中的意见词特征,通过定义在不同评论中意见词的使用相似度上的正则化因子,纳入到传统的主题建模框架中.正则化的基本思想为:若2条评论在意见词的使用模式上相似,则它们评论相同的产品属性的概率越高.定性和定量2种实验结果均表明,本文的正则化主题模型较传统的主题模型算法有更高的准确率,说明本文的正则化思想是有效的.  相似文献   

2.
属性抽取主要基于单元素属性抽取,而多元素属性抽取的研究较少.针对多元素组成属性情况进行研究,提出一种基于查询接口DOM结构的属性抽取方法,该方法将查询接口解析成DOM,基于DOM节点提取查询接口上对应的表单元素,对从查询接口上提取获得的元素集合进行二次聚类,挖掘元素之间的组合关系,最终将元素组合形成属性.这种方法能很好地抽取接口上的单元素属性和多元素属性,实验结果表明了方法的有效性.  相似文献   

3.
采用条件随机场(CRFs)算法,以商品属性为中心,挖掘出消费者对商品的情感观点以及观点态度的强弱。通过对商品评论进行标注学习,实现了商品属性和相应的评价词的自动抽取,从而识别出评论文本中的关键信息。研究中抽取的三个维度的关键信息包括商品特征属性,与之相关的评论情感观点,以及情感程度的强弱。仿真实验表明,借助词本身和词性特征,以及上下词的位置关系特征,CRFs算法对商品评论信息抽取有着较高的查准率和召回率。  相似文献   

4.
基于优势关系粗糙集的空袭兵器判别知识获取   总被引:2,自引:0,他引:2  
提出了一种基于优势关系粗糙集的方法来抽取空袭兵器识别的主要冈素与主要类型之间规则.所提出的优势关系粗糙集方法综合考虑了序值属性和常规属性,具有更为广泛的应用前景.利用实例说明了所提出方法的有效性.  相似文献   

5.
为了明确大气污染物、污染源、影响因素、评价指标、危害等之间的关系,分析大气污染传播路径,建立了一个较为清晰、完善的大气污染领域本体.首先,基于机器学习和自然语言处理等技术,提出一种基于注意力机制的序列标注联合抽取实体关系的方法,在双向长短时记忆(long short-term memory,LSTM)网络模型中加入注意力机制,并将实体和关系联合标注,从而进行实体关系抽取.其次,结合词频-逆文档频率(term frequency-inverse document frequency,TF-IDF)核心概念挖掘方法进行知识抽取,并将概念、属性、关系和实例组织起来,从而实现大气污染本体模型的半自动构建.最后,在本体和实例的基础上通过Protégé的SPARQL Query模块和HermiT推理机分别进行条件推理和可视化推理.结果表明,基于注意力机制的序列标注实体关系联合抽取方法所构建的大气污染领域本体包含核心实体68个,实例数360个,相较于现有的本领域本体,在全面性、有效性、准确性和可重用性方面都有较好表现,同时推理出了Ca2+和K+等污染离子的传播路径.因此,基于注意力机制的序列标注联合抽取实体关系的方法能够有效地半自动构建大气污染领域本体,推理出清晰的大气污染传播路径.  相似文献   

6.
VANETs信任传播建模   总被引:1,自引:0,他引:1  
提出了一种用于车载自组网(VANETs)的可靠信任传播模型,该模型通过引入属性相似度概念在陌生节点间建立信任关系,并进一步建立了一种新的动态包转发规则,从而实现了车载自组网的可信路由, 并给出了一种计算属性相似度的推荐方法. 仿真结果表明,所提出的信任传播模型具有较高的准确性.  相似文献   

7.
词的重要性评价是关键词抽取研究中比较重要的环节,其中一种比较常用的方法是对词的相关属性进行加权分析,并根据综合权值确定重要性程度.词所处的位置、词频、词性以及与线索词的同现信息等都是影响关键词抽取的重要因素.本文首先对可能影响关键词抽取的因素进行了探讨和分析,而后利用遗传算法对各个知识源参数进行了优化.在人工标注的语料上进行的测试结果验证了该方法的可行性.  相似文献   

8.
提出了一种用于车载自组网(VANETs)的可靠信任传播模型,该模型通过引入属性相似度概念在陌生节点间建立信任关系,并进一步建立了一种新的动态包转发规则,从而实现了车载自组网的可信路由, 并给出了一种计算属性相似度的推荐方法. 仿真结果表明,所提出的信任传播模型具有较高的准确性.  相似文献   

9.
事件抽取是构建知识图谱的关键前置任务之一,而事件论元抽取是事件抽取的子任务,对事件抽取质量有显著影响.针对现有的流水线式事件抽取方法在论元抽取时忽略了触发词和论元间、论元和论元间相互关系导致抽取质量低的问题,该文提出了一种基于双向门控循环神经网络(Bi-GRU)的事件论元抽取方法.该方法融合Bert词向量、词性特征、词...  相似文献   

10.
为获取连续属性值数据集的最小属性子集,提出了一种两步约简方法.该方法以模糊粗糙集模型为基础,将描述条件属性和决策属性依赖关系的模糊依赖度概念进行了扩展,使其能对条件属性之间的依赖关系进行度量,利用属性与类别之间的依赖度选出候选属性集,然后根据单个属性与类别和属性之间的依赖度对候选属性集进行约简.仿真结果表明,该方法在有效降低属性维数的同时一定程度上保证了分类正确率.  相似文献   

11.
近年来,中文产品评论的特征情感分类是Web数据挖掘的重要研究内容之一.提出了一套完整的产品命名实体、特征词、情感词以及边界的标注规则,设计了多层次的混合标签模式;提出了双层HHMM(层级隐马尔科夫模型)结构,将词形标注和词性标注的特点进行融合;提出了基于词形标注的HHMM-1算法和基于词性标注的HHMM-2算法,实现复杂短语的自动标注.实验证明,双层HHMM模型起到了互补的作用,模型的查全率和F-score值均有较大提高.  相似文献   

12.
A unified feature definition is proposed.Feature is form-concentrated,and can be used to model product func- tionalities,assembly relations,and part geometries.The feature model is given and a feature classification is introduced including functional,assembly,structural,and manufacturing features.A prototype modeling system is developed in Pro/ENGINEER that can define the assembly and user-defined form features.  相似文献   

13.
A unified feature definition is proposed. Feature is form-concentrated, and can be used to model product functionalities, assembly relations, and part geometries. The feature model is given and a feature classification is introduced including functional, assembly, structural, and manufacturing features. A prototype modeling system is developed in Pro/ENGINEER that can define the assembly and user-defined form features.  相似文献   

14.
产品评论的情感倾向性分析是一个很有研究价值的领域,可以帮助客户、商家进行决策。针对产品评论中的属性词和情感词在文本中的各种关系,制定了8组特征选择规则,利用SVM算法训练模型来判断属性词和情感词的搭配识别,进而依据情感词及否定词等分析属性特征的情感倾向。实验结果表明:提出的基于S V M的搭配识别方法,在识别属性特征与情感词的搭配方面具有不错的分类效果。  相似文献   

15.
针对中文微博中的海量文本,提出了利用领域观点词词典和支持向量机的方法对中文微博中的观点句进行识别.构建领域观点词词典,统计了表示中文微博观点句的5个特征,选取特征1,2,3,4进行观点句识别,并将基于支持向量机的3种不同特征组合识别算法与基于领域观点词词典的识别算法进行对比.算法对比结果表明,基于支持向量机的算法对微博观点句的识别效果较好,准确率68.75%,召回率48.71%,F值57.02%.  相似文献   

16.
为有效提高视频内容管理的准确性和高效性,本文借鉴生物信息学的方法,提出了一种降维改进的SURF算法和K-means算法相结合的视频DNA提取算法。该算法通过提取关键帧的SURF特征得到特征点集合,并对其进行K-means聚类构建视觉词袋模型,并将SURF特征通过视觉词袋模型量化为视觉词汇,并最终编码生成视频DNA。实验结果表明,采用改进的SURF算法生成的视频DNA具有良好的准确性和鲁棒性,并能在时间开销方面得到一定的提高。  相似文献   

17.
提出了一种高效获取词包模型中视觉字典容量的方法,并研究了该方法与隐狄利克雷分配模型(Latent Dirichlet Allocation,LDA )相结合情况下的场景分类性能.在用SIFT特征构建场景图像数据集特征矩阵的基础上,首先采用吸引子传播方法获取场景图像集特征矩阵的合理聚类数目族,并将其中的最小聚类数目作为视觉字典容量,进而生成视觉字典;然后利用所构建视觉字典中的单词描述场景图像训练集和测试集;最后采用LDA模型对场景图像测试集进行场景分类实验.实验结果表明,提出的方法不仅保持了较高场景分类准确率,同时显著提高了场景分类的效率.  相似文献   

18.
针对现有相同产品特征识别方法受限于词典覆盖率或语料规模的不足,提出一种基于多维相似度和情感词扩充的识别方法。通过双向长短时记忆条件随机场(bi-directional long short-term memory and conditional random field, Bi-LSTM-CRF)模型抽取产品特征的扩充情感词,综合特征词的语素相似度、同义词林相似度和TF-IDF(term frequency-inverse document frequency)余弦相似度,采用K-medoids聚类算法,识别相同的产品特征。试验结果表明,在手机和笔记本数据集上,该方法的最大调整兰德指数分别达到0.579和0.595 9,而最小熵值分别达到0.782 6和0.745 7,均优于结合语素的调整Jaccard相似度、Word2Vec相似度和基于二分K-means的Word2Vec相似度三种基线试验方法。  相似文献   

19.
为了解决传统的深度学习模型会忽略语料库中全局词共现信息所包含的非连续和长距离语义的问题。本文提出记忆图卷积神经网络(MGCNN)引入注意力机制的商品评论情感分析方法。首先提取词与词、词与文档之间的关系,以全部的词和文档作为节点,将整个数据集构造成一个异构文本图。再基于图卷积网络(GCN)来构建用于图结构数据的神经网络,利用长短期记忆网络(LSTM)提取上下文相关特征,并使用注意力层获取重要特征。多组对比实验结果表明,本方法的分类效果更好,且随着训练集数据所占比例的降低,其优势更加显著。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号