首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
针对通过微博文本获取用户情感倾向,以提高舆情监控效率的问题。利用深度学习的方法实现微博语料的情感分类,构建符合近年文本长度分布特点的高质量微博情感分类数据集,分析微博文本长度对情感分类的影响。由于中长语料主观性强、句子关联度弱,其检测准确率偏低。针对此问题,本文提出一种基于胶囊网络的中长微博情感分析模型。采用注意力机制,在融合局部特征与全局特征的基础上,利用胶囊向量实现深层情感特征提取,提高中长语料的检测效果。利用本文搜集的数据集进行实验,结果表明,相较于多种深度学习算法,本文模型性能更佳。在不同文本长度语料的对比实验中,伴随着文本长度的增加,分类准确率逐渐降低。相较于传统的LSTM算法,本文模型随文本长度增加效果提升,证明了该模型针对中长微博文本情感分类的可行性。   相似文献   

2.
左荣欣 《电子世界》2014,(17):192-193
目前主观信息情感分类常用的方法主要有基于知识工程和基于统计两类,其中基于统计的机器学习方法在效率上优于基于知识的方法,但单一的机器学习算法有各自的优缺点,难以胜任复杂的分类任务。本文将微博情感判别任务分层,在不同层次选择合适的机器学习算法,提出了一种多算法集成的微博细粒度情感分类方法。首先采用朴素贝叶斯(NB)分类器对微博进行有无情绪分类,然后采用AdaBoost集成算法对KNN进行集成训练出多个分类器,对有情绪微博基于训练出的多个分类器通过线性组合模型进行情感判别。实验结果表明,在文本分类任务中合理集成不同机器学习算法,较单一机器学习算法和基于情感词典的方法能够提高分类性能。  相似文献   

3.
刘洺辛  陈晶  王麒媛 《电信科学》2018,34(10):85-95
提出了结合情感词典的改进信息增益特征选择方法。首先,针对现有的信息增益特征选择存在注重特征词的文档频率而忽视语料均衡等问题,提出了改进方法。其次,考虑情感词对文本分类的影响,提出了基于情感词典的特征选择(information gain combining sentiment classification,IGSC)算法进行文本分类。该算法通过对文本情感词进行匹配并结合情感词赋权重,实现了特征降维并解决了文本数据稀疏影响分类性能的问题;最后,针对旅游评论数据集对所提出的特征选择方法进行了实验验证及分析。实验结果表明,本文提出的改进文本情感分类特征选择方法在分类准确率、召回率和F值方面均得到了提升,并且具有较好的分类稳定性。  相似文献   

4.
为了提升微博话题发现效率以及发现质量问题,提出了一种融入公众情感投入分析的微博话题快速发现与细分方法,促使话题演化,进而产生新话题及其情感变化趋势.首先,基于情感词典和TFDF值在历史语料库中挖掘常用情感词并构建情感词库;其次,快速抽取情感文本,结合Sigmoid函数检测情感投入密集期,保证话题事件挖掘的质量;最后,通过改进的模糊C-均值聚类算法在新的微博数据中发现高质量话题.实验结果表明,本文方法能够有效提升移动环境下的话题发现效率及质量.  相似文献   

5.
词语是文本中的情感表达的最小单位,而词语语义的情感倾向性分析是文本情感分类的基础.利用中文情感词构建出一个基础情感词典来判断未知情感词的情感极性.本文即是在HOWNET情感词语集的基础上,利用义原相似度算法,构建了中文基础情感词典,并提出以信息融合方法,将此词典与同济大学的褒贬词典进行整合,建立了特定情感词与特定情感标注以及相应的情感权值的映射关系,实验结果表明,该方法取得不错的分类效果.  相似文献   

6.
文本情感分析的基础是词典,除此以外还需要对词典进行分类和定级。本文通过筛选整合现有词典,构建了一部包括基础词,领域词,网络词等的词典,并对词典中有关词语的权重分配和一些包含程度副词的短语计算进行了研究,提出了一种基于词典的文本情感分析算法。经过实验,发现本文构建的词典在处理情感时效果很好。  相似文献   

7.
《信息技术》2015,(9):215-218
随着用户发表微博数量的急剧增长,数据集已经达到TB级甚至PB级。针对在单机环境下无法很好地完成海量微博数据集的情感分类任务,文中提出一种基于Hadoop云平台的中文微博情感分类方案。结合微博文本特有的语言特征,依次在MapReduce框架上实现了预处理、特征选择、文本向量化表示、KNN分类算法的并行化。通过对比单机和集群的实验结果表明:Hadoop云平台下的情感分类效率能随着集群规模的扩增而快速提升,并且不影响其分类效果。  相似文献   

8.
随着在线评论和推荐系统可用性的不断增加,情感分析逐渐成为学术研究中的一个重要的任务,近年来得到了许多研究人员的关注。传统的解决文本情感分析问题的方法主要是基于情感词典或浅层学习,利用回归、分类等方案实现特征的提取及分类。但由于评论语料内容简短,特征稀疏,含有大量未登录词使得上述这些方法存在数据稀疏问题,且忽略了词的语序问题。以这类方法为起点,本文采用深度学习的方法对评论文本进行情感分析,通过组合实验对比,找到可以深度理解人类情感表达的模型。  相似文献   

9.
《现代电子技术》2019,(7):177-180
为研究聚类算法在高校学生微博的应用情况,针对K-means算法和分层聚类算法在聚类中心选择不精确的问题,基于高校学生使用微博的背景,对微博文本挖掘应用中聚类算法的应用进行改进。通过文本的矢量表示、文本相似度计算和聚类算法的实现,验证了聚类算法在微博热门话题检测的准确性和效率,并针对实验数据提出几点针对性的措施。  相似文献   

10.
为了分析中文微博中海量的情感信息,文中提出了一种中文微博情感分析策略,能够有效分析出微博中的情感倾向。为了能准确分析出某领域微博情感倾向,本文构建了领域情感词典,具有自动识别、扩展等功能,减少了人工标注的繁琐。同时考虑到上下文中情感副词等影响,构建了情感副词词典,更加全面的分析情感倾向。最后通过实验表明本文提出的基于领域情感词典的分析策略有一定的可行性和准确率。  相似文献   

11.
基于词典和句长及位置的双语对齐方法的改进   总被引:1,自引:1,他引:0  
基于词典和句子的长度和位置信息的双语句子对齐方法在解决真实双语文本对齐问题时具有一定的普适性。在分析该方法的基础上,提出了在解决某一指定领域内的维汉互译文本时,对基于长度和位置信息的双语句子对齐方法的改进,在此方法引入维语与汉语句子长度比的期望值,能够使数据更平滑,更有效地解决了维汉互译文本句子对齐的问题。  相似文献   

12.
阐述了就制定双语课程教学计划、分析双语教学的难点以及如何提高双语教学课质量等方面进行了研究,取得了一定的教学成果。研究表明:制定与编写适合学生实际情况的教学计划和教材,是开好工科双语教学课程的一个重要环节;在教学中,用英文授课和必要的英文板书,有利于帮助学生扩大专业词汇量、理解专业文献语句特点和结构,以提高学生学习双语课的有效性。  相似文献   

13.
针对我国高校双语教学的现状,结合我校"单片机原理及应用"双语教学示范课程建设实际,我院从单片机双语教学课程的教材建设、教学模式选择、教学中英语使用程度的把握、网络信息技术手段在双语教学中的应用以及成绩考核等方面对该类双语课程建设进行了研究与实践。这种探索对此类课程的双语教学建设与发展起到了积极作用,为探索符合我国实际情况的双语教学之路提供了实践例证。  相似文献   

14.
A web-based translation method for Chinese organization name is proposed. After analyzing the structure of Chinese organization name, the methods of bilingual query formulation and maximum entropy based translation re-ranking are suggested to retrieve the English translation from the web via public search engine. The experiments on Chinese university names demonstrate the validness of this approach.  相似文献   

15.
This letter introduces a new method to automatically acquire paraphrases using bilingual corpora. It utilizes the bilingual dependency relations obtained by projecting a monolingual dependency parse onto the other language's sentence based on statistical alignment techniques. Since the proposed paraphrasing method can clearly disambiguate the sense of the original phrases using the bilingual context of dependency relations, it would be possible to obtain interchangeable paraphrases under a given context. Through experiments with parallel corpora of Korean and English language pairs, we demonstrate that our method effectively extracts paraphrases with high precision, achieving success rates of 94.3% and 84.6% respectively, for Korean and English.  相似文献   

16.
"数字信号处理"双语教学模式初探   总被引:4,自引:0,他引:4  
在分析“数字信号处理”课程特点、要求和授课峰生具体情况的基础上,有针对性地探讨了实施“数字信号处理”双语教学的思路和原则,设计了双语教学的具体模式及内容。在实践过程中,重点考虑了教材和参考书的选择和利用、教学内容的取舍和安排、课堂教学和教辅措施这四个方面。最后,通过对学生评价进行分析,说明该教学模式符合实际、效果较好,并在总结经验的基础上,提出了改进教学效果的思路。  相似文献   

17.
研究型教学是培养学生创造能力和创新精神的一种教学方式,双语教学能够将国外的教学方法和教学理念带给中国高校。本文结合"移动通信研究型专题"教学的实践,提出了研究型双语教学的思路与建议。  相似文献   

18.
为解决汉韩双语平行语料库资源匮乏以及传统句对齐算法面向跨语系语言准确率较低的问题,提出了融合特征的汉韩双语句对齐方法。首先将Bi-LSTM融入孪生神经网络构建句对齐模型,用以分别提取汉语和韩语句子的特征并进行对齐。之后基于语料的特点提取句对齐特征融入输入层。通过与传统Bi-LSTM和不同特征组合的孪生Bi-LSTM的对比实验证明,融入特征的孪生Bi-LSTM方法在句对齐任务中具有更优越的性能。  相似文献   

19.
中文分词结果对中英命名实体识别及对齐有着直接的影响,本文提出了一种命名实体识别及对齐中的中文分词优化方法.该方法利用实体词汇的对齐信息,首先修正命名实体识别结果,然后根据实体对齐结果调整分词粒度、修正错误分词.分词优化后的结果使得双语命名实体尽可能多地实现一一对应,进而提高中英命名实体翻译抽取和统计机器翻译的效果.实验结果表明了本文优化方法的有效性.  相似文献   

20.
双语教学考核方法的研究   总被引:8,自引:0,他引:8  
考试不仅是教育的评价手段,它还指导着教学.建立一套科学的双语教学考核方法不仅有利于评价双语教学的效果,同时对推广双语教学工作有着重要的意义.本文在分析了传统考核方式局限性的基础上,提出了双语教学的考核建议,并结合"数字信号处理"双语教学的实践,介绍了该门课程的考核方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号