首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 750 毫秒
1.
面向文本的关键词自动提取一直以来是自然语言处理领域的一个关键基础问题和研究热点.特别是,随着当前对文本数据应用需求的不断增加,使得关键词提取技术进一步得到研究者的广泛关注.尽管近年来关键词提取技术得到长足的发展,但提取结果目前还远未取得令人满意的效果.为了促进关键词提取问题的解决,本文对近年来国内、外学者在该研究领域取得的成果进行了系统总结,具体包括候选关键词生成、特征工程和关键词提取三个主要步骤,并对未来可能的研究方向进行了探讨和展望.不同于围绕提取方法进行总结的综述文献,本文主要围绕着各种方法使用的特征信息归纳总结现有成果,这种从特征驱动的视角考察现有研究成果的方式有助于综合利用现有特征或提出新特征,进而提出更有效的关键词提取方法.  相似文献   

2.
社会媒体作为人们传播信息和表达观点的重要渠道,包含大量丰富的有用信息,近年来已成为大数据最具代表性的数据来源之一,挖掘与分析这些信息对社会发展影响深远。按照社交媒体的构成要素将目前研究划分为3类,即从基于用户的分析、基于关系的分析和基于交互内容的分析三方面进行总结分析。首先,从多源异构网络中识别用户身份,发现社群并计算用户影响力来分析基于用户的数据;其次,从用户关系强度计算、信息传播和影响力最大化3个角度探讨了基于交互关系为中心的数据分析;然后,基于用户交互内容探讨了特征提取与选择、话题事件挖掘、多媒体数据分析以及情感分析4个问题。最后,从信息传播、影响力计算、特征提取与选择、微博新闻挖掘、社会媒体大数据融合和跨语言情感分析6个方面指出了现有研究的挑战性和未来研究的新视角。  相似文献   

3.
社会网络节点影响力分析研究   总被引:2,自引:1,他引:1  
社会网络节点影响力研究是社会网络分析的关键问题之一.过去的十多年间,随着在线社会网络的快速发展,研究人员有机会在大量现实社会网络上对影响力进行分析和建模,并取得了丰硕的研究成果和广泛的应用价值.本文分析和总结了近年来社会网络影响力分析的主要成果.首先介绍了节点影响力的相关定义、作用范围以及表现形式;接着重点分类介绍节点影响力的度量方法,从网络拓扑、用户行为和内容分析3类方法总结了影响力的建模和度量方法;然后总结了影响力的传播和最大化模型相关成果;最后介绍了影响力的评价指标和应用.根据对现有方法的系统总结,对社会网络影响力的未来研究提出了一些值得关注的方向.  相似文献   

4.
社会网络新媒体在日常沟通、商业运作、政治斗争以及外交等方面发挥越来越重要的作用,对社会网络的研究也引发了广泛关注。文章通过对最近几年国际重要期刊和会议上社会网络方面发表的文章进行统计分析,发现了社会网络近三年的研究热点,即主要集中在社会网络的信息传播以及安全问题的研究。信息传播方面包括对信息传播模型、影响因素、影响力最大化和预测感知的研究;安全问题方面包括对用户安全和信息安全的研究,用户安全研究中包括僵尸用户识别和级联失效研究,信息安全研究包括源头追溯和网络控制问题研究。文章对上述各方面的最新成果进行了分析、概括和讨论,分析了面临的问题、挑战和机遇,探索了新的研究点和未来的发展方向,为广大研究者提供一些参考和借鉴。  相似文献   

5.
在CDR数据的基础上,研究提升用户感知的方法 ,解决网络KPI无法反映用户对网络真实感知的问题,提出了基于用户感知的网络质量评估诊断方法,该方法通过多数据源,结合用户在网络中的行为特征,建立数据分析模型,通过用户的切身感受发现网络问题,为优化提供理论指导。  相似文献   

6.
社交网络用户影响力在舆情演化、广告营销及政治选举等领域有着广泛应用,研究者在过去的工作中,通过分析和建模,在影响力方面取得了一定的成果,但还存在着定义不明晰、技术落后和应用缺乏等问题。文中明确提出了社交网络用户影响力的研究模型,将传统技术与先进技术结合,并据此梳理了该领域的相关文献,主要从用户、内容特征和深度学习技术的角度论述了基于社交网络的用户影响力的研究方法,并进一步划分成本质和邻域属性、情感分析和元数据、面向局部网络和基于用户及内容特征,还介绍了节点识别的方法,为该领域的学者提供有效且全面的参考。其次,文中还介绍了用户影响力建模方法在预测应用方面的数据集、评价指标和实验结果等,旨在预测下一个激活节点。最后对其未来的发展趋势作出展望。  相似文献   

7.
刘磊 《计算机应用与软件》2021,38(12):193-200,206
通过集成学习方法,探索影响英语学习者作文质量的语言特征,提高现有作文自动评分系统的准确率.基于剑桥FCE考试数据集,使用支持向量回归和随机森林算法筛选特征,构建并评测自动评分模型.与现有方法对比实验的结果表明,基于集成学习的评分模型准确率有所提升.该方法可以有效评估英语学习者的作文质量,有助于开发面向大规模机考和网络自主学习平台的作文自动评阅系统.  相似文献   

8.
Facebook、Twitter、人人网和新浪微博等社交网站逐渐成为互联网上用户数量最多、最受欢迎的网站.近年来,国内外已有大量研究工作深入考察在线社会网络的拓扑结构和用户行为,这对理解人类的社会行为、改进现有的网站系统和设计新的在线社会网络应用具有重要意义.文中从测量角度对在线社会网络的拓扑结构、用户行为和网络演化等方面进行了综述,总结了常见的测量方法和典型的网络拓扑参数,着重介绍了用户行为特征、用户行为对网络拓扑的影响以及网络的演化.可以看出,随着研究的深入,在线社会网络的新特征逐渐被大家认识和理解,包括好友少的用户的交流范围集中在小部分好友,而好友多的用户联系的好友更均匀;用户之间的交互减小了在线社会网络的聚类系数,使网络结构更松散;边的生成受优先连接和临近偏倚的共同影响;小社团倾向于和大社团合并,大社团倾向于分裂为两个规模相当的小社团等.  相似文献   

9.
由于当前已有系统未能采用关联规则对心理健康数据进行挖掘和分析,导致心理问题检出率偏低,评估用时较长,因此设计一种基于关联规则挖掘的心理健康状况自动评估系统。采用关联规则挖掘算法对心理健康数据进行分析和挖掘,分析心理问题和对应属性之间的关联,以此为依据通过B/S结构对系统中数据采集以及预处理等模块的结构进行设计。针对心理健康的实际情况,使用模糊综合评估方法对用户的心理健康情况进行自动评估。仿真实验结果表明,所设计系统能够快速完成心理健康状况自动评估,同时提升心理问题检出率。  相似文献   

10.
跨社交网络用户匹配技术可以融合多平台用户数据,从而实现更多元的应用,现有基于签到的社交网络用户匹配研究,忽略了多源社交网络签到数据的失衡性,导致算法在真实数据集下匹配精度下降的问题。针对此问题,提出一种基于用户签到的跨社交网络用户匹配方法。通过网格聚类算法对用户签到数据进行粗粒度化和过滤,选择出潜在相关性强的签到数据;从这些签到数据中提取时空特征,计算出不同属性相似度;通过优化多属性相似度的权重分配,综合计算用户匹配分。在多组数据集上的实验结果表明,所提出方法在签到数据失衡情况下的有效性。  相似文献   

11.
网络空间认知域安全是网络空间安全的重中之重,而认知域特征预测是研究网络空间认知域安全的基础。首先,明确了社交网络用户个体认知域特征预测在网络空间认知域安全中的地位;接着,从预测流程、特征选取和模型建立3个方面综述了国内外在社交网络用户认知域特征预测方面的研究,并针对国内典型社交网络用户样本特征,指出了研究中存在的问题,进而提出一些可能的研究思路和方法;最后,总结了该领域当前面临的挑战与存在的不足,以及有待重点研究的相关问题。  相似文献   

12.
随着信息技术的快速发展,信息网络无处不在,例如社交网络、学术网络、万维网等.由于网络规模不断扩大以及数据的稀疏性,信息网络的分析方法面临巨大挑战.作为应对网络规模及数据稀疏挑战的有效方法,信息网络表征学习旨在利用网络的拓扑结构、节点内容等信息将节点嵌入到低维的向量空间中,同时保留原始网络固有的结构特征和内容特征,从而使...  相似文献   

13.
The landscape of mental health has undergone tremendous changes within the last two decades, but the research on mental health is still at the initial stage with substantial knowledge gaps and the lack of precise diagnosis. Nowadays, big data and artificial intelligence offer new opportunities for the screening and prediction of mental problems. In this review paper, we outline the vision of digital phenotyping of mental health (DPMH) by fusing the enriched data from ubiquitous sensors, social media and healthcare systems, and present a broad overview of DPMH from sensing and computing perspectives. We first conduct a systematical literature review and propose the research framework, which highlights the key aspects related with mental health, and discuss the challenges elicited by the enriched data for digital phenotyping. Next, five key research strands including affect recognition, cognitive analytics, behavioral anomaly detection, social analytics, and biomarker analytics are unfolded in the psychiatric context. Finally, we discuss various open issues and the corresponding solutions to underpin the digital phenotyping of mental health.  相似文献   

14.
The analysis of ocean and atmospheric datasets offers a unique set of challenges to scientists working in different application areas. These challenges include dealing with extremely large volumes of multidimensional data, supporting interactive visual analysis, ensembles exploration and visualization, exploring model sensitivities to inputs, mesoscale ocean features analysis, predictive analytics, heterogeneity and complexity of observational data, representing uncertainty, and many more. Researchers across disciplines collaborate to address such challenges, which led to significant research and development advances in ocean and atmospheric sciences, and also in several relevant areas such as visualization and visual analytics, big data analytics, machine learning and statistics. In this report, we perform an extensive survey of research advances in the visual analysis of ocean and atmospheric datasets. First, we survey the task requirements by conducting interviews with researchers, domain experts, and end users working with these datasets on a spectrum of analytics problems in the domain of ocean and atmospheric sciences. We then discuss existing models and frameworks related to data analysis, sense‐making, and knowledge discovery for visual analytics applications. We categorize the techniques, systems, and tools presented in the literature based on the taxonomies of task requirements, interaction methods, visualization techniques, machine learning and statistical methods, evaluation methods, data types, data dimensions and size, spatial scale and application areas. We then evaluate the task requirements identified based on our interviews with domain experts in the context of categorized research based on our taxonomies, and existing models and frameworks of visual analytics to determine the extent to which they fulfill these task requirements, and identify the gaps in current research. In the last part of this report, we summarize the trends, challenges, and opportunities for future research in this area. (see http://www.acm.org/about/class/class/2012 )  相似文献   

15.
在推荐系统领域中,图卷积网络具有对于图结构数据更强的信息抽取能力。然而,现有的图卷积网络推荐算法主要关注改进模型结构,忽视了提高原始样本采样质量与挖掘用户—项目间隐式关系的重要性。针对上述问题,提出一种基于混合采样的图对比学习推荐算法。首先使用混合采样方法,提取出正样本中部分信息并将其注入负样本,从而生成全新的富含信息的难负样本;其次,通过轻量图卷积网络对难负样本进行特征提取,得到用户和项目的节点表征,采用邻域对比学习方法挖掘样本隐式关系;最后,利用多任务策略对推荐监督任务和对比学习任务进行联合优化。在真实数据集Yelp2018和Amazon-book上进行实验,采用recall和NDCG指标进行评估,实验结果表明,提出的模型相较其他基准模型取得了更好的效果。  相似文献   

16.
The research presented in this paper compares user-generated and automatic graph layouts. Following the methods suggested by van Ham et al. (2008), a group of users generated graph layouts using both multi-touch interaction on a tabletop display and mouse interaction on a desktop computer. Users were asked to optimize their layout for aesthetics and analytical tasks with a social network. We discuss characteristics of the user-generated layouts and interaction methods employed by users in this process. We then report on a web-based study to compare these layouts with the output of popular automatic layout algorithms. Our results demonstrate that the best of the user-generated layouts performed as well as or better than the physics-based layout. Orthogonal and circular automatic layouts were found to be considerably less effective than either the physics-based layout or the best of the user-generated layouts. We highlight several attributes of the various layouts that led to high accuracy and improved task completion time, as well as aspects in which traditional automatic layout methods were unsuccessful for our tasks.  相似文献   

17.
基于小样本学习的图像分类技术综述   总被引:2,自引:0,他引:2  
图像分类的应用场景非常广泛,很多场景下难以收集到足够多的数据来训练模型,利用小样本学习进行图像分类可解决训练数据量小的问题.本文对近年来的小样本图像分类算法进行了详细综述,根据不同的建模方式,将现有算法分为卷积神经网络模型和图神经网络模型两大类,其中基于卷积神经网络模型的算法包括四种学习范式:迁移学习、元学习、对偶学习...  相似文献   

18.
网络故障管理旨在检测、识别和纠正网络中发生的错误状况,为用户获得可靠稳定的网络服务提供保障,近年来,如何利用机器学习方法进行蜂窝网络故障管理引起了广泛关注。首先介绍了蜂窝网络故障管理的研究背景,明确网络故障管理的流程和功能;接着介绍现有蜂窝网络故障管理框架;随后对现有机器学习在蜂窝网络故障管理中的方法研究进行评述,从故障管理周期入手,分别对实现故障检测、故障诊断以及故障预测的机器学习方法展开介绍、总结和对比分析,为相关领域的研究提供参考。  相似文献   

19.
针对电力监控系统面临的网络安全问题实际需求, 开展了本体自动构建技术研究, 以现有的领域本体自动化构建技术为基础, 从非结构化文本数据提取出电网安全监测领域本体SafeAgent, 采用机器学习、自然语言处理、关联规则等方法抽取本体概念, 挖掘概念之间的关系, 完善了领域本体自动化构建方案. 经实验验证, 本文采用的方法能以较高准确率完成领域本体的自动化构建工作, 克服对人工以及专家知识的依赖.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号