首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
近年来互联网在全球化的大背景下飞速发展,针对跨语言的网络数据挖掘成为国内外舆情分析的热点问题,有效实时地检测中英文网络环境下的热点话题对舆情的掌握和舆情的发展有着至关重要的作用。网络新闻作为网络信息舆情中的重要组成部分,由于互联网的大规模普及而成为人们方便快捷获知信息的重要来源。首先,本文选择中文与英文的网络新闻作为数据源进行采集,提出了在LDA模型上改进的ICE-LDA模型进行跨英汉语言网络环境下的共现话题发现。采用话题向量化的方式,对建模产生的话题进行JS距离检测和话题文本分布相似度度量。其次,本文分别对爬虫采集到的中英混合新闻数据分别构建可对比平行语料集和非可对比语料集进行话题建模,在建模过程中利用TF-IDF算法对文档提取特征词去噪,提高话题特征表示去除无意义噪音词。最后,分别采用两种不同的话题向量化方式进行跨语言的共现话题发现建模。实验结果表明,在本文设计的爬虫采集构建的真实数据集上,改进后的话题模型不仅能够在不需要先验话题对的情况下对可对比语料集进行跨语言共现话题进行发现,而且能够对语料不平衡的情况进行共现话题发现。  相似文献   

2.
随着Web服务数量的急剧增多,如何从众多的Web服务中发现最佳的服务,已成为当今Web服务的研究热点之一.目前主流的Web服务技术仅提供服务的基本描述和基于框架的发现机制,缺乏对语义推理的支持.该文在基于统一描述、发现和集成服务发现架构的基础上,结合本体技术与Web服务本体描述语言设计一个Web服务发现模型,提出了一种基于本体的Web服务发现匹配算法,从而增强了统一描述、发现和集成的语义Web服务发现能力.  相似文献   

3.
制造网格中基于语义的服务发现技术及应用   总被引:1,自引:0,他引:1  
针对如何从制造网格中快速、准确地找到用户需要的服务,结合网格、语义Web及本体的相关理论和技术,设计了制造网格中基于语义的服务发现系统模型,探讨了制造资源本体的构建方法,提出采用基于语义模板的制造网格服务描述方法,研究了基于语义的服务匹配算法,结合应用实例验证了模型和算法的可行性.  相似文献   

4.
本体理论与信息编码技术的结合在制造企业领域内的应用,是解决制造企业信息集成的探索性方法.文章深入研究了基于信息编码本体化模型的本体映射方法,分析了映射执行机理,设计了语义相似度的计算方法和流程.①分析了信息编码本体化模型的特点及其失配类型,设计了映射模型的总体框架;②对映射模型的原理及构成要素进行了详细的分析设计;③从语义相似性分析、语义相似算法表达和语义映射与执行3个方面详细设计了本体模型的映射算法;④对映射流程的实现过程和实现案例进行了分析设计,验证了映射模型的有效性;最后,从模型特征、映射依据和映射执行能力3个方面,总结了基于信息编码本体化模型的本体映射技术的特点.  相似文献   

5.
随着系统规模的扩大,在基于P2P远程学习系统中出现学习参与者无法有效发现学习资源,同时建立的虚拟学习社区不能很好地反映参与者的动态学习特性。在分析语义网和本体建模的基础上,按照学习社区要求建立节点本体模型,提出一种基于混合模式P2P技术的远程学习系统;并在此基础上,设计实现基于语义相似度的虚拟学习社区的构建算法。  相似文献   

6.
本词典包括俄汉·汉俄两部分:俄汉部分的词条包括现代政治、经济、文化、科技及生活方面的常用词及全国统编中学俄语课本中全部词汇共计6000余条;汉俄部分与俄汉部紧密配合收有10000余条,全书约百万字左右。本词典词形变化全、词义划分清楚、释义通俗明确,例证丰富。如:[完] 听完;仔细听;听诊听完来访者的谈  相似文献   

7.
任何一种语言都承载了丰富的文化内涵。比喻是人类语言中一种最有力的表现手段。在漫长的历史进程中,俄汉两种语言都创造和积累了丰富多彩的比喻,但基于各自民族特点所产生的联想差异,使俄汉比喻成了外语教学的一大障碍。因此,有必要研究俄汉比喻的民族特点,弄清它们各自的文化内涵,这对于外语教学具有十分重要的意义。  相似文献   

8.
分布式环境下的服务发现是实现空间信息数据共享、服务集成和协同工作的前提,针对目前服务发现效率低和自动化程度差的问题,提出基于本体和智能Agent的空间信息服务发现模型。首先提出了本体支持的空间信息服务描述方式,分析了注册中心的扩展方法,给出了综合多种因素的服务语义相似度匹配算法,结合智能Agent设计了服务发现框架和流程,最后验证了模型在服务发现中的有效性。  相似文献   

9.
任何一种语言都承载了丰富的文化内涵。比喻是人类语言中一种最有力的表现手段。在漫长的历史进程中,俄汉两种语言都创造和积累了丰富多彩的比喻,但基于各自民族特点所产生的联想差异,使俄汉比喻成了外语教学的一大障碍。因此,有必要研究俄汉比喻的民族特点,弄清它们各自的文化内涵,这对于外语教学具有十分重要的意义。  相似文献   

10.
在传统的电子商务推荐系统的基础上,引入了分布式计算、基于语义的发布/订阅、本体库等技术手 段,设计了一种个性化电子商务推荐模型系统,构建了电影领域的本体库,并在Prot湨g湨3.3.1中实现本体库模型。 重点实现了用户特性聚类算法和基于语义的发布/订阅匹配算法。实验结果表明,基于发布/订阅的个性化推荐系 统具有较好的推荐准确率。  相似文献   

11.
基于微博话题传播过程,提出了一种新的用户影响力分析方法.该方法首先结合微博信息传播机制,构建信息推送网和信息转发网;其次,基于上述网络建立话题传播网模型并提出CTDN构建算法;最后,以该模型为基础设计并实现了一种用户影响力排序算法TD-InfluenceRank,该算法在迭代计算用户影响力时通过考虑节点间的信息传播,使影响力更多地转移给关系密切的节点.实验结果表明,以TD-InfluenceRank算法为核心的用户影响力分析方法,能够有效提高话题传播中用户影响力分析的准确性.  相似文献   

12.
基于图理论的概念间语义度量方法,改进了语义相似度部分影响因素,提出一种结合设计良好的领域本体来计算自然语言概念间的语义相似度的算法.对自然语言与本体的关系进行分析,并通过本体对节点密度、节点深度与节点层次顺序等影响概念语义相似度的因素进行了改进,综合考虑概念的语义距离、概念间关系、概念的属性与概念所处的层次等影响因素,利用本体对相关领域的基本术语和关系的准确定义,改进了基于本体的概念间语义相似度的算法.实验结果表明,该算法对于提高概念间相似度的计算精度明显高于其他算法.  相似文献   

13.
俄汉报刊标题都有其自身的风格。不同的语言文化传统使俄汉标题存在着差异。这些给非本族的俄语学习者阅读俄文报刊造成了一定的困难;标题是文章的点睛之笔。因此对标题的研究也就极为重要。从词汇,时态,修辞和标点符号四个方面探讨了俄汉新闻标题的异同。旨在更好的理解俄语报刊标题内容,提高报刊阅读能力。  相似文献   

14.
成语的来源是产生成语的文化土壤,文章首先从五个方面比较了汉俄成语来源的异同。接着从自然环境、风俗习惯、数字、度量衡、语言文字等方面比较了汉俄成语的文化蕴含。最后,比较了汉俄成语中的外来语,从中可以看出其他民族的语言对汉俄成语的影响。  相似文献   

15.
基于co-ICIB联合聚类的舆情监测系统的设计为舆情信息库,它通过联合聚类等数据挖掘算法可以快速及时地发现新的舆论热点.当舆论热点被确认,即在互联网上真正成为一个备受关注的话题时,文本分类算法可以将同一话题内的信息归类,有助于跟踪舆情的发展趋势.该舆情监测系统可为舆情监管部门提供原始舆情资料、数据性图表和建议性分析.  相似文献   

16.
针对多数语义Web服务发现算法需要领域本体支持且算法的复杂度较高的问题,利用Google距离来定量测量Web服务输入、输出间的语义距离,并基于Google海量词汇及Google搜索引擎来计算服务间语义相似度.计算时,不需要提供领域本体且基于开放的Google搜索引擎来计算服务匹配度,提高了效率,降低了复杂度.  相似文献   

17.
针对回顾式话题检测方法存在的话题检测时效性较差的问题,提出了改进的位置敏感哈希(LSH)算法,并应用于互联网新闻层次化话题检测. 在挖掘新闻内容特征的同时,应用潜在狄利克雷分布主题模型挖掘新闻的语义特征,将非二进制空间的内容特征向量和主题特征向量转换到二进制特征空间上,依次应用LSH算法对新闻文本基于内容特征和主题特征聚类,得到具有"主题-内容"层次的话题. 实验结果表明,该方法通过挖掘新闻的内容特征和主题特征,能更准确和完整地表现新闻内容;将内容特征和主题特征转换到统一的二进制空间,有效降低了聚类过程的时间复杂度,在保证话题检测准确率和话题在语义层面上扩展性的前提下,提高了话题检测的效率.  相似文献   

18.
针对目前互联网环境下学习资源推荐方法无法满足用户垂直化、精准化以及个性化学习需求问题,探索融合学习资源维度、学习者维度以及情境维度的学习资源推荐方法。首先,构建学习资源推荐多维关联本体模型(MCOM),通过语义关系实现学习资源本体、学习者本体和情境本体关联;其次,设计动态自均衡二进制粒子群优化算法(DSEBPSO);最后,将MCOM本体模型与DSEBPSO算法融合应用,提出基于多维关联本体的学习资源推荐方法(MCOM-LROM),为学习者提供最优学习资源或学习路径。相较于当前主流的学习资源推荐方法,MCOM-LROM方法在推荐结果准确性、响应速度以及内容质量等方面性能更优。  相似文献   

19.
针对RDF生物信息数据库,结合领域知识,研究了在本体指导下的RDF数据库资源链接策略。同时,对所涉及的资源匹配、基于本体的语义相似度计算等具体问题进行算法设计及开发。实验结果验证了本文所阐述的语义生物信息数据库资源链接算法模型的有效性。  相似文献   

20.
查全率,查准率的高低在很大程度上决定了一个智能搜索引擎的性能,而用户偏好库中的算法如果运用得当可明显提高查全率和查准率.在探讨了在基于本体的智能搜索中用户偏好库的作用和其类型,特别是客观世界中某一特定领域或主题的用户偏好库之后,详细地研究了用户偏好库中用户兴趣剖像生成的提取算法,TF*IDF算法和TF*IWF*IWF算法和基于本体的查询扩展算法,并且讨论了各个算法之间的联系.论述了用户偏好库在基于本体的搜索系统中的独特意义.通过实验最终验证了这些算法可达到查全率为10.1%、查准率为81%的良好效果,进而证实基于本体在智能搜索中所体现的优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号