首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
针对新浪微博的短文本发表功能及地点签到功能,获取用户发布的信息.利用LDA(Latent Dirichlet Allocation)模型,将获取到的大量文本信息和地理位置进行分词和词频统计处理,从而获得签到的热点地理位置信息,并在地图上标注出来.在获得用户签到的位置信息基础上,合并约束搜索条件,利用多距离空间聚类算法,优化推荐功能,并向用户显示其周边诸如商场、景点、饭店等热门娱乐场所的具体地理位置信息,进行热点推荐.  相似文献   

2.
基于相似度的词聚类算法   总被引:1,自引:1,他引:0  
基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计方法基于贪婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文提出了词相似度定义、词集合相似度定义,一种自下而上的分层聚类算法.这种方法不但能改善聚类效果,而且可根据不同的模型选择不同的相似度定义,从而提高聚类的使用效果.  相似文献   

3.
李散散 《现代电子技术》2020,(7):146-149+154
为了提高数字媒体推荐能力,提出基于用户行为分析和LDA模型的数字媒体推荐系统的设计方法。构建数字媒体推荐的大数据信息采集和项目分布模型,采用关联规则调度的方法,提取数字媒体的用户行为本体特征,建立数字媒体推荐的用户行为特征检测模型。在LDA模型中,进行数字媒体推荐的模糊决策调度和特征映射处理,结合模糊C均值聚类方法,进行数字媒体推荐中用户行为特征的自适应聚类,计算数字媒体用户行为的联合信息熵,根据熵权分布进行数字媒体推荐模型的算法优化设计。在B/S构架体系下进行数字媒体推荐系统的软件开发设计,仿真实验结果表明,采用该方法进行数字媒体推荐的准确性较高,误差较小,提高了数字媒体推荐的实时性和满意度水平。  相似文献   

4.
文章提出了一种基于模糊聚类的文本分类器构造方法,介绍了文本中特征词之间模糊相似度的度量方法,给出了利用“编网法”思想实现模糊聚类的算法。通过比较文本中特征词之间的模糊相似度,实现特征词的聚类,最终获取能够识别文本主题类别的特征词集合,并给出了分类器性能的测试结果。  相似文献   

5.
为了满足对XML文档集合进行数据挖掘需求,本文提出了根据XML文档树的语义信息和结构信息来计算其结构相似度,通过结构相似度构造其结构相似度矩阵,在此基础上应用DBSCAN算法来对XML文档集合进行聚类.与其他聚类算法相比,其聚类的速度得到了很大的提高.  相似文献   

6.
基于概率主题模型的文档聚类   总被引:3,自引:0,他引:3       下载免费PDF全文
王李冬  魏宝刚  袁杰 《电子学报》2012,40(11):2346-2350
 为了实现普通文本语料库和数字图书语料库的有效聚类,分别提出基于传统LDA(Latent Dirichlet Allocation)模型和TC_LDA模型的聚类算法.TC_LDA模型在LDA模型基础上进行扩展,通过对图书文档的目录和正文信息联合进行主题建模.和传统方法不同,基于主题模型的聚类算法能将具备同一主题的文档聚为一类.实验结果表明从主题分析角度出发实现的聚类算法优于传统的聚类算法.  相似文献   

7.
罗丹  刘先锋 《信息技术》2009,33(8):24-26,31
通过对XML结构聚类现状进行研究分析,提出了一种新的XML文档结构相似度度量方法DBTD(Density-Based of the Tree Distance),并在此基础上提出以基于密度的DBSCAN方法对XML文档进行结构聚类.实验表明:该方法能够对XML文档进行结构聚类,且其聚类结果充分展现了该方法的有效性.  相似文献   

8.
基于优化的LDA算法人脸识别研究   总被引:4,自引:0,他引:4  
提取低维人脸特征是人脸识别系统中极其关键的一步。线性判别分析(LDA)是一种较为普遍的用于特征提取的线性分类方法。本文提出了一种优化的LDA算法,该方法克服了传统的LDA算法用于人脸识别时存在的问题:通过重新定义样本类间离散度矩阵使传统的Fisher准则能够最优化,克服了边缘类对选择最佳投影方向的影响;同时,利用因数分解的方法避免了对矩阵求逆,解决了小样本问题。依据经验选取适当的e值,得到最佳的识别效果。实验结果表明,人脸识别效果优于传统LDA方法。  相似文献   

9.
10.
指纹匹配算法的好坏直接影响识别系统的精度。提出了一种新的基于细节点聚类的多参考中心指纹匹配算法,在两枚指纹对齐阶段,不仅考虑了指纹的全局特性而且根据不同的细节点类自适应地构造不同的局部结构.有效地利用了一些孤立但信息量较大的细节点,提高重叠区域内细节点较少且分散的情况下对齐的准确性。在匹配阶段。多参考中心的使用和相似元分析的结合能在一定程度上克服指纹非线性形变的影响,降低了匹配算法的拒识率。实验结果表明该方法提高了匹配的性能。  相似文献   

11.
随着计算机与通信技术的发展,以及智能手机的发展,给移动学习系统的普及和发展带来了机遇。本文基于Windows2003 Server系统,以Tomcat+Eclipse+SQL Server2005+JDK”作为开发环境,设计一款针对大学生的大学英语移动学习平台,使大学英语学习充分利用现代科学技术的发展,具有一定的实用性。  相似文献   

12.
13.
采用统计与实例的混合策略和翻译记忆技术相结合的方法设计并实现汉维计算机辅助翻译系统。采用该方法的汉维方向BLUE值达0.292 4,0.299 9,0.292 2,维汉方向BLUE值达0.328 4,0.328 6,0.303 1;另外,在面对日益扩展的语料库的压力时采用优化的信息检索技术,并根据同一篇文章有同一个主题的特点采用上下文相关问答技术,均使翻译准确率和译者工作效率有了明显提高。  相似文献   

14.
《Microelectronics Journal》2014,45(11):1450-1462
This study proposes a spiking neuro-fuzzy clustering system based on a novel spike encoding scheme and a compatible learning algorithm. In this system, we utilize an analog to binary encoding scheme that properly maps the concept of “distance” in multi-dimensional analog spaces to the concept of “dissimilarity” of binary bits in the equivalent binary spaces. When this scheme is combined with a novel binary to spike encoding scheme and a proper learning algorithm is applied, a powerful clustering algorithm is produced. This algorithm creates flexible fuzzy clusters in its analog input space and modifies their shapes to different convex shapes during the learning process. This system has plausible biological support due to its spike-based learning mechanism, its Quasi Spike Time Dependent Plasticity learning policy and its brain-like fuzzy clustering performance. Moreover, this neuro-fuzzy system is fully implementable on the hybrid memristor-crossbar/CMOS platform. The resultant circuit was simulated on one clustering task carried out in the binary input space on the Simon Lucas handwritten dataset and another clustering task carried out in the analog input space on Fisher׳s Iris standard dataset. The results show that it attained a higher clustering rate in comparison with other algorithms such as the Self Organizing Map, K-mean and the Spiking Radial Basis Function. The circuit was also successfully simulated on an image segmentation task and some clustering tasks performed in noisy spaces with various cluster sizes. Furthermore, the circuit variability analysis shows that device and signal variations up to 20% had no significant impact on the circuit׳s clustering performance, so the system is sufficiently immune to different variations due to its fuzzy nature.  相似文献   

15.
分形理论是非线性科学的三大理论前沿之一,迄今为止尚未出现比分形几何学描述自然形态更好的几何学,因此分形在众多领域应用广泛,但是分形算法具有较高的理论深度,使传统的理论教学显得捉襟见肘.本文基于VisualStudio 2005实现了典型分形算法的计算机模拟,并提供一定的交互功能.结果表明,该平台为师生研究分形算法提供理论背景和实验平台,并对提高教育教学质量起到明显的推动作用.  相似文献   

16.
针对传统销售方式中不便于管理、效率低等缺点,将电子商务技术和计算机技术结合起来,开发出管理更便利、效率更高的网上图书销售系统.本系统基于B/S三层体系结构和Struts开发框架,采用JDBC数据库访问技术和Tomcat应用服务器等关键技术,并对系统功能进行分析,得出4个功能模块:图书浏览、购物车管理、订单管理和用户管理.功能的实现是基于JSP.技术与JAVA相结合,最终设计并实现了一个功能强大的图书销售系统平台.  相似文献   

17.
对实验演示系统的系统架构、系统设计、体系结构进行了论述,创新性的采用RIA技术作为系统的表现层.论述了RIA技术的特点及优势,系统架构采用浏览器/服务器结构,系统设计中分析了系统模块的组成、系统安全性等.在体系结构中论述了系统的分层设计以及数据交换的方式.通过系统的实际使用,提高了学生自主学习能力,减少了教师的工作量,对数字化教学方法改革做了关键的一步.  相似文献   

18.
基于OSGI的智能家庭系统的设计与实现   总被引:1,自引:0,他引:1  
张波  董康 《电子设计工程》2011,19(7):118-121
为了解决普适环境下智能家庭各类设备组网困难的问题,本系统采用OSGi(Open Service Gateway Initiative)服务框架和LonWorks现场总线技术,利用低压电力线载波手段来设计和实现智能家庭系统.利用上述方法可以极大地实现不同标准设备的组网,并且可以实现对智能家庭设备管理的灵活性和便捷性.  相似文献   

19.
为了在网络条件较好的局域网或专用网络上快速开发视频监控系统,提出一种不需要视频编码协议和特殊监控摄像设备的设计方案。该方案在Windows平台上使用普通摄像头进行图像的视频采集,并使用开源的图像处理库程序CxImage对图像帧进行处理,通过网络套接字接口进行传输并在Windows系统上进行显示,并能对监控系统的接入进行身份验证。经过测试该方案能提供稳定的视频监控效果,说明该方法能在网络状态稳定的局域网条件下通过无视频编码协议的方式进行应用,降低了系统开发的复杂度和成本。  相似文献   

20.
为能在数字通信系统的接收端将每帧数据区分开,实现正确译码,提出一种采用FPGA实现帧同步系统的设计方案。同步保护电路的设计提高系统的可靠性,在Quartus II开发软件上用硬件描述语言实现帧同步电路设计,并给出FPGA设计的实验仿真,实验结果表明该电路系统工作正确可靠,满足设计要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号