首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
基于常问问题集的中文问答系统研究   总被引:51,自引:0,他引:51  
首先根据用户的提问建立一个候选问题集,然后通过计算句子语义相似度,在候选问题集中找到相似的问旬,并将答案返回给用户。该系统还能够自动地更新和维护FAQ库。实验表明,与基于关键词的句子相似度计算相比,基于语义的句子相似度计算提高了问题匹配的准确率。  相似文献   

2.
中文主观题自动批改中相似句子检索算法   总被引:2,自引:0,他引:2  
学生答案与标准答案语义匹配程度的计算是基于中文文字类主观题自动批改中的关键问题。提出了学生答案与标准答案匹配程度的计算分两步进行:候选相似语句的检索和基于语义依存的句子相似度计算。利用动态规划法实现候选语句检索,确定数量不多但有可能与标准答案相似的候选句子,然后对标准答案中的句子与少量的候选句子进行深层的句法分析,找出依存关系,并在依存分析结果的基础上进行语义相似度计算,得出最终的结果。该方法可以提高主观题自动批改的效率及准确性,具有一定的实用价值。  相似文献   

3.
分析了中文自然语言处理中句子相似度的计算方法,介绍了基于向量空间模型的TF—IDF的、基于句子语义和基于句子依存关系的三种句子相似度计算模型,并对它们的计算原理、计算方法进行了分析,给出了他们的优缺点.基于向量空间模型的句子相似度计算模型已经比较成熟,一般情况下能够产生较好的效果.由于TF—IDF方法没有考虑这种语义信息,所以传统的TF—IDF方法具有一定的局限性.而基于句子语义或句子的依存结构来进行相似度计算,能达到更好的效果.  相似文献   

4.
在对已有方法进行分析的基础上,提出语义与结构相结合计算句子相似度的方法,并系统地介绍了此方法的实现过程。首先对输入的句子进行预处理,得到词语序列,使用基于知网的方法得到词语间的语义相似度;然后使用词形和句长特征表示句子的结构相似度;最后加权得到两个句子的相似度。实例证明,提出的方法计算得到的句子相似度取得了较好的效果。  相似文献   

5.
现有的基于语义依存的汉语句子相似度算法仅考虑了基于核心词的有效搭配对,根据两个句子有效搭配对的对应词是否是相同词和同义词将匹配权重简单地处理为0,0.5和1,而且未考虑不直接依存于核心词的其他词语,导致在计算句子相似度时区分度较低.改进算法通过综合计算核心词、关键词的语义相似度来确定更为精确的匹配权重,并且将不直接依存于核心词的其他词语对句子的影响也纳入句子相似度计算,以期达到全面刻画句子语义、提高算法的准确率和区分度的目的.实验结果表明改进算法比原算法具有更高的准确率以及更好的对句子的区分能力.  相似文献   

6.
简单命题的语义识别是进行自然命题逻辑推理的重要基础之一,知网在中文词汇和句子的相似度计算方面扮演着越来越重要的角色。在对领域命题进行了预处理后,针对简单命题的句型结构和构成成分的特点,通过改进义原相似度、词语相似度、句子相似度的计算方法,提出了一种基于知网的、新的句子相似度计算方法。实验表明:该方法可以简单而有效地计算词语相似度;在句子相似度计算时,可以减少助动词、修饰词的影响,更适合判断两个命题是否高度相似。  相似文献   

7.
《南昌水专学报》2016,(1):56-60
提出一种歧义字段与其所在句子语义联系为依据的中文分词交叉歧义处理方法。该方法模拟人浏览句子按照语义和词语相关度寻找消歧证据的经验,通过比较计算歧义字段与整个句子的语义相似度和语义相关度,提出基于语义扩展度的中文分词交叉歧义处理算法,进而提高分词准确率,与经典的ICTCLAS分词系统相比,切分准确率和召回率均有很大提高。  相似文献   

8.
WordNet中的综合概念语义相似度计算方法   总被引:1,自引:0,他引:1  
作为语义异构问题的基础,概念间语义相似度计算已成为研究热点,对此,提出一种基于WordNet的综合概念语义相似度计算方法. 该方法不仅集成了传统的基于语义距离的算法和基于信息内容的算法,而且引入了深度、密度因子和语义重合度来进行综合分析,并针对综合算法中权值难以确定的问题,引入主成分分析改进权值分配方法. 实验结果表明,改进后的方法计算的相似度与人工判断的相似度相关性较高,有效改善了概念语义相似度计算的准确性.  相似文献   

9.
句子相似度的计算在自然语言处理的各个领域都占有很重要的地位,且在主观题自动批改技术中,句子间相似度的计算是一个关键的问题.本文提出一种基于多层次融合的语句相似度计算模型,在对句子的词形、词序、词义三个层次进行相似度计算的基础上,融合这三个层次,从而使句子相似度计算更加准确,并通过实验验证了此方法的有效性.  相似文献   

10.
在E-learning环境中,为了满足用户对学习资源的个性化需求,提出了一种基于语义网技术的学习资源个性化推荐算法。首先根据用户评价和浏览行为得到用户感兴趣的学习资源集合与核心概念集合,然后根据领域本体中概念间的关系分别计算不同用户评价的学习资源集合间的语义相似度和核心概念集合间的语义相似度,最后根据得出的两个相似度值共同决定用户兴趣偏好的相似性,找到具有相似兴趣的最近邻居,从而实现学习资源的协同推荐。此外,在学习资源管理上引入了学习对象概念,降低了相似度计算的复杂度。并将该算法应用到了基于语义网的个性化学习资源推荐系统中,实验表明,该算法有效改善了学习资源推荐效果,特别是对于新加入的资源和新注册用户效果显著。  相似文献   

11.
12.
针对基于位置服务中移动终端用户位置隐私泄露问题,提出了一个基于相似轨迹替代查询的位置隐私保护方案.该方案在基于位置服务请求的用户及候选者身份匿名化的基础上,采用相似轨迹函数挑选出一定时间间隔内和用户轨迹相似度最高的候选者;然后由该时刻所挑选出的候选者替代用户发起位置服务请求,从而实现用户身份、查询和轨迹的隐私性保护.通过安全性分析,该方案满足匿名性、不可伪造性、以及抵抗连续查询服务追踪攻击等安全特性.仿真实验结果表明,本方案有效提高了最优候选者轨迹相似度以及最优候选者挑选效率.  相似文献   

13.
为了提高数据仓库的查询响应性能,避免视图集频繁调整引发的"抖动性",提出了一种基于查询聚类的物化视图动态调整策略,运用关联规则挖掘方法计算属性字段相似性,进而计算查询语句相似性,并对一个查询周期内的查询语句集进行聚类,产生候选视图集,根据效益模型计算候选视图的效益,再运用物化视图动态调整算法生成物化视图.在航空公司机票结算数据集上的实验结果表明,在单机环境和分布式环境下,较基准算法相比,所提出的方法均能显著提升数据仓库的查询响应性能,尤其是对高频查询语句的响应性能.  相似文献   

14.
为解决图集近似包含查询,提出一种基于图解构的GCSS算法.该算法通过对图集中的目标图进行解构,得到图集中子图分布情况,并利用该子图分布建立索引.在此索引基础上的查询算法对图集进行近似包含查询,不但可以避免确定候选集的过程中产生过多子图同构测试,而且形成较小候选集,提高验证阶段效率.实验结果表明,GCSS算法能高效完成近似包含查询任务,得到图集中被查询图近似包含的正确结果.  相似文献   

15.
针对轨迹数据的攻击性推理可能导致个人隐私信息泄露的问题,提出了一个基于动态时间归整(DTW)交换查询的轨迹隐私保护方案.通过对基于位置的服务(LBS)请求的用户及候选者身份进行匿名化处理,利用DTW算法依次计算出所有候选者与发起者在一定时间间隔内的轨迹相似值,从中选出最优相似轨迹的候选者替代真实用户请求LBS服务,从而实现用户身份与位置的隐私保护.经过安全性分析,所提方案不仅满足匿名性和不可伪造性等安全特性,而且能够抵抗窃听攻击和连续查询服务追踪攻击.仿真实验结果表明,所选候选者轨迹的相似度有明显提高.  相似文献   

16.
基于潜在语义索引技术提出一种大容量文本的快速检索算法.首先,利用奇异值分解方法对向量空间模型进行改进,充分考虑词项之间的相关性,在低维空间中表示待检索文本的各个段落与查询文本;其次,利用随机分块查询算法,以查询文本和待检索文本各段落之间的余弦相似度作为适应度函数进行检索,输出相似度超过阈值的候选段落;最后,通过仿真实验验证了该方法的有效性.实验结果表明,该算法可以根据段落的语义进行文档的搜索,可以为查询大容量文档提供有效的手段.  相似文献   

17.
基于小波变换的多分辨率高维图像检索方法   总被引:1,自引:0,他引:1  
为解决传统索引方法对高维数据索引时存在的维数灾难问题,提出一种多分辨率向量近似方法.该方法通过小波变换得到一种多分辨率数据结构,在低分辨率上建立低维空间内的距离计算方式.进行近邻搜索时,从低分辨率开始计算候选向量与查询向量之间的距离下限,通过与当前的近邻距离相比较,可以在低分辨率上过滤掉大多数候选向量,避免在高维空间内对其进行距离运算,从而降低运算复杂度.在大型高维图像数据库上的实验表明,该方法可以显著提高向量近似方法的查询效率.  相似文献   

18.
为了减少基于密度的异常点检测算法邻域查询操作的次数,同时避免ODBSN(Outlier Detection Basedon Square Neighborhood)中有意义异常点的丢失和稀疏聚类中的对象靠近稠密聚类时导致错误的异常点判断,提出了一种基于邻域和密度的异常点检测算法NDOD(Neighborhoodand Densitybased Outlier Detection)。NDOD吸收基于网格方法的思想,以广度优先扩张方形邻域,成倍地减少了邻域查询的次数,从而快速排除聚类点并克服基于网格方法中的“维灾”。新引入的基于邻域的局部异常因子代表候选异常点的异常程度,用于对候选异常点的精选,可避免ODBSN的缺陷,发现更多有意义的异常点。大规模和任意形状的二维空间数据的测试结果表明,该算法是可行有效的。  相似文献   

19.
空间连接是空间数据库中最重要最耗时的操作,国内外学者的研究多是基于索引结构空间连接的一次过滤方法,其中基于R-tree的空间连接算法被认为是一种高效的处理机制。本文提出了基于R-tree空间连接的二次过滤方法,缩小了过滤阶段的候选集大小,可有效提高查询效率。  相似文献   

20.
针对可扩展标记语言(XML)数据查询中的结构化匹配问题,提出一种位图过滤加速法,该算法能有效地提高XML结构化匹配效率。通过预先为每个XML节点建立标签位图,该加速法在XML结构化匹配中,能以位图比较形式过滤大部分未匹配节点,从而达到加速效果。研究位图过滤加速法与几类XML结构化匹配算法的集成问题,提出了低代价的融合方法。实验证明,集成位图过滤加速法的XML结构化匹配算法在查询效率方面明显优于原有算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号