首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
基于面向对象的受限自然语言查询系统的设计与实现   总被引:3,自引:0,他引:3  
该文针对当前研究的热点问题--界面层自然语言理解的应用,设计了一个基于面向对象设计方法的受限自然语言数据库查询系统。该系统允许用户输入比较随意的中文查询命令,把用户的输入转换成标准的SQL语句,在事先规定的数据库中完成用户所要求的查询,并对中文分词的歧义处理,提出了一种新的分词算法IFM算法,有效地解决了交叉型歧义切分问题。  相似文献   

2.
为解决知识规则推理故障诊断系统对用户输入限制的问题,提出了一种基于自然语言理解的二次回溯语义分词故障诊断方法,采用词频作为分词主要依据对用户自然语言输入进行分词切分,同时按邻近关系组词进行二次回溯处理,计算出故障征兆与规则的语义相似度,从而获得与故障字典的最佳匹配结果,使诊断系统不仅具备对用户自然语言输入处理的能力,而且具有自学习和诊断多故障现象的功能,将该方法应用于某大型设备故障诊断专家系统,取得了较好的诊断效果.  相似文献   

3.
自然语言理解中的音字流自动分词   总被引:2,自引:0,他引:2  
本文讨论了自然语言理解中的语音流和文字流的自动分词问题;构造了汉语理解的层次化模型;提出了把反馈信息限定为最简形式从而使分词层与语义无关的思想以及词串排序的三种策略:按可能性大小排序, 按运算时间长短排序,以及上述两种的综合;介绍了一种分词精度极高的分词方法FWF;并且给出了实现算法和实验结果。FWF分词方法已经在语句级键盘输入、声音输入、手写汉字输入系统上使用。  相似文献   

4.
(接上期)垂直搜索技术的发展方向首先,支持自然语言查询。目前的搜索引擎都是基于关键字的。人们总会发现一个有趣的现象:用户坐到电脑前,打开某个搜索引擎页面,输入一个关键词,常常会发现毫无收获,然后再换另一个关键词……这种现象的频繁出现说明当前的搜索引擎对自然语言支持不够。现在是用户去适应搜索引擎,而不是搜索引擎适应用户。垂直搜索有其独有的领域限制,相关性、分词的发展使得支持自然语言查询的研究相对容易,因此是未来的一个发展方向。其次,利用专家系统。由于垂直搜索只针对某一特定领域,因此可以增加人工智能或者专家系统…  相似文献   

5.
当分词算法优化到接近极限时,分词器的性能指标就较多地取决于训练语料的覆盖度和完备程度。因此,如何快速、省力、自动化地构建具有较完备的分词语料库是一个亟待解决的问题。该文对用户输入过程中留下的大量可用且珍贵的自然分词信息进行了探索和研究,为自动构建分词语料库提供了一种新的观点。前人的研究中,对用户在输入过程中留下的自然分词标记信息并没有关注,而该文通过实验验证了这些分词标记信息确实可以用于构建分词语料库,并且具有相当好的效果。其中经过甄别优秀用户在输入时留下的分词标记十分接近标准的分词结果。该文使用分类模型结合投票机制的方法找到三个此类优秀用户,获取了他们带有输入标记的文本,快速构建了分词训练语料库,极大地提升了分词器的精度;更重要的是,揭示并验证了自然输入分词标记信息的有效作用。  相似文献   

6.
在信息处理中,自然语言理解的基础是词语的切分,由于汉语本身的特点,分词技术显得尤为重要.本文首先提出了分词中的歧义现象,然后对分词技术中所用到的方法作分析研究,最后阐述了国内几种分词系统并作比较.  相似文献   

7.
基于知觉加工模式的发展式分词算法   总被引:2,自引:0,他引:2  
危辉 《计算机研究与发展》2001,38(11):1281-1289
分词是自然语言理解的一个重要过程,由于语言问题又是最重要的心理学问题之一,所以从认知心理学和发展心理学的观点出发,将分词问题看成是知觉问题在语言信息处理过程中的一部分,把知觉表达和知觉的双向加工过程引入对分词问题的分析,并同时考虑言语发展的心理过程,把对言语发展规律的归纳作为构造学习算法的基础和模板,以进化的方式来逐步改进自然语言理解系统的性能,从而避免知识获取瓶颈在自然语言理解问题中的出现。  相似文献   

8.
随大数据、云计算等计算机技术的发展,拥有实时检索功能的购物商城系统也越来越重要。笔者利用jieba分词对商城用户的搜索输入进行分词以便于检索商品,同时,利用最新的电子商城框架SSM搭建了购物商城系统,较好满足了大众实时检索和购买商品的需求。  相似文献   

9.
自动问答是计算机与人类以自然语言的形式进行交流的一种方式,是人工智能研究的一个分支。介绍了微信公众平台的特点及其开发接口,研究了Lucene全文检索工具包和IK Analyzer中文分词工具包,并最终实现了一个基于微信的自动问答系统,可为用户提供自动问答服务。测试结果表明,该系统具有一定的实用性。  相似文献   

10.
葛锐 《软件》2013,34(3)
汉语分词,就是将中文语句中的词汇切分出来的过程.分词技术作为中文信息处理的基础环节,它的解决是计算机自然语言理解、人工智能、信息检索、机器翻译等领域突破的关键.因此,开发出一个高精度的汉语分词系统对于中文信息处理显得非常重要.本文讨论了中文分词的概念、目标及其所面临的一些基本问题,并详细介绍了我以自己的认识为基础设计的分词词典以及分词算法.  相似文献   

11.
一种基于命名实体的搜索结果聚类算法   总被引:3,自引:0,他引:3       下载免费PDF全文
针对现有搜索结果聚类方法中形成的聚类标签可读性比较差的情况,提出一种基于命名实体的搜索结果聚类方法——NEC。命名实体作为文本中的基本信息元素,具有一定的实际意义,表征主题的能力比一般词语更强,也更具可读性。算法以搜索结果文档中存在的命名实体作为聚类的标签,经过一定的标签选择和聚类合并策略,形成最终的聚类结果,提高聚类标签的可读性。实验证明,该方法是一种可行的搜索结果聚类方法。  相似文献   

12.
This paper introduces a model‐driven approach to the design of collaborative Web‐based applications, i.e. applications in which several users play different roles, in a collaborative way, to pursue a specific goal. The paper illustrates a conference management application (CMA), whose main requirements include: (i) the management of users profiles and access rights based on the role played by users during the conference life cycle; (ii) the delivery of information and services to individual users; (iii) the management of the sequence of activities that lead to the achievement of a common goal. The presented approach is based on WebML, a conceptual modelling language for the Web. The paper also highlights some general properties—as understood by the practical experience of CMA development—that a Web modelling language should feature in order to fully support the development of collaborative applications. Copyright © 2003 John Wiley & Sons, Ltd.  相似文献   

13.
14.
推荐系统对筛选有效信息和提高信息获取效率具有重大的意义。传统的推荐系统会面临数据稀松和冷启动等问题。利用外部评分和物品内涵知识相结合,提出一种基于循环知识图谱和协同过滤的电影推荐模型--RKGE-CF。在充分考虑物品、用户、评分之间的相关性后,利用基于物品和用户的协同过滤进行Top-[K]推荐;将物品的外部附加数据和用户偏好数据加入知识图谱,提取实体相互之间的依赖关系,构建用户和物品之间的交互信息,以便揭示实体与关系之间的语义,帮助理解用户兴趣;将多种推荐结果按不同方法融合进行对比;模型训练时使用多组不同的负样本作为对比,以优化模型;最后利用真实电影数Movielens和IMDB映射连接成新数据集进行测试。实验结果证明该模型对于推荐效果的准确率有显著的提升,同时能更好地解释推荐背后的原因。  相似文献   

15.
Cloud computing offers the proficiency to use computing and storage resources on a metered basis and reduces the investments in Information Technology domain. This paper highlights a major research issue, i.e., providing good quality of service (QoS) to the cloud users. The QoS is associated with several parameters such as completion time, response time, turnaround time (TAT), waiting time (WT), bandwidth. A new cloudlet scheduling algorithm—improved round robin cloudlet scheduling algorithm—has been proposed which improves the TAT, WT and number of context switching. It enhances the resource utilization. The experimental results are obtained by CloudSim toolkit extending few base classes and compared by classical round robin algorithm.  相似文献   

16.
In this paper, we describe theit Search Tree visual language. It is a novel methodology able to support users to build up complex queries to be run on given search engines. For using this visual language, neither parentheses nor precedence rules are needed, nor the specific ability to perform advanced search tasks. The language is proven to have the same expressive power as the expressions in Sum Of Product form. In order to prove the appropriateness of our proposal, we measured the usability of the proposed querying approach against the traditional Yahoo TM web search query language. Results show that, even if both the approaches fully support users in terms of efficacy, the Search Tree visual language significantly improves task efficiency, both in terms of the number of actions performed and the time requested with respect to the advanced search interface. Copyright © 2010 John Wiley & Sons, Ltd.  相似文献   

17.
汤亚玲  崔志明 《计算机工程》2012,38(20):179-183
现有网页分类技术忽略用户个性行为的差异.为此,提出一种结合用户行为特征分析的网页分类技术.运用知识规则发现、页面特征提取等方法,分析Web用户的访问历史和个性化定制信息,学习并掌握用户的行为和兴趣.针对用户的认知特征,提供合适的Web页面分类模式,能在一定程度上改进单纯统计学网页分类方法在自然语言理解上的不足.实验数据表明,该分类方法与多种统计学方法相结合实施网页分类均能有效地提高分类准确率,使网页分类结果更接近分类的真实情形和要求.  相似文献   

18.
The integration of environmental models and Geographical Information Systems (GIS) usually takes two approaches: loose coupling and tight coupling. This paper, however, presents a full coupling approach within a GIS environment that is achieved by developing the existing hydrological models with the macro language of GIS. Such an approach makes it easy to capitalize on the GIS visualization and spatial analysis functions, thereby significantly supporting the dynamic simulation process of hydrological modelling. The full coupling approach is illustrated by AVTOP — a realization of TOPMODEL (TOPography-based hydrological MODEL) with the macro language Avenue of ArcView — within which all stages of model building are undertaken, from the initial parameter input and transformation of datasets, to the visualization of intermediate maps and the final presentation of results in various graphical formats in their geographic context. Furthermore, this approach provides a convenient and single environment for users to visually interact with the model, e.g. by adjusting parameters and observing the corresponding results simultaneously, which significantly facilitates users in exploratory data analysis and decision making in relation to the model applications.  相似文献   

19.
为了消除自然语言对构件文本信息描述的二义性以及增强术语间的语义关系,文中采用领域本体的思想,给出了一个基于人工智能领域本体的软件构件聚类模型和基于该模型的聚类算法。该模型通过分析领域的共同概念,形成领域本体知识库,提供领域内一致认可的术语,用于匹配对构件文本描述所使用的自然语言。给出的算法通过与基于传统空间向量的K—Means算法分析比较,验证了该算法是有效的,实现了对软件构件更合理的聚类,提高了构件检索的效率和准确性。  相似文献   

20.
Phishing is a fraudulent scheme to steal a user’s personal and confidential information by masking as a trustworthy entity in the electronic commerce. Phishers lure online users to visit their fake webpages and capture the user’s sensitive financial information. The current anti-phishing technique focuses on determining the legitimacy of the webpages that the user visits, and it alerts users with a phishing label when a webpage is found to have suspicious activity. Most of the times, however, these warnings are ignored by the users as there is no significant information present in the alerts except for the phishing label. The method proposed in this paper addresses the aforementioned lacunae by generating a coherent and complete explanation in the natural language text for the anti-phishing system’s decision. The explanation includes the phishing label along with information to establish why such a decision has been taken. This would, in turn, contribute to the user’s enhanced understanding of the threat and also strengthens the user’s trust in the system. It is quite evident from the pilot evaluation, which involved 50 users, that the proposed methodology significantly improves the user’s understanding of the phishing label and strengthens their trust in the system.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号