首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 421 毫秒
1.
针对以往的搜索引擎日志分析都主要集中在用户行为分析、查询推荐及搜索引擎评价等方面,采用社会网络分析法对搜索引擎进行日志分析。以不确定图的方式逻辑表示搜索引擎的日志中查询词和网页的链接关系,通过基于不确定图的SimRank算法,计算查询词与网页的相似度,最终以相似度和查询词的加权方式建立网页描述库。针对概率抽样的3点基本要求,提出一种渐进式的抽样策略,从而保证采用抽样技术对于不确定图中SimRank值计算的准确性。实验表明该算法具有较好的准确率和可行性。  相似文献   

2.
搜索引擎用户查询的广告点击意图分析   总被引:1,自引:1,他引:0  
搜索引擎广告点击率的多少直接影响搜索引擎的收入,而深入分析用户查询的广告点击意图则是提高广告点击率的基础性工作.针对与此,基于商用搜索引擎的用户查询点击日志,统计分析了搜索引擎用户查询的广告点击率,提出基于查询词内容匹配和基于贝叶斯分类的两种方法预测搜索引擎用户查询的广告点击意图.在大规模的真实用户查询点击日志上的实验结果表明,所提出的方法能够预测查询的广告点击意图,将广告投放的精度从3.0%提高到36.8%,广告投放的平均F-measure值从0.060提升到0.408.通过广告点击意图预测,有效缩小了广告投放范围,并适用于在线广告意图的实时预测.  相似文献   

3.
目的 针对目前国内房产信息资源比较分散特点,研究房产信息垂直搜索引擎的建立模式与实现技术.方法 应用Lucene与Nutch平台以及垂直搜索引擎技术,开发具有市场应用价值的房产信息垂直搜索引擎.结果 设计建立了包含网页抓取模块、网页解析模块、数据库存储模块、索引建立模块、查询模块组成的房产信息垂直搜索引擎.结论 该房产信息垂直搜索引擎可为用户提供房源信息、房产新闻和数据的检索、查询与分析等服务.相比其他搜索引擎在搜索结果方面精度提高一倍,在运作成本方面仅为其他搜索引擎运作成本的1/2,搜索速度方面相比其他搜索引擎提高20%.  相似文献   

4.
基于搜索引擎日志发现相近Web查询   总被引:3,自引:0,他引:3  
提出了一种利用搜索引擎日志发现高质量相近Web查询的新方法.对一个给定的查询,从日志中抽取候选查询的一些量化指标,如被查询的不同用户量、被查询的次数、用户在反馈结果中的点击次数、与给定查询间的共有词项个数、点击相同URL的个数及其分布等,用手工标记部分训练数据,进而建立一个发现有较好反馈结果的相近查询的回归模型.实验显示用该方法可得到较高的结果精度.  相似文献   

5.
为解决站内搜索引擎页面和用户之间的交互性,用公用网关接口技术CGI完成动态网页的制作。由Web浏览器提交搜索引擎页面的查询语句给web服务器后,Web服务器调用搜索程序,把检索到的相关结果再回传给web服务器和web浏览器,通过CGI技术成功实现了浏览器和可执行程序之间的动态交互性,达到用户快速获得查询信息的目标。系统介绍了用CGI程序实现搜索引擎页面的提交和编码转换处理的实施步骤。实验表明,用C语言编写的CGI脚本程序能够很好的实现用户和页面的交互性。  相似文献   

6.
为了提高搜索引擎的准确度,以达到对用户查询进行优化,缩小用户查询的范围,使用户得到更准确查询结果的目的,在考虑到用户兴趣的基础上,提出了一种用户查询到用户兴趣类的映射技术.介绍了采用该技术所建用户个性化模型的总体结构和各个模块并进行了实验.结果表明,该技术的应用能实现对用户查询的优化.  相似文献   

7.
一种基于语义关联的查询优化方法   总被引:7,自引:2,他引:5  
提出了一种综合词法关系和语义分析的查询优化方法。通过对查询关键字词法特性和本体实例之间语义关联强弱的分析,提高了查询关键字到本体概念映射的完整性和准确率,帮助搜索引擎对用户的意图做出有效推测,解决了传统搜索引擎不能很好理解用户意图的问题。设计实现了相应的查询优化系统,实验表明该系统可以有效提高搜索的准确率。  相似文献   

8.
分布式信息资源发布订阅推荐模型研究   总被引:1,自引:1,他引:0  
针对现有网络信息资源分布式特征和语义搜索的要求,提出一种应用发布/订阅技术实现信息资源语义推荐模型。资源以消息方式发布到分布式模型系统中,用户的个性化要求通过订阅方式存储在查询本地,实现将用户被动搜索信息变为系统主动推荐个性化的信息服务的转变,同时应用语义Web技术实现基于内容的信息匹配。该系统模型改变了现有基于网页搜索信息资源的方式,更易于部署,实验结果表明,该模型比传统的网页推荐模型信息匹配准确率更高。  相似文献   

9.
针对某一主题或学科的垂直搜索引擎是搜索引擎的延伸和细分,面向特定用户提供垂直搜索。网页排序算法是搜索引擎好坏的关键,搜索引擎网页排序算法的目的是从海量搜索结果中将主题相关和权威的网页排在前列,帮助用户查找所需的资源。 Nutch搜索引擎只实现了一个基本的综合排序模型,为了使Nutch更好地满足专业用户的需求,该文设计一个综合考虑主题相关性和网页权威性的综合排序模型,将主题相关度因子和改进后的PageRank算法因子融入到Nutch网页评分计算公式中。实验表明,改进的排序算法可以提高信息的查准率,具有明显的主题倾向性,在实际应用中发挥作用。  相似文献   

10.
搜索引擎是对资源的检索机器,是网络工具的代表。要实现对信息资源的智能检索,我们要处理的问题有信息预处理、查询检索、动态知识库的构造。首先要在网络中建立全面的网页文档信息,然后建立索引库,最后当有用户进行查询时,匹配器根据关键字在索引库中进行搜索。在经过了搜索引擎的过程,面对更复杂的对象我们又开发出了智能信息检索系统。可以利用动态知识库来扩展更复多的查询对象。  相似文献   

11.
为了在浩如烟海的Web信息中更快地找到用户关心的信息,提出了一种主题爬行方法——MatchLink,它通过文档向量模型来评估网页链接的主题相关度,通过朴素贝叶斯算法和多层分类的方法计算链接所在网页的主题相关度,并根据这2个相关度优先下载主题相关的页面,实验表明其结果好于BestFirst和BreadthFirst。  相似文献   

12.
信息抽取技术在LBS中的应用   总被引:1,自引:0,他引:1  
由于LBS系统的终端设备处理能力较低,显示屏幕较小,再加上无线数据网络带宽不足,因此无法浏览整个Web网页。采用信息抽取技术可以将用户感兴趣的信息提取出来,再发送给用户终端,有效地解决上述问题,信息抽取技术将是LBS系统中的一项重要应用。提出了一种基于信息抽取的从删.到WML的页面转换方法,首先标记少量的Web网页形成样本实例集,采用归纳算法生成信息抽取规则;其次应用抽取规则和模式匹配来处理结构和风格类似的Web页面;最后将抽取结果转换为WML页面。开发了原型系统,通过对实际数据源的抽取,验证了此方法的有效性。  相似文献   

13.
一般的B/S体系结构的管理信息系统都具有对数据库进行分页查询及显示的功能,结合实例介绍了用PHP对MySQL数据库进行分页查询及显示的一种方法。该方法简单有效,开发的项目中提高了查询的速度,减轻了服务器的负担。示例中的程序代码清晰易读,可供广大网站开发人员及B/S管理系统项目开发人员参考。  相似文献   

14.
基于语义网络的产品建模及配置方案搜索   总被引:2,自引:0,他引:2  
对基于语义网络的产品建模及配置方案的搜索方法进行集成研究,以提高产品配置设计的效率.在相关本体的基础上,建立基于语义网络的产品模型结构,并据此解析用户所输入的查询语句.基于语义网络的产品模型提供一种定量与定性相结合的一致化的设计实例与需求的表达方式.进一步通过产品的语义网络模型可以获取设计需求的隐含条件,使得需求在设计方案的搜索匹配过程中被更充分地考虑.利用基于语义网络的推理技术与本体语言RDFS构造待求配置设计问题的语义网络片断,并通过语义搜索与匹配度计算排序从设计实例库中获取符合当前需求配置设计方案;同时,通过注塑机螺杆为实例的应用,证明了基于语义网络的产品模型在支持配置选型设计方案搜索方面的有效性与实用性.相对于传统的产品模型而言,基于语义网络的产品模型更关注属性之间的内部联系,经实例验证基于语义网络的产品模型使得配置设计过程更符合用户的实际需求.  相似文献   

15.
Deep Web集成服务的快速发展,方便了用户对Deep Web信息检索需求。如何提高查询结果的排序效果,将最接近用户查询的结果显示给用户,逐渐成为研究重点。提出了一种综合评判方法,从数据源质量、查询相关度以及查询响应反馈三个方面,综合计算出查询结果的评价分值,并用于查询结果排序,具有较好的可行性和有效性。  相似文献   

16.
为了准确全面地对Deep Web查询结果页面的数据进行语义标注,将领域本体作为Web数据库所应遵循的全局模式引入到语义标注的研究中,通过建立起接口模式、结果模式与本体间的映射来实现数据的自动语义标注。针对多个不同领域的Web数据库进行实验测试,证明了该方法是有效的。  相似文献   

17.
面向语义Web的RDF数据处理和应用   总被引:2,自引:1,他引:2  
利用Multi-Agents实现RDF数据的获取、存储和利用.信息收集Agent提取语义Web上用RDF语言描述的元数据,存储Agent将这些元数据存储在XML数据库或关系数据库中,推理Agent根据用户提交的查询关键词进行语义匹配及语义相关性扩展,查询Agent执行对RDF数据库的查询,并返回结果给用户,从而实现基于语义的Web信息检索服务.  相似文献   

18.
针对现有搜索引擎的搜索结果数目庞大要从中找到有用信息十分困难的问题,基于将Web搜索结果进行聚类可以方便用户快速浏览搜索结果的思想,提出了一种基于形式概念分析的Web搜索结果聚类方法。首先从搜索结果中集中提取关键短语和非关键短语,然后从搜索结果集到关键短语和非关键短语集上建立形式背景,采用一种较快概念格生成算法在该形式背景上生成概念格,概念格上的一个概念表达了具有确定意义的主题,即得到Web搜索结果的一个类:每个概念内涵具有的关键短语或非关键短语作为类标记;概念的外延所包含的搜索结果文档作为该类的内容;搜索结果各个类之间的层次关系通过概念格上的层次关系得以体现。  相似文献   

19.
为了更好地解决用户查询词的准确性,研究了如何从用户搜索的上下文所提供的个人信息和其使用过程中的隐式反馈来推断出用户的兴趣。开发了智能客户端Web搜索代理,可以进行相应的隐式反馈。实验表明,Web搜索代理可以提高搜索的准确率。  相似文献   

20.
用户对Web站点的访问代表了用户对Web站点上页面的访问兴趣。这种兴趣程度可以通过用户对Web站点上页面的浏览顺序表现出来。Web站点的访问日志记录了用户访问页面的详细信息。在对Web站点的访问日志进行事务识别后,按照访问兴趣对群体用户对Web站点的访问顺序进行聚类分析,则每一个聚类集反映出该聚类集中的全体用户具有相似的访问兴趣。文中在用户访问兴趣度量中综合考虑用户访问路径、网页内容、在此页面的驻留时间、此页面浏览频度因素,提出了一种基于用户访问兴趣的路径聚类算法。最后通过实验来验证这种算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号