首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
王若佳  李培 《图书情报工作》2015,59(11):111-118
[目的/意义] 针对当前我国网络用户的健康信息检索行为, 探索利用中文搜索引擎的健康信息检索规律, 为完善健康搜索引擎和网站建设提供参考。[方法/过程] 基于搜狗搜索引擎的大规模查询日志, 采用日志挖掘的方法, 从查询行为和点击行为两个角度对网络用户的健康信息检索行为进行研究。查询行为的研究指标包括会话层(会话长度、用户重复查询), 查询串层(查询串长度、重复查询)和词项层(高频词汇, 主题分类);点击行为的研究指标为点击位置和点击内容。[结果/结论] 健康相关查询的重复率较高, 提示相关网站可缓存高重复率查询串的返回结果;大众关注的热点领域为疾病、保健、母婴、医疗机构与美容整形, 提示网站的导航设计注意导航方向;用户更偏爱使用问答型平台, 提示网站设计者应更加关注与用户间问答型的互动模式。  相似文献   

2.
查询背后的信息需求被定义为查询意图,搜索引擎可以根据不同的查询意图,提供多样性的服务,优化检索效果.查询意图的识别多被看成是一种分类问题,现有的大多数方法都基于查询串文本本身的特征和查询的用户点击数据特征.这两种方法存在如下的困难:对于查询串的文本特征,查询比较短,特征比较稀疏,要进行比较准确的理解会比较困难;对于用户点击特征,由于用户提交查询的长尾性分布,大多数查询的提交次数都是较少的,对于这些查询,要判别它们的意图是比较困难的.为了克服长尾查询上查询意图判断的不可靠问题,本文提出利用查询结果的相关性分数的分布作为特征来判断查询意图的方法.这种方法依赖查询结果的特征,比查询串本身的特征更加丰富;同时不依赖于用户的点击数据,因此可以克服长尾查询上的困难.结果表明,使用结果分数分布,可以提高意图判别的准确程度.  相似文献   

3.
本文利用大规模搜索日志对用户中文长句查询的情况进行了统计研究.通过分析搜索日志中的中文长句查询确定了经常发生的查询类型特点,并对用户搜索行为与查询长度、查询类型和查询频率的关系进行了研究.进一步了解了session中用户查询词修改情况,总结了用户查询修改方法和长度修改方面的特征和规律.最后,将不同长度的查询放到了三个商业搜索引擎中分别进行检索,计算其重叠率.通过以上的分析研究发现虽然目前大部分查询都是短查询,但短查询并不能满足用户所有的检索需求,特别是在搜索引擎向语义检索不断发展的今天,长句检索的分析和利用能够从更深层次上了解用户的查询用语特点和搜索点击行为,这对于查询技术的改进和语义空间的构建都具有积极的作用.  相似文献   

4.
基于长度递减与串频统计的文本切分算法   总被引:5,自引:4,他引:5  
提出了一种基于汉字串频度及串长度递减的中文文本自动切分算法。采用长串优先匹配法,不需要词典,不需要事先估计字之间的搭配概率,不需要建立字索引,利用串频信息可以自动切分出文本中有意义的汉字串。该算法能够有效地切分出文本中新涌现的通用词、专业术语及专有名词,并且能够有效避免具有包含关系的长、短汉字串中的短汉字串的错误统计。实验表明,在无需语料库学习的情况下,该算法能够快速、准确地切分出中文文档中出现频率大于等于支持度阈值的汉字串。  相似文献   

5.
认为移动搜索用户行为特征与规律的发现,对移动搜索服务的改进具有重要的参考价值。基于国内某大型学术类网站一批包含300余万条有效记录的日志数据,分析查询串、搜索时间的分布、搜索会话、移动搜索设备终端等我国移动搜索用户行为的基本特征指标。研究结果显示:与传统PC搜索相比,移动用户的查询时间分布更均匀,会话更短,使用查询推荐比例更少,移动智能终端设备用户搜索更频繁。  相似文献   

6.
通过日志挖掘研究图书馆资源发现服务用户的搜索行为   总被引:1,自引:0,他引:1  
通过日志挖掘的方法对图书馆资源发现服务用户的搜索行为进行研究。搭建一个搜索日志中间平台,用于产生和记录相关日志信息;用Java编写日志处理程序,将日志信息存储于MySQL数据库中;基于日志结果,从检索方式、查询语言与查询长度、分面点击、查询词修改等方面对用户搜索行为进行分析,希望能对图书馆资源发现服务的部署、应用和优化提供参考。  相似文献   

7.
《网络传播》2005,(1):66-67
2004年10月.著名的Google将搜索带入了手机中.用户只需要发送一条短信便可以搜索想要查询的信息.可以将搜索结果保存到手机桌面上.也可以通过点击网页上的图标来查看信息。  相似文献   

8.
搜索引擎用户点击行为分析   总被引:9,自引:3,他引:9  
王继民  彭波 《情报学报》2006,25(2):154-162
基于大规模分布式搜索引擎系统———北大“天网”的用户点击记录,本文研究发现:用户点击不同URL的数量遵从Heaps定律,点击URL的频度频级服从类Zipf分布,点击URL与页面大小相关,点击URL具有时间局部性,其顺序具有自相似性特征等一些具有普适性的规律。提出了利用点击日志确定相近查询词的一个新的有效算法。这些研究结果对于掌握用户的搜索行为,完善搜索引擎系统的设计,提高检索服务的效率和质量具有重要的意义。  相似文献   

9.
百科已成为Web 2.0环境下知识组织的一种新形式,它集中体现了Web 2.0用户参与、协同创作的特点,是Web 2.0的一种典型应用。目前,尤其是在中文环境下,有关百科词条特征及用户贡献行为的研究还不多见。本文采用计量学方法,以近30万条百度百科数据为基础,对词条特征和用户贡献行为进行统计分析。研究发现:词条编辑次数、用户创建词条数和编辑词条数均符合幂率分布,特别是百度百科具有不同于"指数增长"的词条增长规律;对于创建词条与编辑词条行为来说,绝大多数用户没有偏好性。本研究有助于认识百科这种网络信息资源及其贡献者,并为进一步系统优化和用户激励研究提供参考依据。图7。表3。参考文献15。  相似文献   

10.
青少年网络信息查询行为影响因素实证分析   总被引:2,自引:0,他引:2  
采用实证研究方法,对青少年的认知风格、年级和任务类型因素对其网络信息查询效果和具体查询行为的影响进行探究。结果表明,青少年所在的年级和任务类型对其查询效果和行为有较大影响,高中生的表现整体较初中生好,完成不同任务时青少年的信息行为有较大差异;认知风格仅对点击网页内超链接次数有所影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号