首页 | 官方网站   微博 | 高级检索  
     

融合多类特征的Web查询意图识别
引用本文:伍大勇,赵世奇,刘挺,张宇.融合多类特征的Web查询意图识别[J].模式识别与人工智能,2012,25(3):500-505.
作者姓名:伍大勇  赵世奇  刘挺  张宇
作者单位:1。哈尔滨工业大学社会计算与信息检索研究中心哈尔滨150001
2。百度在线网络技术有限公司北京100085
基金项目:国家自然科学基金项目,国家863计划项目
摘    要:识别搜索引擎用户的查询意图在信息检索领域是备受关注的研究内容。文中提出一种融合多类特征识别Web查询意图的方法。将Web查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容及Web查询日志中抽取出有效的分类特征。在人工标注的真实Web查询语料上采用文中方法进行查询意图识别实验,实验结果显示文中采用的各类特征对于提高查询意图识别的效果皆有一定帮助,综合使用这些特征进行查询意图识别,88。5%的测试查询获得准确的意图识别结果。

关 键 词:搜索引擎  查询意图  特征融合  
收稿时间:2010-10-13

Identification of Query Intents via Combining Multiple Features
WU Da-Yong , ZHAO Shi-Qi , LIU Ting , ZHANG Yu.Identification of Query Intents via Combining Multiple Features[J].Pattern Recognition and Artificial Intelligence,2012,25(3):500-505.
Authors:WU Da-Yong  ZHAO Shi-Qi  LIU Ting  ZHANG Yu
Affiliation:1. Research Center for Social Computing and Information Retrieval,Harbin Institute of Technology,Harbin 150001
2.Baidu Online Network Technology Co.Ltd,Beijing 100085
Abstract:Identifying underlying user intents of search engine queries is a hotspot in the field of web information retrieval. An approach to identifying user intents of search engine queries is proposed based on features from various sources. Specifically, the query intent identification is regarded as a classification problem. The classification features are extracted from various sources including query texts,search engine feedbacks and query logs. The method is evaluated on the real web query data. The experimental results show that the exploited features are helpful to improve the identification performance. Furthermore,about 88. 5% of the test queries can be correctly identified with the classification framework via combining all the features.
Keywords:Search Engine  Query Intent  Feature Combination
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《模式识别与人工智能》浏览原始摘要信息
点击此处可从《模式识别与人工智能》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号