首页 | 官方网站   微博 | 高级检索  
     

搜索引擎的一种在线中文查询纠错方法
引用本文:胡 熠,刘云峰,杨海松,张小鹏,段建勇,张 梅,乔建秀. 搜索引擎的一种在线中文查询纠错方法[J]. 中文信息学报, 2016, 30(1): 71-79
作者姓名:胡 熠  刘云峰  杨海松  张小鹏  段建勇  张 梅  乔建秀
作者单位:1. 阿里巴巴(中国)网络技术有限公司, 浙江 杭州 310052;
2. 腾讯公司, 广东 深圳 518057;
3. 北方工业大学 信息工程学院, 北京 100144)
基金项目:国家自然科学基金(61103112);国家社会科学基金(11CTQ036);国家语委十二五规划基金(YB125-10);北京市哲学社会科学规划基金(13SHC031)
摘    要:该文主要解决中文搜索引擎的查询纠错问题。错误的查询,已经偏离用户真实的搜索意图时,搜索质量很差,甚至导致搜索结果数为零。为此该文提出了一种服务于实际搜索引擎,较为完整的查询纠错方案。该文重点描述了纠错查询候选生成、纠错查询候选评价、以及基于核函数,挑选最优纠错查询候选等内容。通过在开放测试集上的准确率/召回率验证,以及在搜索引擎中实际的DCG评测,该文的方案都取得了较好的效果。

关 键 词:中文查询纠错   多特征   核函数排序
  

An Online System for Chinese Query Correction in Search Engine
HU Yi,LIU Yunfeng,YANG Haisong,ZHANG Xiaopeng,DUAN Jianyong,ZHANG Mei,QIAO Jianxiu. An Online System for Chinese Query Correction in Search Engine[J]. Journal of Chinese Information Processing, 2016, 30(1): 71-79
Authors:HU Yi  LIU Yunfeng  YANG Haisong  ZHANG Xiaopeng  DUAN Jianyong  ZHANG Mei  QIAO Jianxiu
Affiliation:1. Alibaba Inc, Hangzhou, Zhejiang 310052, China;
2. Tencent Inc, Shenzhen, Guangdong 518057, China;
3. College of Information Engineering, North China University of Technology, Beijing 100144,China
Abstract:The focus of this paper is to deal with the problem of Chinese query correction in a real world search engine. A wrong query usually confuses a search engine. We propose a complete approach to correct Chinese query in our search engine, which includes query candidates creating, query candidates evaluation and ranking by kernel based methods. After being experimented in the test set through precision/recall performance and proved in our search engine via DCG performance, the approach achieves good effects.
Keywords:Chinese query correction   multi features   Kernel Function Ranking  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号