首页 | 官方网站   微博 | 高级检索  
     

基于统计方法的面向旅游问句分类实验研究
引用本文:张雪芬,李德玉,王素格,南瑞贤.基于统计方法的面向旅游问句分类实验研究[J].电脑开发与应用,2009,22(1):14-16.
作者姓名:张雪芬  李德玉  王素格  南瑞贤
作者单位:1. 山西大学计算机与信息技术学院,太原,030006
2. 山西大学数学科学学院,太原,030006
基金项目:国家自然科学基金,教育部科学技术研究重点项目,山西省自然科学基金,山西省高等学校科研开发基金,山西省科技攻关项目 
摘    要:根据旅游领域知识的特点,设计了面向旅游问句的分类体系。利用信息增益、互信息、交叉熵和X^2统计四种特征选择方法及支持向量机分类器,对网上常见的旅游真实问句分类进行了实验研究,实验结果表明:在现有问句分类体系下,信息增益的特征选择方法在特征空间维数为550维时,分类旅游问句的结果是最佳的。

关 键 词:旅游问句分类  特征选择  支持向量机

An Empirical Study on Questioning Sentence Classification for Tour Domain based on Statistic Methods
Zhang Xuefen et al.An Empirical Study on Questioning Sentence Classification for Tour Domain based on Statistic Methods[J].Computer Development & Applications,2009,22(1):14-16.
Authors:Zhang Xuefen
Affiliation:Zhang Xuefen et al
Abstract:In this paper,a question classification system is developed according to the knowledge characteristic of travel-domain.Using the four kinds feature selection methods which are Information Gain,Mutual Information,Cross Entropy and χ2 Statistics and support vector machine,this paper presents an empirical study on question sentence classification for tour domain.The experiments show that using the feature selection of Information Gain with 550 dimensions,the classification results are best.
Keywords:tour question sentence classification  feature selection  support vector machine
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号