首页 | 官方网站   微博 | 高级检索  
     

一种对聊天文本进行特征选取的方法研究
引用本文:李盛瑜,何文.一种对聊天文本进行特征选取的方法研究[J].计算机科学,2007,34(5):202-204.
作者姓名:李盛瑜  何文
作者单位:1. 重庆工商大学,重庆,400067;重庆大学计算机学院,重庆,400044
2. 重庆工商大学,重庆,400067
摘    要:由于网络聊天文本具有结构松散、简短、上下文相关等特点,对其进行特征选取时使用传统的TFIDF(Term Frequency Inverse Document Frequency)算法存在较大缺陷。针对这个问题,本文提出了一种通过聊天主题来确定聊天文本的特征选取范围的方法,并通过实验验证了该方法的有效性。

关 键 词:文本挖掘  聊天文本  TFIDF

A Study on the Method of Feature Selection in Chat Text
LI Sheng-Yu,HE Wen.A Study on the Method of Feature Selection in Chat Text[J].Computer Science,2007,34(5):202-204.
Authors:LI Sheng-Yu  HE Wen
Affiliation:1.Chongqing Technology and Business University, Chongqing 400067;2.College of Computer, Chongqing University,Chongqng 400044
Abstract:Because online chat text is loosely and briefly organized and is context dependent,there are some defects to select features by using traditional TFIDF(Term Frequency Inverse Document Frequency).Aiming at solving the problem,this paper presents a method that the range of feature selection in chat text is obtained by using chat subjects,and the validity of the method is verified through experiment.
Keywords:Text mining  Chat text  TFIDF
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号