首页 | 官方网站   微博 | 高级检索  
     

基于句类特征的作者写作风格分类研究
引用本文:张运良,朱礼军,乔晓东,张全.基于句类特征的作者写作风格分类研究[J].计算机工程与应用,2009,45(22):129-131.
作者姓名:张运良  朱礼军  乔晓东  张全
作者单位:1. 中国科学技术信息研究所,北京,100038
2. 中国科学院声学研究所,北京,100080
基金项目:国家重点基础研究发展规划(973)(the National Grand Fundamental Research 973 Program of China under Grant No.2004CB318104):国家"十一五"科技支撑计划项目资助 
摘    要:不同作家的作品有自己的特点,这些特点体现在词汇、句型、修辞手法等各个方面,尝试使用句类特征进行作者写作风格分类,进一步可以用于作者的识别。利用向量空间模型,以句类作为特征,并通过混合句类分解等技术对句类向量空间降维,使用itc算法对特征项进行权重计算,KNN算法进行分类并利用集成判决技术,形成作者写作风格分类器。本分类器的性能在近现代小说的按作者写作风格的分类和鉴别方面的性能是可以接受的,并有进一步提升的可能。

关 键 词:文本分类  作者写作风格  句类  向量空间模型  概念层次网络(HNC)理论  自然语言理解
收稿时间:2008-10-22
修稿时间:2008-11-26  

Research on text authorship categorization based on sentence category features
ZHANG Yun-liang,ZHU Li-jun,QIAO Xiao-dong,ZHANG Quan.Research on text authorship categorization based on sentence category features[J].Computer Engineering and Applications,2009,45(22):129-131.
Authors:ZHANG Yun-liang  ZHU Li-jun  QIAO Xiao-dong  ZHANG Quan
Affiliation:ZHANG Yun-liang1,ZHU Li-jun1,QIAO Xiao-dong1,ZHANG Quan21.Institute of Scientific & Technical Information of China,Beijing 100038,China 2.Institute of Acoustics,Chinese Academy of Sciences,Beijing 100080,China
Abstract:There is a lot of difference in the composition style of different authors and the difference can be discovered by features of word,sentence pattern,rhetoric etc.In this paper,sentence category features are adopted for text categorization and author recognition.This paper uses sentence category vector space model,sentence category features,mixed sentence categories dimensionality reduction,itc weighting method,KNN algorithm and integration decision method to build an authorship classifier.The performance of...
Keywords:text classification  authorship  sentence category  Vector Space Model( VSM )  Hierarchical Network of Concepts( HNC )theory  nature language processing
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号