首页 | 官方网站   微博 | 高级检索  
     

基于词平台汉字编码的自动标引研究
引用本文:焦 慧,刘 迁,贾惠波.基于词平台汉字编码的自动标引研究[J].计算机工程与应用,2007,43(15):173-175.
作者姓名:焦 慧  刘 迁  贾惠波
作者单位:[1]清华大学精密仪器与机械学系,北京100084 [2]精密测试技术及仪器国家重点实验室,北京100084
摘    要:自动标引是基于内容检索的关键技术之一。目前国内的汉语自动标引研究主要集中于汉语自动分词这个前期处理问题上。提出了一种基于词平台的汉字编码方法,建立了一种新的中文计算机文档表达格式,使词成为最小的信息单位,汉语分析无需再进行自动分词,可直接进行自动标引,从而提高自动标引的效率和质量。

关 键 词:自动标引  词平台  汉字编码  自动分词
文章编号:1002-8331(2007)15-0173-03
修稿时间:2006-09

Auto-indexing based on Chinese characters coding on words platform
JIAO Hui,LIU Qian,JIA Hui-bo.Auto-indexing based on Chinese characters coding on words platform[J].Computer Engineering and Applications,2007,43(15):173-175.
Authors:JIAO Hui  LIU Qian  JIA Hui-bo
Affiliation:1.Department of Precision Instruments and Mechanology,Tsinghua University,Beijing 100084,China 2.State Key Laboratory of Precision Measurement Technology and Instruments,Beijing 100084,China
Abstract:Auto-indexing is one of the key techniques of information retrieval based on contents.At present the research on Chinese auto-indexing mainly focuses on automatic segmentation which is a predisposal problem.This paper presents a kind of Chinese characters coding method on words platform,and establishes a new Chinese text format in computer which makes words the smallest information unit.Based on this method,auto-indexing does not rely on segmentation as before.Thereby the efficiency and quality of auto-indexing would be improved.
Keywords:auto-indexing  words platform  Chinese characters coding  automatic segmentation
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号