期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程.本文首先介绍了文本挖掘的概念,包括文本挖掘的定义、特点、与其它几个研究领域(数据挖掘、信息检索、信息抽取、计算语言学等)的关系;然后讨论了文本挖掘模型、文本特征抽取与中间表示、文本挖掘的分类与实现技术;最后介绍了几个文本挖掘产品. 相似文献

10.

Web文本挖掘系统及聚类分析算法 总被引：2，自引：0，他引：2

朱克斌唐菁杨炳儒《计算机工程》2004,30(13):138-139,183

给出了Web文本挖掘系统WTMS的系统总体结构图，开发并实现了基于SOM的Web文档层次聚类算法。同时结合现代远程教育背景实现了Web文本挖掘的原型系统。该系统可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘，从而帮助人们快速进行文本信息导航，获取重要的知识。相似文献

11.

Web内容挖掘技术研究 总被引：14，自引：4，他引：10

涂承胜鲁明羽陆玉昌《计算机应用研究》2003,20(11):5-9,15

简要介绍了Web挖掘的概念、分类以及其功能,阐述了Web挖掘与传统数据挖掘以及Web信息检索之间的关系。给出了Web内容挖掘的不同分类方法、文本以及多媒体文本数据挖掘的定义、分类与应用。重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等,讨论了多媒体文本分类挖掘方法。相似文献

12.

Web文本挖掘

肖湘萍高玉斌《数字社区&智能家居》2007,2(5):822-823

简要介绍Web挖掘的概念、分类及其功能,重点分析了Web文本挖掘的方法,包括文本的特征表示与抽取、文本的分类与聚类等。最后对Web文本挖掘的应用领域作了展望。相似文献

13.

中文Web文本挖掘系统WebTextMiner开发*

魏松钟义信王翔英《计算机应用研究》2006,23(6):211-213

Web文本挖掘系统的开发对Web文本挖掘的研究有着很大的推进作用。因此在对基于SVM的中文网页分类器性能研究的基础上,根据研究和实用的需要,实现了一个性能较好的中文Web文本挖掘系统。相似文献

14.

文本挖掘技术研究进展* 总被引：21，自引：0，他引：21

袁军鹏朱东华李毅李连宏黄进《计算机应用研究》2006,23(2):1-4

文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。首先给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展。最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景。相似文献

15.

关于分布式、异构、历史遗留数据的数据挖掘研究 总被引：3，自引：0，他引：3

艾迪明齐剑锋涂序彦《计算机工程与应用》2003,39(1):191-194

主要研究在分布式、异构和历史遗留数据库中进行数据挖掘的方法和策略。首先讨论分布式数据库的挖掘方法,在此基础上进行扩展讨论异构数据源的数据挖掘方法;最后,讨论历史遗留数据库的挖掘方法。相似文献

16.

基于WEB文本数据挖掘的研究 总被引：8，自引：0，他引：8

刘晓鹏邢长征《计算机与数字工程》2005,33(9):75-79

万维网是一个巨大的、分布广泛和全球性的信息服务中心,它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其他信息服务。Web文本挖掘系统是挖掘技术的重要应用方向,它是指在给定的分类体系下,根据网页的内容自动判别内容类别的过程。相似文献

17.

基于粗糙集的Web文本挖掘技术

罗洁南风露《数字社区&智能家居》2007,(19)

随着Internet的普及和相关技术的发展,Web上聚集了大量的信息资源.如何从这些Web信息资源中提取有用信息这一问题促使了Web文本挖掘技术的产生.本文首先介绍了粗糙集的相关概念和理论,然后对基于粗糙集的Web文本挖掘技术进行了初步探讨和研究. 相似文献

18.

基于粗糙集的Web文本挖掘技术

罗洁南风露《数字社区&智能家居》2007,(10):148-149,184

随着Internet的普及和相关技术的发展,Web上聚集了大量的信息资源。如何从这些Web信息资源中提取有用信息这一问题促使了Web文本挖掘技术的产生。本文首先介绍了粗糙集的相关概念和理论,然后对基于粗糙集的Web文本挖掘技术进行了初步探讨和研究。相似文献