基于文本挖掘和网络分析的“东突”活动主要特征研究 |
| |
引用本文: | 付举磊,刘文礼,郑晓龙,樊瑛,汪寿阳.基于文本挖掘和网络分析的“东突”活动主要特征研究[J].自动化学报,2014,40(11):2456-2468. |
| |
作者姓名: | 付举磊 刘文礼 郑晓龙 樊瑛 汪寿阳 |
| |
作者单位: | 1.国防科学技术大学信息系统与管理学院 长沙 410073; |
| |
基金项目: | 国家自然科学基金(71103180;91124001)资助@@@@Supported by National Natural Science Foundation of China |
| |
摘 要: | 开源情报是反恐研究的一种新数据源,内容十分丰富且获取与分析技术日益成熟.目前,基于开源情报的反恐方面的研究成果已彰显出巨大应用前景.本文以“东突”分裂活动为研究对象,利用网络爬虫从万维网中获取相关文本数据,采用文本分析方法从这些数据中抽取“东突”分裂活动中涉及的人员、组织、时间和地点四要素,依据概念之间的关联关系构建多模元网络.首先 采用元网络分解法将多模元网络分解成单顶点子网络和二分子网络,通过对各个子网络进行中心性分析判别各类节点的重要性; 然后综合各个子网络的中心性指标形成人员、组织、时间和地点四类节点的重要性综合指数(Importance composite index,ICI).随后,进一步采用k-壳分解法直接对多模元网络进行分解,判别出元网络中的核心节点.经对比分析,发现本文的研究结果与实际结果吻合较好.
|
关 键 词: | 数据挖掘 社会网络分析 文本分析 “东突” |
收稿时间: | 2013-10-23 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《自动化学报》浏览原始摘要信息 |
|
点击此处可从《自动化学报》下载全文 |
|