首页 | 官方网站   微博 | 高级检索  
     

互联网文本蕴含道路交通信息抽取的模式匹配方法
引用本文:仇培元,张恒才,陆锋.互联网文本蕴含道路交通信息抽取的模式匹配方法[J].地球信息科学,2015,17(4):416-422.
作者姓名:仇培元  张恒才  陆锋
作者单位:1. 中国科学院地理科学与资源研究所 资源与环境信息系统国家重点实验室, 北京 1001012. 中国科学院大学, 北京 100101
基金项目:国家“863”计划课题(2012AA12A211、2013AA120305)
摘    要:互联网页面和社交网络文本中蕴含丰富的道路交通信息,是其他交通信息采集平台的有效补充。然而,自然语言文本形式的交通信息多以线性参考或地标方位描述交通事件空间位置,且大量存在事件元素缺失或隐含现象,对交通信息的自动化抽取有着较大影响。考虑到交通信息的自然语言表达方式虽然自由随意,但表达模式相对固定,提出一种从互联网文本中抽取道路交通信息的模式匹配方法。首先,基于道路交通事件描述的语言特征构建模式库;然后,以特征词词性序列的形式表达互联网文本和抽取模式,利用DTW距离度量序列相似度,实现抽取模式匹配;最后,在匹配抽取模式和填补规则指导下获取结构化的道路交通信息。由上海市城市交通相关门户网站和微博客平台的实验过程显示,本文所提出的模式匹配方法,抽取道路交通信息的准确率和召回率分别达到90%和80%以上,表明该方法能有效抽取互联网文本蕴含的道路交通信息,且实现过程相对简单,易于扩展,具有可用性。

关 键 词:互联网文本  道路交通信息  模式匹配  DTW距离  信息抽取  
收稿时间:2014-05-04

A Pattern Matching Method for Extracting Road Traffic Information from Internet Texts
QIU Peiyuan;ZHANG Hengcai;LU Feng.A Pattern Matching Method for Extracting Road Traffic Information from Internet Texts[J].Geo-information Science,2015,17(4):416-422.
Authors:QIU Peiyuan;ZHANG Hengcai;LU Feng
Affiliation:1. State Key Lab of Resources and Environmental Information System, IGSNRR, CAS, Beijing 100101, China2. University of Chinese Academy of Sciences, Beijing 100101, China
Abstract:
Keywords:Internet text  road traffic information  pattern matching  DTW  information extraction  
本文献已被 CNKI 等数据库收录!
点击此处可从《地球信息科学》浏览原始摘要信息
点击此处可从《地球信息科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号