面向技术机会发现TOD的专利信息抽取*——韩国科学技术信息研究院KISTI语义服务 |
| |
引用本文: | 周雷,李颖,石崇德.面向技术机会发现TOD的专利信息抽取*——韩国科学技术信息研究院KISTI语义服务[J].情报工程,2015,1(2):031-037. |
| |
作者姓名: | 周雷 李颖 石崇德 |
| |
作者单位: | 中国科学技术信息研究所,中国科学技术信息研究所,中国科学技术信息研究所 |
| |
基金项目: | “面向科技监测的实体识别与关系抽取研究”(编号:71403257) |
| |
摘 要: | 技术机会发现(TOD,Technology Opportunity Discovery)是面向新技术进行监测,并提供机会的一种服务;所谓“基于专利的信息”是指采用自然语言技术对专利进行抽取的结果。本研究的目标资源覆盖过去20年间发表的所有专利,目标信息则是其中产品名称及其部分-整体关系(Part-of relations)。应用基于词典和相似度的命名实体识别、基于模式的关系抽取、以及基于机器学习的信息过滤几项技术,本研究取得了令人鼓舞的效果。
|
关 键 词: | 技术趋势分析,自然语言处理,信息抽取,部分-整体关系,机器学习 |
Patent Information Extraction for Technology Opportunity Discovery |
| |
Authors: | ZHOU Lei LI Ying and SHI Chongde |
| |
Affiliation: | Institute of Scientific and Technical Information of China,Institute of Scientific and Technical Information of China and Institute of Scientific and Technical Information of China |
| |
Abstract: | Technology Opportunity Discovery is a service to detect and provide opportunities for the new technologies. Patent-based information is extracted by natural language processing techniques. All patents published during the past 20 years are target resources and product names and their Part-of relations are target information. A dictionary and similarity-based named entity recognition, a pattern-based relation extraction, and a machine learning-based filtering have been used and showed an encouraging performance. |
| |
Keywords: | Technology trend analysis natural language processing information extraction Part-of relation machine learning |
|
| 点击此处可从《情报工程》浏览原始摘要信息 |
|
点击此处可从《情报工程》下载全文 |