从客户评论中识别命名实体——基于最大熵模型的实现 |
| |
作者姓名: | 余传明 黄建秋 郭飞 |
| |
作者单位: | 中南财经政法大学信息与安全工程学院;上海理工大学管理学院; |
| |
基金项目: | 国家自然科学基金资助项目“Web2.0环境下基于本体学习的观点挖掘研究”(项目编号:70903047); 上海市重点学科建设项目“系统分析与集成”(项目编号:S30501)的研究成果之一 |
| |
摘 要: | 介绍命名实体识别的基本概念,分析两种命名实体识别的基本方法:基于规则的命名实体识别方法和基于统计的命名实体识别方法,并以最大熵模型为理论基础,对中文菜名识别进行实证研究。根据中文命名实体的特点,设计6种特征模板。实验结果表明,在简单特征模板的基础上增加标注特征能有效提高命名实体的识别效果。对改进识别效果有用的特征依次为:标注特征、词性组合特征、后向词性依赖特征和词形特征。
|
关 键 词: | 命名实体识别 最大熵模型 客户评论 文本挖掘 |
本文献已被 CNKI 等数据库收录! |
|