排序方式: 共有66条查询结果,搜索用时 0 毫秒
61.
62.
63.
64.
大规模现代汉语标注语料库的加工规范 总被引:14,自引:5,他引:9
北京大学计算语言学研究所在开发了《现代汉语语法信息词典》等语言资源的基础上,又在实施另一项大型语言工程,即对大规模的现代汉语原始语料进行多级加工,目前的加工项目包括词语切分、词性标注(包括动词和形容词的特殊用法) ,并标出专有名词以及短语型的地名、机构名称等等。
规划中的语料库规模约为2700万字。现在已经完成了1400万字的任务,而且质量很高。
要建成高质量的标注语料库,必须制订出完备的加工规范。本文介绍制订加工规范的原则和执行加工规范的经验。 相似文献
65.
66.
本文论述了人类信息处理已经达到信息内容的标准化阶段,信息内容的标准化有赖于自然语言处理中的知识库建设和可扩展标记语言(XML)、资源描述框架(RDF)的融合与发展。 相似文献