期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	21篇
免费	0篇
国内免费	2篇

学科分类

工业技术

23篇

出版年

2010年	1篇
2008年	1篇
2007年	2篇
2006年	5篇
2005年	3篇
2004年	2篇
2003年	5篇
2002年	1篇
1999年	1篇
1992年	1篇
1990年	1篇

排序方式： 共有23条查询结果，搜索用时 15 毫秒

1 [2] [3] 下一页 » 末页»

基于特征串的大规模中文网页快速去重算法研究 总被引：16，自引：1，他引：16

吴平博陈群秀马亮《中文信息学报》2003,17(2):29-36

网页检索结果中,用户经常会得到内容相同的冗余页面,其中大量是由于网站之间的转载造成。它们不但浪费了存储资源,并给用户的检索带来诸多不便。本文依据冗余网页的特点引入模糊匹配的思想,利用网页文本的内容、结构信息,提出了基于特征串的中文网页的快速去重算法,同时对算法进行了优化处理。实验结果表明该算法是有效的,大规模开放测试的重复网页召回率达97.3% ,去重正确率达99.5%。相似文献

基于事件框架的事件相关文档的智能检索研究 总被引：7，自引：2，他引：7

吴平博陈群秀马亮《中文信息学报》2003,17(6):26-30,59

在事件相关文档的检索中,事件主题的迁移和分化与相似事件的干扰是影响系统性能的两个主要因素。本文提出了一种基于事件框架知识和事件主体信息的检索方法。该方法对事件相关评价函数进行了的改进:首先,从事件语料中提炼出事件的框架知识、从事件文档中挖掘出表达事件主体的信息,然后将这些知识和信息进行向量化,最后利用向量化的结果对相关度评价函数进行优化。实验结果表明该方法是有效的,明显提高了事件相关文档的检索性能。相似文献

基于规则和统计的中文自动文摘系统 总被引：6，自引：2，他引：6

傅间莲陈群秀《中文信息学报》2006,20(5):12-18

自动文摘是自然语言处理领域里一个重要课题,本文在传统方法基础上提出了一种中文自动文摘的方法。在篇章结构分析里,我们提出了基于连续段落相似度的主题划分算法,使生成的文摘更具内容全面性与结构平衡性。同时结合了若干规则对生成的文摘初稿进行可读性加工处理,使最终生成的文摘更具可读性。最后提出了一种新的文摘评价方法(F-new-measure)对系统进行测试。系统测试表明该方法在不同文摘压缩率时,评价值均较为稳定。相似文献

一种基于遗传算法的主题划分方法

傅间莲陈群秀《计算机工程》2006,32(11):209-210,218

提出了一个通过建立段落向量空间模型，根据遗传算法进行文本主题划分的算法，解决了文章的篇章结构分析问题，使得多主题文章的文摘更具内容全面性与结构平衡性。实验结果表明，该算法对多主题文章的主题划分准确率为89.3％，对单主题文章的主题划分准确率为94.6％。相似文献

面向多语言的机器翻译支撑环境设计与实现 总被引：1，自引：0，他引：1

魏勇鹏陈群秀《中文信息学报》2004,18(3):10-17

在日汉机器翻译系统由DOS移植到Windows环境后,针对进一步扩充资源和调试开发过程中遇到的词典管理不便、工具使用麻烦、翻译及编辑界面不友好、日志维护不完善等问题,我们开发了面向多语言的机器翻译支撑环境子系统。该子系统实现了词典资源管理、翻译界面、开发工具集成、系统日志维护等功能,在编码上兼容Unicode,在调用原系统翻译功能和开发工具时使用动态链接库技术,以期成为一个面向多语言的、可为不同机器翻译系统所用的开发调试支撑环境。相似文献

多策略汉日机器翻译系统中的核心技术研究 总被引：1，自引：0，他引：1

杜伟陈群秀《中文信息学报》2008,22(5):60-66

多策略的机器翻译是当今机器翻译系统的一个发展方向。该文论述了一个多策略的汉日机器翻译系统中各翻译核心子系统所使用的核心技术和算法,其中包含了使用词法分析、句法分析和语义角色标注的汉语分析子系统、利用双重索引技术的基于翻译记忆技术的机器翻译子系统、以句法树片段为模板的基于实例模式的机器翻译子系统以及综合了配价模式和断段分析的机器翻译子系统。翻译记忆子系统的测试结果表明其具有高效的特性;实例模式子系统在1 559个句子的封闭测试中达到99%的准确率,在1 500个句子的开放测试中达到85%的准确率;配价模式子系统在3 059个句子的测试中达到了89%的准确率。相似文献

日汉机器翻译系统的完善与改进

张捷陈群秀《计算机工程》2003,29(6):116-117

对于机器翻译系统的配价翻译部件来说，提出的日汉机器翻译系统主要研究和解决的关键技术有：(1)捆绑规则的调整和生成规则的调整；(2)对省略句子的翻译的调整。该文介绍了各部分改进完善处理过程。相似文献

现代汉语语义资源用于短语歧义模式消歧研究

王锦陈群秀《中文信息学报》2007,21(5):80-86

现代汉语存在着许多歧义短语结构,仅依靠句中词性标记无法获得词与词之间正确的搭配关系。本文研究了大量包含歧义的短语实例,分析了计算机处理汉语结构时面临的定界歧义和结构关系歧义问题,在已有短语结构规则的基础上归纳出了七种结构歧义模式,提出了分析歧义模式的关键是四种基本搭配信息的判断,并实现了基于语义知识和搭配知识的消歧算法。对887处短语进行排歧的实验结果表明,处理短语结构的正确率由82.30%上升到87.18%。相似文献

基于时空分析的线索性事件的抽取与集成系统研究 总被引：6，自引：0，他引：6

吴平博陈群秀马亮《中文信息学报》2006,20(1):23-30

信息抽取技术能够提供高质量的检索服务。本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成。系统中采用了如下的方法、策略: (1) 利用句型模板构造抽取规则,然后直接从经过时间短语和空间短语识别和规范化处理的文本中抽取事件信息,从而跳过了深层句法分析,降低了实现系统的难度; (2) 利用事件的规范化的时空信息关联不同文档中的同一事件,进行事件合并; (3) 文档发生事件转移时对文档进行事件切分,从而解决了文档内不同事件信息的归并问题。初步实验结果表明:本文采用的方法和策略是有效的。相似文献

10.

日汉机器翻译系统中的多Agent研究 总被引：1，自引：2，他引：1

张捷陈群秀《中文信息学报》2003,17(1):7-12

机器翻译系统提高译文质量是一个关键性的难题。本文探讨如何在多方法的机器翻译系统中引入多Agent组织结构,并提出一种多层次多Agent组织结构 - 类工程组织结构,使用登记表通讯策略。该组织结构应用在多翻译方法的日汉MTS中,使翻译质量有了较大的改善。相似文献

1 [2] [3] 下一页 » 末页»