共查询到20条相似文献,搜索用时 593 毫秒
1.
一种基于名词短语的检索结果多层聚类方法 总被引:2,自引:0,他引:2
为了对检索结果获取高质量的聚类效果,提取名词短语作为候选类别标签,根据候选类别标签分布情况生成基础类,再使用具有线性时间复杂度的一趟聚类算法对基础类进行多层聚类。与NEC,STC和Lingo算法的对比实验表明:该方法在类别标签的可读性、有效性以及聚类性能上都优于以上3种方法。 相似文献
2.
汉语复合名词的语义构成方式 总被引:1,自引:0,他引:1
本文主要是对复合名词和名词短语的语义构成方式进行了深入细致的分析,归纳出若干个语义构成方式小类,为今后对名词短语的语义理解作些必要的前期准备。 相似文献
3.
陈海泳 《邵阳高等专科学校学报》2008,(4):93-95
以转换生成语法框架下的X-阶标理论为理论基础,对实义词短语即名词短语、动词短语、形容词短语、副词短语、介词短语的内部结构特征作了详细分析,并结合实例论证了实义词短语的中间语类X'在消解歧义结构和解释某些语言现象方面的实用价值,从而为语言的结构分析开辟了新的视角和蹊径。 相似文献
4.
汉语复合名词的语义构成方式 总被引:1,自引:0,他引:1
本文主要是对复合名词和名词短语的语义构成方式进行了深入细致的分,归纳出若干个语义构成方式小类,为今后对名词短语的语义理解作些必要的前期准备。 相似文献
5.
滞留介词后存在两种类型的空语类:DP语迹和变项,正是因为这些空语类的存在才使介词滞留,介词总是不单独出现的句子中,其后的补足语不是名词短语、量词短语、名词性的Wh-短语、名词性的非限定性分句等这些显性成分,就是DP-语迹或者变项等陷性成分。介词后带陷性成分时,介词就成了滞留介词,滞留介词后的空语类受滞留介词的题元管辖。 相似文献
6.
数量名短语的识别是识别由数量短语修饰的名词短语左右边界的研究.以往研究中,基于统计学习模型的数量短语识别方法依赖人工特征,需要通过专家知识构建知识库来实现对"数词+量词"短语的识别.本文在以往研究基础上纳入"名词"形成"数词+量词+名词"等八类数量名短语,并采用深度学习方法解决这一边界识别任务.通过BERT模型对原始文... 相似文献
7.
随着"财政悬崖"的流行,"X+悬崖"类复合词逐渐被应用到各个领域。"X+悬崖"类复合词的内部结构越来越复杂,"X"被其他形容词和名词代替。"X+悬崖"类词语整体为名词短语,与运动类动词、含有危急性的名词搭配。依靠语言模因和隐喻类比机制,构建语义丰富的新词汇。对"X+悬崖"类词语的翻译可以采用直译和意译的翻译策略。 相似文献
8.
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比. 相似文献
9.
最大熵和Brill方法结合识别英语BaseNPs 总被引:1,自引:0,他引:1
为了进一步提高基本名词短语(BaseNPs)的识别精度,针对最大熵方法和Brill方法各自的特点,提出基于两者相结合的英语基本名词短语识别算法.该算法是在高准确率词性标注的基础上实现的.在训练和测试两个阶段中,均先采用最大熵方法识别基本名词短语,然后将已具有很高精度的识别结果作为初始标注结果运用于Brill方法中.实验结果表明,此联合算法达到了94%的准确率和召回率,充分融合了最大熵方法和Brill方法的优点,可与基于相同训练和测试语料的目前最理想的英语基本名词短语识别结果相比. 相似文献
10.
曾德光 《佛山科学技术学院学报(自然科学版)》1995,(3)
英语标题式语言文字简练,常用于揭示语、文章和新闻报导的题目、电报及某些应用文体;结构上以名词(或名词短语、名词分句及其他起名词作用的结构)为主;封闭类词的省略、动词的时态和体以及大写规则等有其共性而又各有特点。 相似文献
11.
随着“财政悬崖”的流行,“X+悬崖”类复合词逐渐被应用到各个领域.“X+悬崖”类复合词的内部结构越来越复杂,“X”被其他形容词和名词代替.“X+悬崖”类词语整体为名词短语,与运动类动词、含有危急性的名词搭配.依靠语言模因和隐喻类比机制,构建语义丰富的新词汇.对“X+悬崖”类词语的翻译可以采用直译和意译的翻译策略. 相似文献
12.
宗守云 《广西右江民族师专学报》2012,(1):88-91
"一族"是个类后缀。类后缀"一族"在发展中存在着逆向语法化现象。"一族"逆向语法化的过程是由类后缀独立为词,再由词发展为短语。"一族"的逆向语法化是由于语言内部动因所致,并以适合汉语词汇语法系统的形式和语义为条件。 相似文献
13.
随着计算机技术的迅猛发展,知识变成人工智能领域中的一个重要资源。在面向自由文本的自动知识抽取中,名词短语识别是基础的任务之一,尤其是含动词的名词短语。已有的名词短语识别研究更多地着眼于命名实体的识别,范围较窄且不能解决其他含动词的名词短语,加之含动词名词短语识别存在分词错误、边界确定、特殊结构、标记数据少等难点,含动词名词短语识别目前仍然是一个巨大的挑战。基于此,文章提出了一种神经网络与规则、统计相结合的方法。首先对语句进行预处理,其中包含包括词性、助词、时间、数量词等内容的修正和合并;然后,使用双向LSTM与条件随机场融合的方法对含动词命名实体进行识别;接着使用百度词条、固定搭配、语义分类和描述框架文法的方式对含动词名词短语识别;最后使用随机抽取的多动词文本进行实验和分析,实验结果表明,本文方法达到89%的准确率。 相似文献
14.
一种基于关联规则的搜索引擎结果聚类算法 总被引:4,自引:0,他引:4
提出一种搜索引擎结果的聚类方法,采用关联规则方法确定网页文档中的显著短语,并把这些显著短语作为对相应聚类的描述,聚类中包含的文档就是显著短语所关联的文档,然后对形成的聚类按照相关度分数进行排队,最终把结果展现给用户. 相似文献
15.
名词和定名短语,人们往往把其当做一个整体来看待,对二者的差异关注得不够。经研究发现,二者在成句功能上存在差异:定名短语对语境的依赖性较弱,实现为陈述、感叹、疑问等句类的能力强于名词。更有资格充当复句的分句;名词实现为呼应句的能力则强于定名短语。 相似文献
16.
根据英语名词短语的句法功能,提出了一种新的英语名词短语——功能名词短语,同时与基本名词短语和最长名词短语相比较.利用Google在线翻译系统,对存在结构歧义的句子进行了翻译,发现英汉机器翻译的错误主要是由结构歧义引起的,并应用功能名词短语的定义对结构歧义问题予以解决.实验结果表明,功能名词短语的识别能够有效消解两种结构歧义:一是与动词构成固定搭配的名词引起的歧义;二是"介词+名词"结构是作状语还是作后置定语的歧义.功能名词短语的研究对消除句法结构歧义、提高英汉机器翻译译文质量具有重要意义. 相似文献
17.
18.
网页聚类技术是快速定位搜索引擎返回结果中用户最需要资料的方法。基于后缀树聚类算法是利用网页集中共享的短语来对网页集进行聚类。本文研究怎样充分利用后缀中的共享短语之间的关系提高后缀树性能的方法。 相似文献
19.
陈彩蒂 《厦门理工学院学报》2010,18(2):103-107
用光杆短语结构理论分析英语和汉语中的生成性名词短语,认为汉语中的一部分"的"字结构、"者"字结构和英语中的"the+形容词"、"the+分词"以及"通过词缀名词化的短语"都是生成性的名词短语,它们都可以被描述为限定词短语,限定词短语具有名词性。在这项研究中英语与汉语呈现共性,名词短语与句子也呈现共性。 相似文献
20.
聚类系数指标对复杂网络鲁棒性的影响分析 总被引:1,自引:0,他引:1
分析了采用度分布相同且聚类系数不同的三种类型网络(中性网络、同配网络和异配网络)在遇到随机故障或者蓄意攻击时,网络的初始聚类系数变化对网络鲁棒性的影响.实验分析表明,网络的初始聚类系数越大,网络在受到随机故障或蓄意攻击时网络中最大连通子图的直径和网络中最大连通子图的平均路径长度的起伏也就越大.初始聚类系数的变化在异配网中对网络鲁棒性的作用最明显,中性网次之,对同配网的鲁棒性不明显. 相似文献