共查询到17条相似文献,搜索用时 62 毫秒
1.
基于依存分析改进贝叶斯模型的词义消歧 总被引:4,自引:0,他引:4
词义消歧一直是自然语言处理领域的关键问题和难点之一。目前进行的很多词义消歧研究多采用几个多义词作为实验测试对象,在实际应用方面存在着局限性。本文对大规模真实文本进行了词义消歧研究,采用了基于依存分析改进贝叶斯分类模型的有指导词义消歧方法。该模型充分利用依存句法分析,从句子的内部结构,寻找词语之间支配与被支配的关系,借以确定能够对词语语义构成内在限制的上下文,有效地克服了单纯贝叶斯分类器中无关上下文造成的噪声影响。本实验的开放测试正确率可以达到91.89%,封闭实验正确率可达99.4%,验证了改进模型的有效性。 相似文献
2.
神经网络和贝叶斯网络在汉语词义消歧上的对比研究 总被引:5,自引:0,他引:5
神经网络和贝叶斯网络是两种经典的机器学习方法。本文通过实验考察了这两种网络模型在汉语词义消歧上的应用效果。实验对象是通过特定规则构造的6个伪词。使用伪词可以避免有指导的词义消歧方法中的数据稀疏问题,充分验证词义分类器的实验效果。贝叶斯网络用于词义分类简单高效,模型容易构造,而神经网络的结构则相对复杂,用于词义消歧需要先解决输入问题。实验中采用词间互信息成功构造了神经网络的输入模型,实验效果较为理想。实验数据表明贝叶斯网络比神经网络更适合解决汉语词义消歧问题。但贝叶斯网络的抗噪声能力却明显逊色于神经网络。 相似文献
3.
用基于属性约简的粗集理论找出条件属性的最小属性集.对属性间为不确定因果关系的模式,计算在最大熵情况下发生的概率,通过比较概率来进行模式识别.实例分析和结论部分说明这种方法是有效的. 相似文献
4.
基于最大熵原则和灰度变换的图像增强 总被引:3,自引:0,他引:3
提出了一种利用最大熵原则和灰度变换进行图像对比度增强的方法.在最大熵原则基础上利用条件迭代算法对图像灰度级进行最佳分类,对各分类区域进行相应的灰度变换,根据不同需要选取变换参数,在图像对比度增强同时各区域均衡性也得到很大改善.将利用条件迭代算法计算最大熵多阈值的方法与最小均方误差(LMSE)计算多阈值的方法进行比较,实验结果表明,文中所用方法在迭代次数上大大低于基于最小均方误差算法所需迭代次数,节省了图像处理时间,图像均衡化效果也相对提高. 相似文献
5.
6.
为了提高测量不确定度评定的精度,采用最大熵区间分析方法。首先通过贝叶斯模型结合最大熵算法建立模型;接着对输入量样本信息下限和上限区间的不对称性进行分析,引入Jaynes熵以及引入拉格朗日量得出最短区间;考虑了输入量的不确定度随概率分布的传递过程,最后对输入量样本信息通过划分区间比值来确定被测量的不确定度评定。实验仿真显示该算法计算测量不确定度的区间较小,评定结果更为精确。 相似文献
7.
8.
9.
阐述有源滤波器常用控制策略,建立并联型三相三线制有源滤波器的数学模型,在此基础上结合空间矢量控制算法原理研究建立Matlab/Simulink算法模型,仿真结果表明该控制补偿方案的有效性。 相似文献
10.
11.
Word vector representation is widely used in natural language processing tasks. Most word vectors are generated based on probability model, its bag-of-words features have two major weaknesses: they lose the ordering of the words and they also ignore semantics of the words. Recently, neural-network language models CBOW and Skip-Gram are developed as continuous-space language models for words representation in high dimensional real-valued vectors. These vector representations have recently demonstrated promising results in various NLP tasks because of their superiority in capturing syntactic and contextual regularities in language. In this paper, we propose a new strategy based on optimization in contiguous subset of documents and regression method in combination of vectors, two of new models CBOW-OR and SkipGram-OR for word vector learning are established. Experimental results show that for some words-pair, the cosine distance obtained by the CBOW-OR (or SkipGram-OR) model is generally larger and is more reasonable than CBOW (or Skip-Gram), the vector space for Skip-Gram and SkipGram-OR keep the same structure property in Euclidean distance, and the model SkipGram-OR keeps higher performance for retrieval the relative words-pair as a whole. Both CBOW-OR and SkipGram-OR model are inherent parallel models and can be expected to apply in large-scale information processing. 相似文献
12.
13.
Document processing in natural language includes retrieval, sentiment analysis, theme extraction, etc. Classical methods for handling these tasks are based on models of probability, semantics and networks for machine learning. The probability model is loss of semantic information in essential, and it influences the processing accuracy. Machine learning approaches include supervised, unsupervised, and semi-supervised approaches, labeled corpora is necessary for semantics model and supervised learning. The method for achieving a reliably labeled corpus is done manually, it is costly and time-consuming because people have to read each document and annotate the label of each document. Recently, the continuous CBOW model is efficient for learning high-quality distributed vector representations, and it can capture a large number of precise syntactic and semantic word relationships, this model can be easily extended to learn paragraph vector, but it is not precise. Towards these problems, this paper is devoted to developing a new model for learning paragraph vector, we combine the CBOW model and CNNs to establish a new deep learning model. Experimental results show that paragraph vector generated by the new model is better than the paragraph vector generated by CBOW model in semantic relativeness and accuracy. 相似文献
14.
研究具有自由需求分布的单周期问题。建立基本库存模型,给出期望利润表达式,运用极大熵准则确定需求的最可几分布,从而建立单周期产品库存模型,并得出最优订货批量。利用算例将该模型与Scarf订货规则和正态分布假设进行比较。结果表明,基于极大熵准则的库存模型能够获得更多的期望利润。 相似文献
15.
目的目前各种印刷质量评价模型均有一定的局限性,提出一种新的印品评价模型,以有效准确地判断印品的质量。方法利用熵权法解决参数之间的平衡性问题,确定5个参数的加权分别为0.2,0.25,0.2,0.17,0.19,同时参照ISO印刷标准,确定最终的印刷品正态评价集,选取5个基本印刷参数进行云模型的计算。结果 5种样品的印品质量评价最大隶属度分别为0.7800,0.7038,0.7257,0.6105,0.3870,由此得出印刷品的五级制等级分别为优、中、中、优和优,用于衡量印刷品的质量。结论运用熵权法加权后的云模型充分考虑印刷品评价的主观性与客观性的统一,评价出印品质量的等级更加客观有效,与topsis方法的结论保持一致,说明了模型的有效性和准确性,同时云模型更利用分析印刷机械的印刷特征,为印刷操作人员提供相应的理论指导。 相似文献
16.
17.
天文导航方法已经成为深空探测必备的导航方法.为了实现对深空探测器的姿态控制,必须准确知道深空探测器当前时刻的姿态.根据深空探测器机载的两个星敏感器跟踪两颗选定的已知恒星,测量出当前时刻相对初始时刻这两个恒星星光矢量在深空探测器机体坐标系中的角度变化量,通过姿态变换矩阵转换和公式推导,给出了确定深空探测器当前时刻姿态角的解析算法,从而为探测器的姿态控制提供准确的姿态数据.通过仿真结果验证了此方法的正确性和有效性. 相似文献