排序方式: 共有184条查询结果,搜索用时 15 毫秒
1.
现有的距离度量学习算法都是假设训练数据和测试数据服从相同的分布,但是该假设在实际中不一定成立。当训练数据和测试数据的分布不同时,利用训练数据学习得到的度量函数可能难以适用于测试数据。针对上述问题,本文在NCA (Neighbourhood Components Analysis)度量学习方法的基础上,通过引入概率密度比值对目标函数加权,提出了一种采用概率密度比值估计的距离度量学习方法(Distance metric learning with Probability Density Ratio Estimation, DML-PDR)。在UCI数据集和Corel图像库上的KNN分类实验表明,新方法克服了传统度量学习方法的不一致问题,提高了分类的准确率。 相似文献
2.
针对目前连续语音识别解码过程中剪枝阈值的确定不能兼顾解码速度与精度的不足,文中提出一种多维剪枝阈值参数联合优化算法。该算法主要研究全局阈值、词尾阈值、激活模型数、令牌数四维剪枝阈值参数的优化,其优化的主要过程是首先应用多目标优化理论对这四维阈值参数进行联合优化,然后根据优化结果采用分段动态阈值的方法进行后处理。实验结果表明,采用该方法优化后的阈值参数进行一遍解码,解码器的剪枝性能得到明显改善,搜索空间的大小得到有效控制,达到预期的速度与精度权衡的优化效果。 相似文献
3.
传统视觉词典模型没有考虑图像的多尺度和上下文语义共生关系.本文提出一种基于多尺度上下文语义信息的图像场景分类算法.首先,对图像进行多尺度分解,从多个尺度提取不同粒度的视觉信息;其次利用基于密度的自适应选择算法确定最优概率潜在语义分析模型主题数;然后,结合Markov随机场共同挖掘图像块的上下文语义共生信息,得到图像的多尺度直方图表示;最后结合支持向量机实现场景分类.实验结果表明,本文算法能有效利用图像的多尺度和上下文语义信息,提高视觉单词的语义准确性,从而改善场景分类性能. 相似文献
4.
5.
6.
传统话题自动检测一般采用向量空间模型进行文本相似度计算,这种方法单纯依靠特征词进行话题检测,忽略了词之间的概念及由此而引发的概念相似度。针对此问题,文章首先对网络新闻文本进行事件元素提取,并将事件元素特征词分解为概念集合,通过计算概念集合的内积空间得到词之间的相似度,进而根据词相似度计算文本相似度,最后根据概念相似度计算实现话题的自动检测。实验结果表明,本方法能够有效提高话题检测的准确率和召回率。 相似文献
7.
8.
9.
提出了一种基于动态加权的数据选取方法, 并应用到连续语音识别的声学模型区分性训练中. 该方法联合后验概率和音素准确率选取数据, 首先, 采用后验概率的Beam算法裁剪词图, 在此基础上依据候选词所在候选路径的错误率, 基于后验概率动态的赋予候选词不同的权值; 其次, 通过统计音素对之间的混淆程度, 给易混淆音素对动态地加以不同的惩罚权重, 计算音素准确率; 最后, 在估计得到弧段期望准确率分布的基础上, 采用高斯函数形式对所有竞争弧段的期望音素准确率软加权.实验结果表明, 与最小音素错误准则相比, 该动态加权方法识别准确率提高了0.61%, 可有效减少训练时间. 相似文献
10.