排序方式: 共有27条查询结果,搜索用时 0 毫秒
1.
2.
3.
4.
目前的视听语音分离模型基本是将视频特征和音频特征进行简单拼接,没有充分考虑各个模态的相互关系,导致视觉信息未被充分利用,分离效果不理想。该文充分考虑视觉特征、音频特征之间的相互联系,采用多头注意力机制,结合卷积时域分离模型(Conv-TasNet)和双路径递归神经网络(DPRNN),提出多头注意力机制时域视听语音分离(MHATD-AVSS)模型。通过音频编码器与视觉编码器获得音频特征与视频的唇部特征,并采用多头注意力机制将音频特征与视觉特征进行跨模态融合,得到融合视听特征,将其经DPRNN分离网络,获得不同说话者的分离语音。利用客观语音质量评估(PESQ)、短时客观可懂度(STOI)及信噪比(SNR)评价指标,在VoxCeleb2数据集进行实验测试。研究表明,当分离两位、3位或4位说话者的混合语音时,该文方法与传统分离网络相比,SDR提高量均在1.87 dB以上,最高可达2.29 dB。由此可见,该文方法能考虑音频信号的相位信息,更好地利用视觉信息与音频信息的相关性,提取更为准确的音视频特性,获得更好的分离效果。 相似文献
5.
兴隆局汪庄煤矿采用风电闭锁新方法自煤炭部要求矿井局部通风应加装风电闭锁后,汪庄煤矿长期采用局扇控制开关与动力线路120闭锁开关电气联锁实现停风断动电力的方法。但由于该矿2742区域掘进巷道长,敷设17kw输送机11部,用原120闭锁开关控制,经常出现... 相似文献
6.
水坠坝也叫泥浆自流式冲填坝,是我国劳动人民在打坝淤地,建库蓄水,控制水土流失的实践中,创造出来的一种新的筑坝方法。发展速度之快,推广数量之广,都是空前的。据不完全统计,我国南北方十一个省(区)已建成坝高15米以上的水坠坝(包括淤地坝)近万座,发挥了显著的增产减沙效益,积累了丰富的设计施工、观测经验。本文根据实践经验及调查研究成果,就水坠坝施工期的现场观测技 相似文献
7.
8.
基于多重分形和Contourlet变换的盲水印算法研究 总被引:3,自引:0,他引:3
研究提出了一种多重分形和Contourlet变换相结合的图像水印新算法。首先对图像进行Contourlet多层分解,得到一系列多尺度、局部化、多方向的子带图。然后通过能量大小选取嵌入子带和协助子带。嵌入水印时,通过低频子带的多重分形特性参数,自适应的确定水印嵌入强度,并通过一定的算法将水印信息嵌入到Contourlet域。最后通过Contourlet反变换得到嵌入水印后的图像。水印提取时,不需要原始图像,实现了水印盲提取。实验结果表明,该算法在满足不可见性的条件下,能够较好的抵抗JPEG压缩、加噪等一些常见攻击。 相似文献
9.
10.
园林绿化中,水的因素非常重要.直接影响到景观的表现效果。作为园林绿化企业,我们更希望专业灌溉公司来承建相关的灌溉工程。并提供专业服务:但目前灌溉市场确实比较混乱,不同的企业对同一项灌溉工程的报价千差万别。作为行业外人士由于没有参考依据.我们在选择时一片茫然,尤其在大项目的合作中会有所顾虑。虽然在几个项目合作过程中,我们对所选择的灌溉企业提供的产品技术及售后服务感到非常满意,但仍然觉得心里没底,现在欣闻灌溉行业建立了资质标准,开展了等级评定工作,我们为之庆幸。对于灌溉行业来说,这是一件大事,也是一项非常必要的工作。 相似文献