共查询到10条相似文献,搜索用时 46 毫秒
1.
2.
人类行为识别作为视频分类中的重要问题,成为计算机视觉中的热门话题.由于卷积神经网络(CNN)的几何结构固定统一,这将会使得其几何变形建模受限,使得行为识别网络难以鲁棒性的识别行为类别.本文提出了一种融入可形变卷积的行为识别网络模型.首先,引入可形变卷积,构建了一种可协同学习空间外观和时间运动线索的模块,该模块分别学习视频数据3个正交视图特征进行融合;其次,在ResNet网络的基础上,用该模块将其网络中部分关键性卷积模块进行替换,产生一种新颖的改进版本的3D-ResNet网络,用于视频数据集的训练和测试;最后,在UCF101和HMDB51数据集训练和测试,得到识别精度优于现有的大多数先进方法. 相似文献
3.
4.
在采用部分功率训练序列同步的OFDM系统中[1],训练序列会对OFDM承载用户数据的检测造成严重干扰.本文针对每个无线分组包中只有一个OFDM符号,即训练序列和用户数据同时在一个OFDM符号时间内发射,提出一种抑制训练序列干扰的方法,在接收机中分离训练序列、OFDM承载的用户数据.在室内多径衰落信道的条件下,本文分析和仿真了训练序列和OFDM承载用户数据的分离性能,结果表明,分析与仿真结果相近,分离效果明显. 相似文献
5.
针对当前神经网络声学建模中数据混用困难的问题,文中提出了一种基于听感量化编码的神经网络语音合成方法。通过设计听感量化编码模型学习海量语音在音色、语种、情感上的不同差异表征,构建统一的多人数据混合训练的神经网络声学模型。在统一的听感量化编码声学模型内通过数据共享和迁移学习,可以显著降低合成系统搭建的数据量要求,并实现对合成语音的音色、语种、情感等属性的有效控制。提升了神经网络语音合成的质量和灵活性,一小时数据构建语音合成系统自然度可达到4.0MOS分,达到并超过普通说话人水平。 相似文献
6.
本文提出了两种在多媒体CDMA系统中最小化传输时间的动态资源分配方案.对于多媒体业务,当我们让传输时间是可变数据速率的函数时,该方案即可找出当前用户组的最优数据速率集,以使系统的传输时间最小.文中给出并证明了计算最优速率集和对应最小传输时间的方法,归纳了当系统中业务变化时,根据变化的QoS要求和用户数目进行动态资源分配的流程.最后,与最大吞吐量动态资源分配方案进行了比较,给出了三种方案在吞吐量和传输时间上的差异. 相似文献
7.
本文针对广域网环境下的分布式动漫渲染系统,设计并实现了一种基于可视域的3D渲染场景数据的分帧拆分算法.该算法首先将场景中模型的空间包围盒和相机的视椎体进行相交判断和裁剪处理,然后通过保留模型中物体的可见面、剔除不可见部分,达到场景数据拆分、减小场景文件大小的目的.同时给出了该算法基于MaxScript语言针对3DS Max工具制作场景的示例分析,实现了对指定帧范围的场景文件和贴图集的分离,具有“与3D场景兼容性好”、“拆分效果明显”的优点,便于渲染任务的细粒度拆分,为提高渲染系统性能提供了数据支持. 相似文献
8.
本文利用下行MIMO-CDMA系统中到达同一个用户端的所有用户经历的信道相同的特点,提出了一种部分正交的训练序列结构,给出了对信道响应和发射信号幅度分别进行估计的等效信道估计方法.仿真结果表明,采用本文提出的训练序列和等效信道估计方法在几乎不损失系统性能的前提下,能够有效地缩短MIMO-CDMA下行系统的训练序列长度. 相似文献
9.
为有效处理并利用互联网海量的图像和视频数据,提出了一种基于Hadoop云平台的图像分类和标注解决方案。针对如何高效地进行训练集提取这一重要问题,搭建了基于云计算的图像抓取平台,利用互联网的图像资源作为原始数据集,为提取训练集图像提供足够的数据;实现了基于概率潜在语义分析模型的训练集图像提取功能,对原始数据集进行基于主题的聚类,帮助用户快速选取训练集图像;加入了SVM分类模型,利用提取出来的训练集对未标注图像进行分类标注,实现了完整的系统。实验结果表明,该方案能够满足海量图像数据分类和标注的功能和性能需求。 相似文献
10.
传统SVM在训练大规模数据集时,训练速度慢,时间消耗代价大.针对此问题,提出利用FCM算法对训练样本集进行预处理,依据样本隶属度提取出所有可能的支持向量进行SVM训练.利用原始数据集对算法进行验证,此算法在保证SVM分类精度的同时,大大提高了训练速度,算法具有可行性. 相似文献