首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
大数据具有体量大、种类丰富、增长速度快等特点,同时也存在价值密度低、代表性差等问题,为抽样调查带来了机遇与挑战.大数据背景下的抽样如何适应新的变化、具有怎样的发展和应用?文章从三个角度进行了讨论.一是在数据流环境下产生了一些适应性强的新型抽样方法,能够高效、准确地获得有代表性样本,并兼顾存储空间、处理的时间与能力.二是...  相似文献   

2.
大数据背景下,对于抽样调查的必要性和重要性,目前还存在一定争论.文章定义了两种类型的大数据场景,一种是现有数据量海量的情况;另一种是现有抽样框名录海量的情况.对于抽样框名录海量的情况下,抽样调查既必要又重要.文章基于某平台类企业的海量抽样框名录,对该平台类企业关心的问题采用目录抽样的方法进行抽样调查研究,并考虑了样本轮...  相似文献   

3.
我们不得不面临一场新的挑战——即大数据技术时代的到来.生活在这个时代背景下的学生可以从网络上找到任何他们需要的信息,即使一个很难的题目,可以通过专门的APP或利用手机拍照传到解题网站等途径轻松找到答案.长此以往,学生学习数学知识的积极性下降,尤其到了高三,学生的基础  相似文献   

4.
关于我国2010年人口普查事后质量检查样本量测算的建议   总被引:1,自引:0,他引:1  
同以往历次进行的人口普查一样,我国在2010年第六次人口普查后也将进行事后质量检查。样本量估计是抽取事后质量检查样本之前必须要做的一项工作。本人建议,用2000年人口普查事后质量检查样本资料估计其抽样方案的设计效应,然后用这个设计效应估计2010年在既定精度要求下所需要的样本量。  相似文献   

5.
随着移动支付在近几年的崛起,电商平台利用大数据“杀熟”的现象愈发频繁,引发了社会各界人士的广泛关注。自深圳经济特区在今年首次提出数据确权的概念,个人数据保护在我国开始步入实质性阶段。为探讨数据确权背景下大数据“杀熟”的治理机制,本文建立了以政府、消费者和电商平台为主体的三方演化博弈模型,并得出以下结论:(1)消费者是否比价是大数据“杀熟”的关键;(2)在演化稳定的条件下,政府的策略选择取决于其在市场监管和促进数据权利发展方面投入的成本;(3)政府惩罚对电商平台大数据“杀熟”行为具有抑制作用,且惩罚越严厉,抑制作用越强;(4)消费者行使个人数据权利能够抑制大数据“杀熟”行为。最后,本文据此提出了相应的对策建议。  相似文献   

6.
为解决传统的支持向量回归模型在处理大规模数据时计算效率较低的局限,文章将交互有效方法与支持向量回归模型相结合,提出了基于交互有效方法的分布式支持向量回归模型(CE-SVR).该模型首先采用分布式存储方式将大规模数据随机分配给多台机器,其次采用交互有效方法构建支持向量回归的近似损失函数替代全局损失函数获得近似预测结果,能够有效地分析大规模数据.数值模拟和应用研究的结果表明:在线性模型中,文章所提出模型的预测性能与全局支持向量回归模型基本一致,且显著优于基于单轮型方法的分布式支持向量回归模型(OS-SVR);在非线性模型中,文章所提出模型的预测性能会随着机器数的增加而降低,但其预测性能显著优于OS-SVR模型.  相似文献   

7.
《大学数学》2020,(4):60-67
大数据时代,以数据为载体的人工智能技术渗透到社会的各行各业,而人工智能技术的发展越来越依赖应用数学学科的进步.在此背景下,大学数学教学改革成为必需,以适应社会新时代的发展.结合自身的教学改革实践,探讨如何从基本的大学数学内容出发,进行拓展,向学生介绍前沿的人工智能技术.从而,增加数学课程教学的趣味性和实用性,加深学生对数学思想方法在人工智能领域应用理解.  相似文献   

8.
对居民家庭进行抽样调查时,常常出于隐私或缺乏专业知识背景的原因,使得居民对被调查的经济变量不愿或无法给出准确值,从而影响调查数据的质量.在此情况下,国外知名的调查(如,美国的消费金融调查)会将调查变量的取值范围划分成一系列连续的、长度不等的区间,请受访者选择,以此来消除受访者的戒备和疑虑心理,收集家庭的经济变量的信息,但这种区间的划分是一种经验划分.从降低数据分析误差的角度提出了一种优化区间长度的设计思路,利用遗传算法给出了问题求解的方法,最后通过一个实际例子加以说明.方法对提高调查变量的数据质量颇有帮助.  相似文献   

9.
商品需求预测对于电商企业意义重大,对阿里电商平台的交易数据进行挖掘以获取有效特征,利用特征建立模型对未来两周这些商品的需求进行动态预测,并基于预测结果和成本最小的原则提出分仓规划建议.预测模型选择随机森林做回归,然后在残差分析的基础上建立报童模型求解分仓的库存规划.对特征数量众多的电商交易数据挖掘所建立的模型有助于电商企业进行有效的商品需求预测并据此制定成本更低的分仓规划.  相似文献   

10.
对不完全2×2列联表中关于风险比(RR)的假设检验问题,使用基于约束性极大似然估计下的Wald检验统计量和对数变换检验统计量,导出了满足预先给定功效的样本量公式.模拟结果验证了所给检验和样本量公式的合理性,实例分析解释了上述方法的应用.  相似文献   

11.
本文针对水运运输特点,通过对实际资料的分析和计算,对水运运输量的抽样方法作分析比较,提出利用PPS抽样进行我国水路运输量的抽样抽查。  相似文献   

12.
为了降低过程控制成本和提高监控效率,针对质量特性值不服从正态分布的情况,研究可变抽样区间和样本容量(VSSI)的指数加权移动平均(EWMA)控制图的经济设计问题。首先对监控非正态分布的EWMA控制图进行抽样区间和样本容量变化设计;其次建立VSSI非正态EWMA控制图的经济模型,通过使费用成本函数最小得到控制图的最优设计参数组合;然后给出工业中的一个例子,用遗传算法对经济模型搜寻最优解;接下来对经济模型进行灵敏度分析,得出控制图费用参数与设计参数之间的影响关系;最后通过最优性分析,得出所建立的VSSI非正态EWMA控制图的经济性优于VSI、VSS非正态EWMA控制图。  相似文献   

13.
相比不放回抽样,放回抽样的实施比较简单,操作性强,但缺点在于单元可能被重复抽到,抽出的有效样本量小于等于样本量,不是固定的。本文应用逆抽样的原理,设计了一种放回抽样方法,满足有效样本量固定,并且估计量的性质优良。  相似文献   

14.
本文通过对南宁市烟草公司拟进行的吸烟者调查抽样设计案例的研究,讨论了有限总体概率抽样原理和技术方面某些问题的具体应用。其中包括:抽样单位的选择;总体总值的单位均值估计量和比估计量;总体比率的比估计量;直接写出比估计量方差的法则,等等。在此基础上,进行了案例实证分析。  相似文献   

15.
产品检验中的抽样个数   总被引:1,自引:1,他引:0  
设某批产品 (总体 )的次品率为 p,对总体提出假设H0 :p≤ p0 ,  H1:p >p1其中 0 相似文献   

16.
大型抽样调查总是采用分层多阶段抽样.分层多阶段抽样若采用自加权的抽样设计,则总体总量的估计量形式简单,易于计算.本文提出了分层三阶段及以上抽样的自加权抽样设计方法.  相似文献   

17.
建立了前期和现期总的调查规模即样本容量不一定相等时的样本轮换模型,并求出了给定费用时的最优样本容量及最优轮换率,并分析了3种特殊情况,其中第3种特殊情况正是[1,2]中的有关结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号