排序方式: 共有19条查询结果,搜索用时 15 毫秒
1.
随着计算机和互联网的快速发展,特别是在大数据时代,企业积累了大量有关企业经营、财务等相关数据,变量众多且关系纷繁复杂,如果利用传统的logistic回归建立企业信用风险预警模型往往效果不好.本文在充分考虑变量间的网络结构(Network)关系基础上,提出了网络结构Logistic模型,通过惩罚方法同时实现变量选择和参数估计.蒙特卡洛模拟表明网络结构Logistic模型要优于其他方法.最后,我们将其应用到我国企业信用风险预警中,充分考虑财务指标间的网络结构关系,科学地选择评估指标,构建更加适合我国国情的企业信用风险预警方法. 相似文献
2.
我国在抽样理论和方法中,对抽样框误差的讨论并不多,且涉及定量分析的内容更少。故对抽样框误差进行量化分析有着重要的意义。本文将比较全面地分析抽样框误差,定量测定其对估计量的影响,并提出相对有效的调整控制方法。 相似文献
3.
随着信息技术的发展,数据来源越来越多,一方面可以更加精准、科学地刻画个人信用状况,但另一方面,由于数据来源多、结构复杂等问题,对传统的征信技术带来了挑战。本文提出了基于多源数据融合的个人信用模型,可以同时对多个数据集进行建模和变量选择,同时考虑了数据集间的相似性和异质性。通过模拟实验发现,本文所提出的整合模型在变量选择和分类效果方面都具有明显的优势。最后,将整合模型应用于城市和农村两个数据集的个人信用评分中。 相似文献
4.
针对信用评分中有标记样本获取难度大、成本高的问题,本文提出一种新的基于半监督支持向量机的信用评分模型。通过给未标记样本引入新的参数,使得模型无需满足随机缺失假设,具有良好的适用性。同时,在损失函数中加入半监督部分鼓励有标记样本和未标记样本系数的相似性,从而能够有效融合未标记样本信息,提升估计效果。此外,本文利用Group LASSO进行变量选择,可以充分利用组结构信息,筛选重要变量。通过数值模拟和一个信用卡风险违约预测实例数据证明了所提方法的可行性,以及在变量选择、系数估计和分类预测上的优良效果。 相似文献
5.
异常检测作为一种智能化的数据管控手段,在网络入侵检测、欺诈识别和故障检测等场景中都扮演着重要角色。大数据时代下,数据来源众多,给多源数据集的异常检测建模分析带来了较大挑战。本文将惩罚整合分析的思想应用到异常检测中,通过对不同数据集的模型系数差异进行惩罚,提出了基于多源数据的整合单类SVM异常检测方法。该方法可以同时对多源数据进行异常检测并自动将相似数据集聚为一类,可以大幅减少模型待估参数个数并降低后期维护成本。模拟实验表明,本文提出的方法不仅能准确将数据集聚类,而且模型预测效果优于合并数据集建模和每个数据集单独建模。该方法在某银行网站日志异常检测中也有较好的表现。 相似文献
6.
7.
随着计算机的飞速发展,极大地便利了数据的获取和存储,很多企业积累了大量的数据,同时数据的维度也越来越高,噪声变量越来越多,因此在建模分析时面临的重要问题之一就是从高维的变量中筛选出少数的重要变量。针对因变量取值为(0,1)区间的比例数据提出了正则化Beta回归,研究了在LASSO、SCAD和MCP三种惩罚方法下的极大似然估计及其渐进性质。统计模拟表明MCP的方法会优于SCAD和LASSO,并且随着样本量的增大,SCAD的方法也将优于LASSO。最后,将该方法应用到中国上市公司股息率的影响因素研究中。 相似文献
8.
本文基于CGSS《中国城乡居民生活综合调查》2006年的家庭微观调查数据分析了我国城乡家庭消费支出的分布特征,按有无社会保障把城乡家庭分别分为两组,利用分位数回归方法分别研究了不同消费层次上,社会保障对城乡家庭消费的影响,并利用反事实分析与分位数分解方法对这两组家庭消费差异进行研究。主要结论有:有社会保障家庭人均消费要高于无社会保障家庭人均消费,消费收入弹性呈“几”字型,有社会保障和无社会保障家庭的消费差异主要是由于收入、地产财富等差异造成的。最后,提出了具有针对性的政策建议。 相似文献
9.
突发传染病防控问题是近年来引起社会广泛关注的焦点话题,突发传染病不仅会对人们生命健康造成巨大威胁,还会对经济发展、社会稳定造成严重影响,实现突发传染病的及时预警、实时监控和合理预测对传染病防控有着非常重要的现实意义.本文在传播动力学SEIR(Susceptible Exposed Infectious Removed)模型的基础上,提出动态SEIR(dynamic SEIR)模型来研究突发传染病的传播趋势.该模型不仅可以考虑人口流动对疾病传播的影响,而且可以根据防控干预措施对模型参数进行动态估计,更符合传染病的病毒传播特点,有更好的预测效果.最后,本文提供相应的R软件包dSEIR供研究者使用. 相似文献
10.