排序方式: 共有35条查询结果,搜索用时 15 毫秒
1.
广义支持向量机优化问题的极大熵方法 总被引:7,自引:0,他引:7
依据最优化理论中的KKT互补条件建立了广义支持向量机的无约束优化模型,并给出了一种有效的光滑化近似解法极大熵方法,为求解支持向量机优化问题提供了一种新途径.该方法特别易于计算机实现,理论分析和数值实验结果表明了模型和算法的可行性和有效性. 相似文献
2.
关于文本特征抽取新方法的研究 总被引:57,自引:1,他引:56
该文研究了已有和最新的各种基于评估函数的特征筛选方法 ,评价了它们的优缺点和适用范围 ,并实现了一种用评估函数代替 TFIDF法中 IDF函数进行分类的新算法。然后进一步从如何放宽特征独立性假设 ,利用等级关系的角度探讨了对特征筛选可能的改善 相似文献
3.
贝叶斯网络的建造及其在数据采掘中的应用 总被引:40,自引:0,他引:40
贝叶斯 (Bayesian)网络近年成为数据采掘引人注目的研究方向。通过剖析 Bayesian网络的结构和建造步骤 ,着重讨论用 Bayesian方法从先验信息和样本数据进行学习以确定网络的结构和概率分布的基本方法 ,分析 Bayesian网络学习的特点 ,探讨 Bayesian网络的适用性。与数据采掘的其它方法相比 ,Bayesian网络的优点是可以综合先验信息和样本信息 ,这在样本难得时特别有用 ;可以发现数据之间的因果关系 ,适合于处理不完整数据集 ,这是其它模型难以做到的。其缺点是计算开销较大 ;确定合理的先验密度比较困难 ;如何判定实际问题是否满足所要求的假设 ,没有现成的规则 相似文献
4.
基于OEM模型的半结构化数据的模式抽取 总被引:5,自引:0,他引:5
Web数据是典型的半结构化数据 ,缺乏明确的、预知的、与数据分离存储的外在模式 ,导致查询、浏览和集成Web数据的效率极低。该文提出一种基于 OEM (objectexchange model)模型的半结构化数据的模式抽取算法 ,采用自顶向下的剪枝策略 ,可快速发现频繁简单路径集 ,应用于半结构化数据的集成及查询回答与优化。其特点是可降低目标模式的规模 ,有效改进模式抽取的效率 相似文献
5.
为了解决负关联规则挖掘中包含负项目的频繁项集数量爆炸问题,引入过频繁项集的概念,证明过频繁项集及其所有超集均不可能产生有趣的关联规则。在频繁项集生成过程中,必须对项集中包含负项目的个数进行限制。使用最小支持度、最大支持度、项集中最多包含负项目的个数2个参数来约束频繁项集生成过程的算法。实验结果表明:所增加的两个参数是必要的,特别是当数据集中所包含的项目个数比较多时,只有恰当地设置两个额外参数,才能够保证挖掘过程的正常进行。 相似文献
6.
用动态Bayesian网络建立宏观经济系统模型 总被引:3,自引:0,他引:3
针对限制动态 Bayesian网络方法应用的 Markov假设和转移概率时不变假设 ,研究了如何利用部分观测信息建立宏观经济系统的 Markov模型以及如何建立转移概率具有时变特性的宏观经济系统模型。对不满足 Markov假设的演化过程 ,通过在模型中添加隐藏变量建立 Markov模型 ,并对 EM- EA算法进行扩展 ,使之用于带隐藏变量的动态 Bayesian网络的学习。对不满足时不变性的转移概率 ,应用多项式拟合方法直接从数据构造时变转移概率模型。理论分析表明了论文方法的正确性和可行性 相似文献
7.
8.
Modified evolutionary algorithm for global optimization 总被引:2,自引:0,他引:2
1 .INTRODUCTIONOptimization problemsoftenariseinscience ,engi neering ,andbusinessapplications .Tosolvevariousoptimizationproblems ,manysolutionsbasedonthegradientorhigher orderstatisticsoftheobjectivefunction ,suchassteepestdescentmethod ,conjugategradie… 相似文献
9.
为了自动将数据从HTML网页中抽取出来,采取树自动机推断方式进行数据抽取.核心思想是将样本网页转化为二叉树并构建出能够接受这些网页二叉树的树自动机,利用所得到的树自动机对待抽取网页的接受和拒绝状态进行数据抽取.该方法充分利用了HTML文档内在的树状结构,设计了简单方便的样本网页标注形式.实验表明,该方法的抽取性能在查全率和F值方面优于其它的一些数据抽取方法. 相似文献
10.
针对实施邻域风险最小化原则的邻域支持向量解算法,根据被错分样本一定是支持向量提出一种利用支持向量删除训练样本中难学习样本的修剪算法;依据最大似然原则对已有的高斯邻域函数参数取值方法进行改进.初步实验表明,训练样本的修剪与邻域函数参数取值方法的改进可明显提高邻域支持向量解算法的泛化能力,比SVM测试准确率提高0.5%左右. 相似文献