排序方式: 共有32条查询结果,搜索用时 15 毫秒
1.
2.
概念推理网及其在文本分类中的应用 总被引:38,自引:1,他引:37
在分析了当前文本分类中学常用方法的基础上,提出了一种新的分类模型,该模型是对人的分类过程的一种模拟,在已的有英语语义词典及大量训练集的基础上,应用机器学习、数据挖掘等技术进行知识获取并最终形成若干个概念推理网,对待分类的文档可以激活相应的网络,网时传播推理以决定其类别的归属,试验表明:该方法具有较高的分类正确率与召回率。 相似文献
3.
用数据采掘方法获取汉语词性标注规则 总被引:8,自引:0,他引:8
从数据采掘的角度对汉语文本词性标注规则的获取进行研究,在满足用户规定的支持度向量的前提下,先从侯选集模式中挑选出常用模式;然后采掘出具有高可信度的产生式规则。该过程完全是自动的,而获取的规则有表达上是明确的,同时又是隐含在数据中的、用户不易发现的,实验表明:在原有统计方法的基础上,利用自动获得的标注规则作为补充,可以提高词性标注的正确率。 相似文献
4.
5.
长庆油气田区域储层属河流相沉积体系,层间距差异大,呈多层系分布,原油上产的需求,应加大双台阶水平井研究与试验的力度.论文在调研了国内现有双台阶水平井特别是塔里木油田、青海油田施工经验的基础上,分析长庆区域的地质情况和双台阶水平井的施工难点,从钻井工艺、钻井液技术、固井工艺三个方面进行了综合分析,给出了适合长庆区块的双台阶水平井钻井合理化建议. 相似文献
6.
对水冷-气冷复合塔式甲醇合成反应系统进行了模拟计算,确定了甲醇合成回路的主要工艺参数,分析了温度、压力、合成气组成、循环比等对甲醇合成系统的影响,对副产蒸汽量和参数进行了估算。 相似文献
7.
针对Shell粉煤气化工艺技术特点,对在调试、投料期间常出现影响装置连续操作的主要问题进行了研究,结合装置实际情况,提出了解决此类问题的工艺控制优化与改进方案,并对此进行了合理性分析。经过实际应用和检验,优化和改进方案对工艺运行顺畅、保护设备起到了良好的作用,也为气化炉的长周期运行提供了技术保障。 相似文献
8.
9.
文档中词语权重计算方法的改进 总被引:57,自引:5,他引:52
文本的形式化表示一直是文本检索、自动文摘和搜索引擎等信息检索领域关注的基础性问题。向量空间模型(Vector Space Model) 中的tf.idf文本表示是该领域里得到广泛应用并且取得较好效果的一种文本表示方法。词语在文本集合中的分布比例量上的差异是决定词语表达文本内容的重要因素之一,但现在tf.idf方法无法把握这一因素。针对这个问题,本文引入信息论中信息增益的概念,提出一种对tf.idf的改进方法tf.idf.IG文本表示方法。该方法将词语的信息增益作为一个文本表示的一个因子,来衡量词语在文本集合中分布比例在量上的差异。在文本分类实验中,tf.idf.IG文本表示的向量空间模型的分类效果要好于tf.idf方法,验证了改进方法tf.idf.IG的有效性和可行性。 相似文献
10.
近几年随着测量信息的增多,需要应用的技术也越来越多,根据随钻测控技术现状,决定着重研究加强随钻测控技术的精准度和可靠性的提升,随钻环空压力测控技术越来越受到人们的关注,在不同的领域有越来越多的应用,前景十分广阔。尤其是在石油天然气等方面应用更为广泛。本论文主要研究随钻测控技术的现状,以及国外随钻测控技术的发展概况,和未来发展趋势。 相似文献