排序方式: 共有85条查询结果,搜索用时 312 毫秒
21.
如今,信息的生产已经从以前的媒体专业生产,转变为专业媒体、各类机构以及公众共同参与。媒体融合不断演变为专业媒体与自媒体、人的媒体与机器学习以及它们之间相互的融合。①推进深度融合成为各级各类传统主流媒体的重要任务,传统主流媒体的客户端,也由新闻内容发布平台变为聚合平台,聚拢来自各个方面的新闻内容和信息,构建全新影响力。其中重要的手段,就是打造以“××号”为名称的分类内容入驻、发布、分发平台。 相似文献
22.
支持向量机在文本自动分类中的应用研究 总被引:3,自引:0,他引:3
针对数据挖掘中的文本自动分类问题,提出了一种基于支持向量机的分类方法。构造了可用于多个模式类识别的多层级连式SVM模型,该模型可完成对多个模式的分类识别。根据训练样本的分类体系完成对模型的构造之后,即可应用于实际文档的自动分类。文中给出了该模型的构造及应用的方法,用两种核函数作为内积回旋方案,以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性。 相似文献
23.
当前知识抽取的主要技术方法解析* 总被引:3,自引:0,他引:3
对MnM、KIM、Text2Onto、Amilcare、Melita等具有知识抽取功能的系统所应用的技术方法进行解析。提出在当前知识抽取技术中,机器学习和自然语言分析两大思路各自得到较大发展,并且在相互融合、相互借鉴中受益。在基于机器学习的知识抽取方面,出现以自适应信息抽取(Adaptive IE)、开放信息抽取(Open IE)为代表的新思路,并且有向自动本体学习(Ontology Learning)方向发展的趋势;在基于自然语言分析的知识抽取方面,基于模式标注、语义标注的方法得到广泛关注和进一步完善,并且有向基于Ontology的信息抽取(OBIE)方向发展的趋势。此外,为减少Ontology建设成本,让人们可以利用简单的自然语言构建Ontology,基于受控语言的信息抽取(CLIE)技术也得到一定的关注。 相似文献
24.
领域本体的半自动构建方法研究 总被引:2,自引:0,他引:2
人机协作的半自动构建本体是目前较为理想的模式。借鉴软件工程中的领域建模、图书馆学中的分类学和本体学习的方法论,由领域专家给出领域的上层知识模式,通过机器学习技术从领域语料库中学习等级关系和相关关系为知识工程师提供参考,将专家的自顶向下和机器学习的自底向上的结果结合起来构建本体。半自动构建领域本体的关键技术在于领域概念的获取和组织,用共现统计算法、关联规则算法、隐含语义索引、Hopfield联想算法获取相关关系,用聚类算法、字面成族、模式匹配获取等级关系,从而完成领域类模型的构建。 相似文献
25.
[目的/意义]从科技论文中自动识别与抽取研究设计指纹,能够为科研人员项目设计、研究方法的有效性评估、研究过程问题诊断、研究结果鉴别与评价提供重要的方法论和研究操作支撑。[方法/过程]基于科技论文研究设计指纹的概念模型,提出基于多规则模式混合机器学习方法,设计并实现指纹识别算法,并以数据挖掘领域的期刊文献数据为例,对识别算法的可行性与有效性进行分析验证。[结果/结论]除研究数据与研究趋势外,其他研究设计指纹识别准确率的认可度都基本达到80%以上,覆盖率的认可度,除研究工具与研究数据外,基本达到80%以上。 相似文献
26.
27.
技术机会发现(TOD,Technology Opportunity Discovery)是面向新技术进行监测,并提供机会的一种服务;所谓“基于专利的信息”是指采用自然语言技术对专利进行抽取的结果。本研究的目标资源覆盖过去20年间发表的所有专利,目标信息则是其中产品名称及其部分-整体关系(Part-of relations)。应用基于词典和相似度的命名实体识别、基于模式的关系抽取、以及基于机器学习的信息过滤几项技术,本研究取得了令人鼓舞的效果。 相似文献
28.
数字经济背景下,如何应用先进的统计建模技术和海量数据源对中小企业财务困境进行精准预测已成为一个重要的研究方向和实践问题。基于已有研究成果,分别对比逻辑回归、人工神经网络和随机森林模型,使用经典财务困境预测变量和附加数据对中小企业的信用状况进行评估。研究表明,经典财务困境变量并不足以体现财务困境,需要进一步引入更多因素。随机森林模型是财务困境预测的佼佼者,多项评估指标均表明随机森林模型理应成为大数据信用评估的首选模型。 相似文献
29.
本文创新性构建学术论文被引影响因素特征空间,以我校SCI&SSCI学术论文为例,验证机器学习模型在预测学术论文被引频次研究中的有效性和准确性,本文的分析结论可以为高校图书馆开展决策支持服务提供参考。本文梳理学术论文被引频次影响因素及预测方法的相关研究,结合传统文献计量和Altmetrics指标构建学术论文影响因素的特征空间,并通过实验比较线性回归、神经网络、支持向量机三种机器学习模型在预测学术论文被引频次研究中的有效性和准确性。本文的分析结论证明基于Altmetrics视角构建的特征空间的预测准确率大幅度提高,并且支持向量机模型在对学术论文影响力预测的实证研究中表现出优异的性能。 相似文献
30.
大数据环境下文本情感分析算法的规模适配研究:以Twitter为数据源 总被引:1,自引:0,他引:1
[目的/意义]以大数据环境下的文本情感分析这一特定任务为目的,对规模适配问题进行研究,为情报学领域研究人员进行大数据环境下数据分析时,实现效率和成本的最优选择提供借鉴。[方法/过程]采用斯坦福大学Sentiment140数据集,在对传统情感分析算法分析的基础上,提出了5种面向大数据的文本情感分析算法,检验各种算法在不同环境和数据规模下的适配效果,从准确性、可扩展性和效率等方面进行实证比较研究。[结果/结论]实验结果显示,本文所搭建的集群具有良好的运行效率、正确性以及可扩展性,Spark集群在处理海量文本情感分析数据时更具有效率优势,且在数据规模越大的情况下,效率优势越明显;在资源利用方面,随着节点数和核数的增加,集群的整体运行效率变化显著,配置5个4核4G内存的从节点,能够实现在高效完成分类任务的同时达到节约资源成本的效果。 相似文献