排序方式: 共有85条查询结果,搜索用时 15 毫秒
11.
本文在概述数据挖掘技术的基本概念、分析方法的基础上,分析与比较了文本自动聚类算法;综述了国内外面向MEDLINE文献数据库的数据挖掘、知识提取研究;简述了可扩展标识语言(XML)的基本概念、文档格式及其在数据管理及数据挖掘中的应用. 相似文献
12.
介绍几种机器学习方法的原理及其在自然语言处理中的应用,总结分析其应用过程中的主要问题,讨论机器学习在自然语言处理应用中的发展趋势. 相似文献
13.
14.
Internet信息检索分析与研究 总被引:7,自引:0,他引:7
综述了目前Internet 网上信息检索的主要方法及存在的问题, 并对其检索技术进行了深入的分析与比较。介绍了机器学习、智能A gent、信息过滤等新技术在信息检索中的应用, 并采用神经网络Hopfield 模型及算法进行词汇扩充来提高用户的检索提问表达, 从而提高了网上信息检索的能力。 相似文献
15.
基于机器学习的自动文本分类模型研究 总被引:2,自引:0,他引:2
基于机器学习的方法是自动文本分类中非常重要的一大类方法。本文先给出了形式化的定义,提出了自动文本分类的流程模型,然后选取了支持向量机(Support Vector Machine,SVM)算法作为一个典型例子进行分析,最后作者通过一个中文文本分类实验评价了该算法的效果。 相似文献
16.
[目的/意义] 在社会化标注系统中,标签质量往往关乎用户对网络资源的分类、查询、浏览、获取等使用体验,确定影响标签质量的关键因素有助于进一步优化社会化标注系统的资源组织核心功能。[方法/过程] 以社会化标注系统的标签为研究对象,从标注主体、标注客体、标注环境、标注动机、标注方式、标注产物等维度入手重构标签质量影响因素模型,尝试探究影响社会化标签质量的关键因素,并运用问卷调查方法收集数据,结合有监督学习的随机森林算法,建立标签质量影响因素的决策树模型。[结果/结论] 结果显示,标注主体是影响标签质量的首要关键维度,主体的知识结构和认知水平、标注频度及其感知有用性对标签质量的影响突出;标注方式是影响标签质量的次要关键维度,标签推荐和规范标签提示是影响标签质量的重要因素。 相似文献
17.
以某大学图书馆的所有馆藏书目为研究对象,在对图书关键词标引信息进分析的基础上,总结中文关键词的基本特点及其抽取规律,构建一个基于字序列标注的中文关键词抽取模型,提出中文关键词抽取的基础思路和实现方案,并通过实验论证模型的合理性、正确性和实用性,认为字序列标注方法优于词序列标注,基本上可以解决不分词情况下的中文关键词抽取问题。 相似文献
18.
颠覆性技术是一个具有复杂的内在结构的技术群。从空间维度来看,颠覆性技术是包含了主导技术、辅助技术、支撑技术的复杂技术群,涉及多学科、多领域。在此背景下,运用科学计量的方法对颠覆性技术进行科技评价和科学技术演变规律探索面临挑战,实质表现为数据检索。本文探索了一种基于机器学习的专利数据集构建新策略,将专利检索任务作为机器学习的二分类任务,类似于信息检索中基于主动学习的查询分类思想,并提出了将F-measure特征最大化方法与CNN(convolutional neural networks)模型相结合的文本分类改进方法。本文以人工智能(artificial intelligence,AI)技术域为例进行训练实验,实验结果的准确率、召回率和F1值分别达到98.01%、97.04%和97.89%,这表明本文提出的策略能够精准地识别人工智能专利,提高了专利检索的准确率和召回率,以利于构建精、准、全的人工智能技术域专利数据集。 相似文献
19.
基于用户信息检索相关性反馈模型的研究 总被引:1,自引:0,他引:1
提出通过获取用户建立和更新信息相关反馈模型的思想.通过观察用户在浏览Web页面时所采取的动作来获取的反馈信息,利用检索算法将用户信息量化,并利用这些信息建立与更新用户模型.一方面用户对检索结果的评价输入到用户模型上,另一方面,检索系统通过机器学习跟踪用户信息并优化用户模型. 相似文献
20.
传播学实证研究关注媒介曝露及其影响,较少展开信息传播或个体行为预测。依循演绎逻辑进行建模的过程中则存在解释性和预测性建模的方法混淆,影响因果推断的准确性、有效性和可靠性。随着计算社会科学的发展,研究者开始关注解释与预测认识论上的区别。我们认为解释和预测的明确区分及有效整合将帮助传播学实现更好的因果识别和科学预测,本文归纳国内传播学实证研究在计算社会科学背景下的研究设计,澄清两者在本学科方法运用上的现状及问题。依据Pearl提出的因果阶梯,结合传播学议题特殊性将运用在线数据进行实证研究提取为四个层级的目标和任务:(1)关联分析;(2)干预研究;(3)解释性研究;(4)反事实因果推理,并为因果建模中解释与预测模型的有效整合提出具体方法建议,通过分析层级上的循环验证更好地理解传播规律与人类行为。 相似文献