排序方式: 共有137条查询结果,搜索用时 17 毫秒
61.
面向双语术语抽取这一应用目标,提出专业领域可比语料库的构建方案并进行实验论证。针对给定的主题领域分别进行中英文专业语料的采集,从中分别获取中英文关键词,根据词语共现统计获取该主题领域的其他相关关键词;以这些关键词作为查询入口,通过学术搜索引擎从网络获取候选可比语料;对可比语料进行定量评估,以剔除不符合要求的语料,最终得到特定主题领域的可比语料库。 相似文献
62.
随着网络发展,人机交互越来越成为人们网络活动的重要内容,因此关注不同环境因素刺激下的人机交互效率成为有意义的研究课题,本文在之前对无干预①以及模拟网络系统帮助干预②条件下人们通过人机交互界面学习检索功能操作研究基础上,进一步对榜样信息干预下的观察学习进行研究,具体探索了观察学习理论及学习模型,并尝试通过控制实验分析、数学模型拟合等方法观察基于榜样信息干预下,用户在连续执行多轮检索任务中是如何跟随榜样学习选择合适的检索方法,最后得到的主要结论有:①在缺乏相关知识与经验的情况下用户行为的"跟随效应"明显,即表现出替代强化学习现象; ②当出现与检索任务匹配的刺激信息时,比如界面信息,用户会摆脱榜样干预进行独立思考,即表现出了强化学习特征; ③观察学习外部影响因素主要有:榜样人数、榜样评价,对用户学习直接产生影响作用的是检索界面; ④观察学习中场依存认知风格的用户比场独立用户的替代性强化学习特点更突出.这些结论为人机交互平台人性化设计、以及为新手用户重点打造一个友好的交互式e-学习环境提供了启示. 相似文献
63.
64.
基于条件随机场的自动标引模型研究 总被引:3,自引:1,他引:2
条件随机场(Conditional Random Fields,CRF)模型是一种概率图模型.为了有效利用标引对象的特征,并考虑到抽词标引可以转换为序列标注问题,本文提出基于条件随机场的自动抽词标引模型.实验结果表明,该模型在改善抽词标引的性能方面,要优于支持向量机、多元线性回归模型等其他机器学习方法,是到目前为止解决序列标注问题的最好方法.但是,该模型本身还不能解决由于样本中存在同义词和相近词带来的问题,需要进一步对训练集和标引过程中存在的词汇语义情况进行考虑,提高标引的质量. 相似文献
65.
利用条件随机场模型进行自动标引研究,对文本分词性能、训练集的规模、特征的个数、模型本身的参数设置等影响模型标引性能的因素进行实验和分析。 相似文献
66.
基于隐马尔科夫模型的中文术语识别研究 总被引:3,自引:1,他引:2
基于对中文文本信息语法构成尤其是词性搭配的概率特征的分析,提出一种基于双层隐马尔科夫模型的中文泛术语识别和提取的思路和系统框架,并实现相关系统,基于训练语料对多个领域的文本信息进行术语提取测试。实验结果表明,所提出的基于隐马尔科夫模型的中文泛术语识别和提取思想具有较好的实践参考意义。 相似文献
67.
[目的/意义]识别学术论文同行评审意见类型、分析不同被引频次下同行评审意见类型在同行评审报告中的分布情况,有助于加深对同行评议机制的认识,为评估论文学术质量、量化评审专家贡献提供新思路。[方法/过程]首先,将同行评审意见类型划分为正面评价、负面评价、要求/建议(主、次要方面)、问题/疑问、陈述六个类别,经人工标注、获取训练、测试语料后,对比分析传统机器学习模型、深度学习模型在同行评审意见类型自动识别上的效果;其次,将同行评审报告涉及的学术论文进行主题聚类,进而对被引频次进行标准化处理;最后,使用Spearman相关系数、累积分布、K-S检验、负二项回归分析不同被引频次学术论文对应的同行评审报告中同行评审意见类型的分布情况。[结果/结论]SciBert模型识别效果最佳;在基于Spearman的相关性分析中,评审报告中正面评价的分布占比与被引频次具有显著的弱正相关,负面评价的分布占比与被引频次具有显著的弱负相关;通过累计分布发现,多数情况下,当累积概率相同时,高被引分区中正面评价的分布占比大于低被引分区、负面评价的分布占比小于低被引分区,K-S检验能够检测到这种差异;在负二项回归分析中,正面评价分布占比、负面评价分布占比分别对被引频次有显著的正向影响、负向影响。研究结果表明,同行评审报告中正面评价、负面评价的分布情况与其对应论文的被引频次存在相关性,被引频次一定程度上能够反映论文的学术质量。 相似文献
68.
信息技术的蓬勃发展带来了全球信息的爆炸式增长,同时也使人们在面对海量信息时必须充分考虑可信度问题。国际iSchools运动衍生出的iField学科以图书馆学、情报学为代表,也与传播学、计算机科学等其他信息相关学科有一定交叉。iField视域下的可信度研究涉及人、信息、技术与社会的交互,本文梳理过去二十余年间国内外在这一领域的研究和探索。首先,从概念内涵、理论基础、研究方法三个层面对可信度研究进行溯源;其次,基于技术环境与社会环境变迁的双重视角解析可信度研究的主题演化逻辑,总结可信度研究在Web 1.0、Web2.0、社交媒体、人工智能四个标志性阶段的研究重点与难点,并提炼出可信度研究的主题演化框架;最后,从概念内涵拓展、研究方法革新、可信度话题延展等角度对未来研究进行了前沿展望。本文希望厘清可信度研究的发展脉络,推动可信度研究的进一步拓新,为未来网络信息资源治理实践提供参考。 相似文献
69.
企业专利战略的制定与实施 总被引:1,自引:1,他引:0
“战略”在不同的场合下,相对于不同的人有不同的含义。一般地,当人们制定了一个战略,意味着他明确知道他的目的是什么,并就如何实现这个目的制定了具体的措施。因此,“战略”通常比喻决定全局的策略。所谓企业专利战略,就是企业在专利的开发、使用过程中所采取的基本原则和一系列策略的总和。一、企业专利战略的制定1.专利战略的目标和原则首先要明确专利战略可能涉及的内容,确定一个战略的目标。这个目标可以是概念上的计划,也可以是针对特定专利项目的申请计划。企业一般要将这个目标建立在明确的商业目的或研究目的上。商业目… 相似文献
70.