排序方式: 共有14条查询结果,搜索用时 15 毫秒
1.
2.
3.
文章旨在探讨查询分类技术和跨语言检索技术的关系,前者的应用能否改善后者的系统性能是核心问题。首先提出一种基于查询分类的标准化折扣累积增量评价指标,通过对采用查询分类技术前后信息检索系统的标准化折扣累积增量评价指标的变化进行判断,来检验该评价指标的可用性和有效性。同时,查询分类可以作为降低跨语言检索系统查询翻译的歧义性的技术手段。对大规模查询集随机抽样的查询翻译实验结果表明,本文提出的基于查询分类的查询翻译消歧方法对大部分查询有效,在一些情况下甚至可以直接通过本方法完成查询翻译。结合其他方法进一步消除翻译的歧义性则是下一步的工作内容。 相似文献
5.
面对日益膨胀的多语种信息资源,跨语言信息检索已成为实现全球知识存取和共享的关键技术手段。构建一个实用型的跨语言检索查询翻译接口,可方便地嵌入任意的信息检索平台,扩展现有信息检索平台的多语言信息处理能力。该查询翻译接口采用基于最长短语、查询分类和概率词典等多种翻译消歧策略,并从查询翻译的准确性和接口的运行效率两个角度对构建的查询翻译接口进行评测,实验结果验证所采用方法具有可行性。 相似文献
6.
针对某网站在线运行的基于词典的查询翻译接口,对接口中实现的3种比较常用的查询翻译消歧算法进行改进,利用性能测试工具Loadrunner对改进前后的查询翻译接口的运行效率进行对比分析,最后总结影响基于词典的查询翻译的运行效率的3个主要因素。 相似文献
7.
汉英词典作为沟通中文与英语两种不同语言的桥梁,是中国与世界交流的工具。在信息时代飞速发展的今天,双语词典的自动构建技术在机器翻译和跨语言检索领域起着重要的作用,本文对双语词典的自动构建方法和其中的关键技术进行了比较全面的分析和总结,并提出一种从汉英平行语料库中抽取双语词语,自动构建双语词典的方法,在实现汉英句子级对齐后,对双语语料分别进行分词和词性标注处理,通过抽取汉英词语单元并计算其关联概率来实现汉英的词语对齐,最终生成双语词典。该方法在对真实语料的双语词典构建实验中取得了较好的结果,词对齐效果优于传统的IBM模型方法。 相似文献
8.
【目的/意义】在国际政治经济环境和全球创新格局不断变化的背景下,拓展全球科技创新合作伙伴、建立更为广泛和紧密的全球科技创新合作网络,成为亟待解决的问题。【方法/过程】本文基于科技论文构建主题词共现矩阵,筛选二阶共现主题词对作为潜在国际科技合作主题对,通过定义主题对的国际合作潜力指数以及主题路径的国际科技合作路径强度指数,判定主题对的国际合作潜力并寻找有效的主题合作路径。【结果/结论】以中俄人工智能领域的SCI论文和CPCI-S论文为分析对象,通过对该领域潜在国际科技合作主题的识别和分析,证实本文所提方法的有效性。【创新/局限】本文提出一种识别潜在国际科技合作主题的方法,并利用中俄两国论文进行实证研究,但未考虑不同国家研究产出规模差异,未对关键词进行语义分析,需在后续研究中进一步探讨。 相似文献
9.
跨语言文本分类技术研究进展 总被引:1,自引:1,他引:0
本文以综述的形式对跨语言文本分类技术目前的发展态势进行了介绍,从应用背景出发,了解跨语言文本分类技术的社会需求;从关键技术出发,了解该项技术的核心问题及解决方案;从已有研究成果得到的结论揭示了该项技术的发展状况,作为一种重要的多语信息组织手段,跨语言文本分类技术发展前景广阔。Abstract: The present development situation of Cross-Language Text Categorization (CLTC) technologies is summarized.The paper describes the social demand for CLTC technologies from the perspective of the application background,describes the core issues of and solutions to CLTC technologies from the perspective of key technologies,and discloses the development status of CLTC technologies from the conclusions drawn from the obtained research results.As an important means for multilingual information organization,CLTC technologies have a broad development prospect. 相似文献
10.