首页 | 官方网站   微博 | 高级检索  
     

英日语料库语义接受度对比研究
引用本文:杜家利,于屏方.英日语料库语义接受度对比研究[J].计算机工程与应用,2009,45(24):146-149.
作者姓名:杜家利  于屏方
作者单位:鲁东大学外国语学院汉语言文学院,山东,烟台,264025
基金项目:国家社会科学基金项目,山东省社会科学规划项目 
摘    要:基于语料库的语义接受度(SAS)研究是在线衡量文本理解程度的可行性方法。在大规模真实文本语料的基础上,利用赋值限域方法进行英日文本对照研究。并通过分析不同赋值区间对英日小说文本语义接受度进行解读。经过验证的语义接受度公式证明了文本理解与词汇密度(P1,P2)、词长(H)和句长(L)相关,即SAS=P2/P1×0.4×(L+H)],而且不同的抽取率不会引起评价值的显著差异。此公式为文学研究者借助网络对电子文本进行理解度评价提供了理论支持。

关 键 词:文本  语料库  自然语言  语义接受度  信息检索
收稿时间:2009-3-9
修稿时间:2009-5-4  

Comparative study on semantic accessibility scale originating from English and Japanese corpora
DU Jia-li,YU Ping-fang.Comparative study on semantic accessibility scale originating from English and Japanese corpora[J].Computer Engineering and Applications,2009,45(24):146-149.
Authors:DU Jia-li  YU Ping-fang
Affiliation:DU Jia-li,YU Ping-fangSchool of Foreign Languages,School of Chinese Language , Literature,Ludong University,Yantai,Sh,ong 264025,China
Abstract:The corpus-based study on Semantic Accessibility Scale(SAS) is a useful method to evaluate the acceptance of electronic texts.On the basis of large-scale natural language texts,this paper compares The Old Man and the Sea and 『ゆきぐに』from English and Japanese corpora by means of the information retrieval and semantic assignment.A conclusion is drawn that SAS is related to vocabulary density(P1,P2),vocabulary length(H) and sentence length(L),namely SAS=P2/P1×0.4×(L+H)].Correspondingly,different sampling ratios will not result in fundamental difference of SAS.This study provides the theoretical support for the literary critics to analyze the acceptance of internet-based texts.
Keywords:text  corpus  natural language  semantic accessibility scale  information retrieval
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号