首页 | 官方网站   微博 | 高级检索  
     

网络资源命名及用户命名行为的分析
引用本文:陈翀,闫宏飞.网络资源命名及用户命名行为的分析[J].情报学报,2009,28(4).
作者姓名:陈翀  闫宏飞
作者单位:北京大学信息科学技术学院,北京,100871
基金项目:国家科技支撑项目,广东省重点实验室基金,国家科技基础条件平台项目 
摘    要:网络资源是指通过互联网传播共享、以文件目录为主要存储组织结构的内容,如书、讲义、音乐等.每个资源的内容具有完整独立性.它们是数字图书馆、教学资源库、专业内容库藏的重要组成.网络资源的一大特点是命名模式不规范,给检索利用带来极大不便.本文以2003~2006年间搜集的61万文件构成的16 284个网络资源为对象,用统计的方法考察网络资源命名特点及其中体现的用户命名习惯.包括资源及其内部子目录、文件的名字长度分布,字符类型熵、常用符号、高频片段模式、语义类型等,并分析无序命名中蕴含的用户命名习惯.本文的意义一方面有助于从混乱命名中净化和提取对检索查询有用的信息,另一方面有助于揭示网络用户参与海量网络资源共享的行为习惯.

关 键 词:互联网  网络资源  名字长度分布    命名模式

Web Resource Naming Conventions and User Behavior Analysis
Chen Chong,Yan Hongfei.Web Resource Naming Conventions and User Behavior Analysis[J].Journal of the China Society for Scientific andTechnical Information,2009,28(4).
Authors:Chen Chong  Yan Hongfei
Affiliation:School of Electronics Engineering and Computer Science;Peking University;Beijing 100871
Abstract:A Web resource refers to a file,or some files(maybe with directory or subdirectories) which represent a certain thing,meaning or entity,and are worthy of treasure in the long term.Web resources,such as e-books,learning materials or songs,can provide various contents to digital libraries,educational repositories or other digital collections.However,Web resources are characterized as chaotic naming,which have obstructed the searching and organizing to them.We inspect web resource naming conventions and user b...
Keywords:Web resource  name length distribution  entropy  naming pattern
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号