期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王若佳赵常煜王继民《图书情报工作》2019,63(2):34-42

[目的/意义]健康医疗大数据是我国重要的基础性战略资源，本研究对中文电子病历分词与实体识别的探讨与实证较好地完成了医疗数据的信息抽取任务，对今后医疗大数据在语义层面的应用发展具有重要意义。[方法/过程]本研究首先融合权威词表、官方标准、健康网站数据及其他医学补充词库构建了词语数量级达到10万的医学词表；然后对电子病历的字段进行分词，对比了jieba工具、导入词典后的jieba、无监督学习及AC自动机4种模型的分词效果；最后，以自动分词和人工标注结果为语料，实现基于条件随机场的电子病历实体识别研究，并比较不同实体类别以及不同文本特征下的实体识别效果，选出最优模板。[结果/结论]分词结果显示，AC自动机的效果最好，F值可达82%；实体识别结果表明，"检查"和"疾病"实体的识别效果最好，而"症状"的识别效果不太理想。相似文献

2.

基于深度学习的科学数据集检索方法研究

罗鹏程王继民王世奇郭鑫高正赵常煜《情报理论与实践》2022,(7):49-56

[目的/意义]为了支撑数据驱动研究范式,促进科学数据的共享与利用,提高数据仓储和发现平台中数据集检索功能的效果。[方法/过程]将科学数据集检索过程分为候选数据集检索和候选数据集重排序两个主要阶段：在第一阶段,将BM25模型与基于SimCSE的稠密检索模型结合,获取潜在的相关数据集;在第二阶段,基于BERT排序模型对候选数据集的相关性进行评分,据此优化检索结果排序。[结果/结论]从国内外13个人文社科相关的科学数据仓储平台采集约10万数据集的元数据进行检索实验和效果评价,结果表明：提出的检索模型效果最优,其NDCG@10的得分分别高于基准的向量空间和BM25模型23.6和11.7个百分点;对各模型检索结果分析发现,该模型相比基准模型具有更强的语义检索能力;此外,还对模型权重设置进行分析,可为实践应用中的参数设置提供参考。[局限]仅在英文人文社科数据集上进行模型效果验证。相似文献

3.

1996-2015年“一带一路”沿线国家科研合作网络的演化分析

王继民王若佳曾兰馨赵怡然赵常煜《图书情报工作》2017,61(16):76-83

[目的/意义]从纵向演化与横向区域比较两个维度,探究包括中国在内的65个"一带一路"沿线国家的科研合作情况,为我国与沿线国家开展科研合作和政策制定提供参考。[方法/过程]以Web of Science核心合集作为数据来源,抓取65个国家20年间近240万条学术论文的跨国合作数据;使用社会网络分析方法,构建"一带一路"沿线国家的论文合著网络。然后从网络整体、核心国家、科研小团体三方面分析该网络现状及演化过程,并对核心国家之间的主要科研合作内容进行探究。[结果/结论]整体来看,合作网络的密度呈波动上升的趋势,这说明国家间的科研合作规模越来越大,但部分国家在科研合作开放程度上表现不佳,在"一带一路"沿线国家中衰弱型和沉睡型国家较多;中国、俄罗斯、波兰、捷克共和国、匈牙利、印度和土耳其的核心度一直较高,合作内容多属物理学及相关学科;除核心国家之外的"一带一路"沿线国家与地理位置上邻近的国家合作较多,东南亚、欧洲、中亚、中东等地区的区域聚集特征比较明显。相似文献

4.

“一带一路”倡议下的Twitter文本主题挖掘和情感分析

赵常煜吴亚平王继民《图书情报工作》2019,63(19):119-127

[目的/意义] "一带一路"倡议的提出引起了国内外广泛的关注，众多国家的用户在最具代表性的社交媒体Twitter中表达观点、发表评论、相互讨论。从推文中挖掘得出世界对"一带一路"的讨论主题和情感倾向，有助于为政府机构优化宣传策略，增加"一带一路"倡议的曝光度、关注度提供参考。[方法/过程] 采集2017年与"一带一路"相关的6万余条推文，分别按照中文和英文进行数据预处理、数据描述、主题挖掘、情感分析，并实现主题和情感的交叉分析，得出结论。[结果/结论] 2017年的推文主题主要围绕5月份的"一带一路"高峰论坛。其中，中文推文更关注高峰论坛的筹划和实施，以及安全问题、领导层的访问等方面的内容，情感值的波动较大，特别是安全问题上的消极情绪波动很大。英文推文则更关注举办高峰论坛的事实以及论坛所带来的经济效应，情感波动较小，经济方面的情感值是积极占比明显高于消极和中立的情感值。相似文献