排序方式: 共有56条查询结果,搜索用时 15 毫秒
1.
中文电子病历的分词及实体识别研究 总被引:1,自引:0,他引:1
[目的/意义]健康医疗大数据是我国重要的基础性战略资源,本研究对中文电子病历分词与实体识别的探讨与实证较好地完成了医疗数据的信息抽取任务,对今后医疗大数据在语义层面的应用发展具有重要意义。[方法/过程]本研究首先融合权威词表、官方标准、健康网站数据及其他医学补充词库构建了词语数量级达到10万的医学词表;然后对电子病历的字段进行分词,对比了jieba工具、导入词典后的jieba、无监督学习及AC自动机4种模型的分词效果;最后,以自动分词和人工标注结果为语料,实现基于条件随机场的电子病历实体识别研究,并比较不同实体类别以及不同文本特征下的实体识别效果,选出最优模板。[结果/结论]分词结果显示,AC自动机的效果最好,F值可达82%;实体识别结果表明,"检查"和"疾病"实体的识别效果最好,而"症状"的识别效果不太理想。 相似文献
2.
王继民 《中学生数理化(高中版)》2002,(4)
函数是高中数学中最重要的内容,是贯穿中学数学全部知识的主线.函数思想与函数方法对分析和解决各种数学问题和实际应用问题具有重要作用,这就决定了函数在高考数学试题中的重要地位.它无疑是考查的重点和热点. 相似文献
3.
[目的 /意义]针对在线问诊平台中医生推荐满意度较低的问题,探究如何将信息技术与用户认知相结合以提升医生推荐系统的效果,有助于优化在线问诊平台的用户体验。[方法 /过程]首先,基于1 500名医生的基本信息和78万余条用户提问,对比TF-IDF、Doc2Vec和Word2Vec三种词向量模型的医生推荐效果,以最优模型构建医生推荐系统原型;然后,通过用户实验和访谈获取用户使用该系统的行为数据,深入挖掘在线问诊平台医生推荐情境中的用户认知与意义构建过程;最后,从用户角度提出模型优化思路,实现原型系统的改进。[结果/结论 ]基于Word2Vec词向量模型的医生推荐效果最优,前10位医生候选集中88%的医生有能力回答用户问题;用户实验结果显示,科室信息与医生专业极大影响用户选择,医生曾回答过的相似问题是用户的重要参考信息;基于以上结果,提出并实现建立科室预测分类器以及为健康医学关键词赋予较高权重的两种模型优化思路,并通过匹配度指数对医生推荐结果进行优化排序。结果表明,两种方法均可提高医生推荐系统的准确度,证明用户认知与人工智能算法结合具有可行性。 相似文献
4.
[目的/意义]为了支撑数据驱动研究范式,促进科学数据的共享与利用,提高数据仓储和发现平台中数据集检索功能的效果。[方法/过程]将科学数据集检索过程分为候选数据集检索和候选数据集重排序两个主要阶段:在第一阶段,将BM25模型与基于SimCSE的稠密检索模型结合,获取潜在的相关数据集;在第二阶段,基于BERT排序模型对候选数据集的相关性进行评分,据此优化检索结果排序。[结果/结论]从国内外13个人文社科相关的科学数据仓储平台采集约10万数据集的元数据进行检索实验和效果评价,结果表明:提出的检索模型效果最优,其NDCG@10的得分分别高于基准的向量空间和BM25模型23.6和11.7个百分点;对各模型检索结果分析发现,该模型相比基准模型具有更强的语义检索能力;此外,还对模型权重设置进行分析,可为实践应用中的参数设置提供参考。[局限]仅在英文人文社科数据集上进行模型效果验证。 相似文献
5.
[目的/意义]从纵向演化与横向区域比较两个维度,探究包括中国在内的65个"一带一路"沿线国家的科研合作情况,为我国与沿线国家开展科研合作和政策制定提供参考。[方法/过程]以Web of Science核心合集作为数据来源,抓取65个国家20年间近240万条学术论文的跨国合作数据;使用社会网络分析方法,构建"一带一路"沿线国家的论文合著网络。然后从网络整体、核心国家、科研小团体三方面分析该网络现状及演化过程,并对核心国家之间的主要科研合作内容进行探究。[结果/结论]整体来看,合作网络的密度呈波动上升的趋势,这说明国家间的科研合作规模越来越大,但部分国家在科研合作开放程度上表现不佳,在"一带一路"沿线国家中衰弱型和沉睡型国家较多;中国、俄罗斯、波兰、捷克共和国、匈牙利、印度和土耳其的核心度一直较高,合作内容多属物理学及相关学科;除核心国家之外的"一带一路"沿线国家与地理位置上邻近的国家合作较多,东南亚、欧洲、中亚、中东等地区的区域聚集特征比较明显。 相似文献
6.
[研究目的]梳理以ChatGPT为代表的人工智能生成内容技术(AIGC)及其生成内容特征,探讨其对知识生产与传播的影响。[研究方法]首先对AIGC技术及其生成内容特征进行梳理,进而剖析AIGC技术对知识生产与传播所带来的革新与挑战,在此基础上提出相应的建议和未来研究展望。[研究结论]AIGC生成内容具有知识密度高、生成速度快、生成成本较低以及具有一定的创造性等特点;AIGC技术将推动知识生产角色的多元转化,并催生人机深度融合成为新的知识生产模式,从而显著提高知识的生产效率。同时,将推动知识传播“中介”转型发展,促使知识传播向知识交流的趋势转变,知识传播的速度和效果得到显著提升。然而,AIGC技术也带来了知识产权争议、知识验证机制受挑战、隐私风险与数据安全、误导性知识生成与恶意传播等挑战。未来需加强基于AIGC技术的知识生产与服务高端平台建设,推动知识创新;同时应构建知识产权技术和制度保障体系,加强对误导性知识生成和传播的监管;此外,还需提高个人算法素养能力。 相似文献
7.
在开放科学环境下,科学数据的复用受到重视。为了方便研究人员查找科学数据,面向科学数据集的统一发现平台陆续推出,相关数据集检索方法受到研究者的广泛关注。本文对国内外开放科学数据集的统一发现平台相关的研究与应用实践进行广泛调研,从数据集采集、组织、检索、综合排序四个方面,全面梳理、总结国内外研究进展,并分析未来发展方向。具体地,对数据集采集方法、多源元数据融合方法、元数据质量分析、元数据信息丰富方法、检索匹配中查询扩展和排序方法,以及相关性判据与综合排序方法进行详细介绍和深入分析,以期为进一步的研究和应用实践提供参考。 相似文献
8.
9.
10.