首页 | 官方网站   微博 | 高级检索  
     

基于改进TF-IDF算法的牛疾病智能诊断系统
引用本文:杜永兴,牛丽静,秦岭,李宝山.基于改进TF-IDF算法的牛疾病智能诊断系统[J].计算机应用与软件,2021,38(2):50-53,57.
作者姓名:杜永兴  牛丽静  秦岭  李宝山
作者单位:内蒙古科技大学信息工程学院 内蒙古 包头 014010;内蒙古科技大学信息工程学院 内蒙古 包头 014010;内蒙古科技大学信息工程学院 内蒙古 包头 014010;内蒙古科技大学信息工程学院 内蒙古 包头 014010
基金项目:国家自然科学基金项目;内蒙古科技大学创新基金项目-优秀青年科学基金项目 ;内蒙古自治区高等学校青年科技英才计划项目
摘    要:传统的TF-IDF(Term Frequency&Inverse Documentation Frequency)算法提取的关键词不能合理地代表某疾病的症状,降低智能诊断系统的性能。对此,提出一种改进的TF-IDF算法,并将其应用在牛疾病诊断系统中。系统将用户描述的文本内容转换成向量的形式,用TF-IDF算法提取关键症状词,利用余弦定理和可信度计算给出可靠的疾病推荐和治疗方案。实验结果表明,该算法在疾病诊断中准确率和可信度两方面都具有更好的效果。与传统TF-IDF算法相比,平均可信度提高约4%。

关 键 词:智能诊断  TF-IDF  余弦相似度  VSM

CATTLE DISEASE INTELLIGENT DIAGNOSIS SYSTEM BASED ON IMPROVED TF-IDF ALGORITHM
Du Yongxing,Niu Lijing,Qin Ling,Li Baoshan.CATTLE DISEASE INTELLIGENT DIAGNOSIS SYSTEM BASED ON IMPROVED TF-IDF ALGORITHM[J].Computer Applications and Software,2021,38(2):50-53,57.
Authors:Du Yongxing  Niu Lijing  Qin Ling  Li Baoshan
Affiliation:(School of Information Engineering,Inner Mongolia University of Science and Technology,Baotou 014010,Inner Mongolia,China)
Abstract:The of the keywords extracted by the traditional TF-IDF(Term Frequency&Inverse Documentation Frequency)algorithm can not reasonably represent the symptoms of disease,thus reducing the performance of intelligent diagnostic systems.In response to this situation,an improved TF-IDF algorithm is proposed and applied in the cattle disease diagnosis system.The system converted the text content described by the user into a vector form,extracted the key symptom words by TF-IDF algorithm,and used the cosine theorem and credibility calculation to give a reliable disease recommendations and treatment plans.The experimental results show that the algorithm has better effects in both disease accuracy and credibility.The average credibility is improved by about 4%compared with the traditional TF-IDF algorithm.
Keywords:Intelligent diagnosis  TF-IDF  Cosine similarity  VSM
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号