论文部分内容阅读
传统的问诊模式都是在现实中去医院进行询问,这给多数的患者用户带来了很多不便,从而直接影响到患者的病情。随着互联网问诊行业的迅速发展,减少了患者在医院里的等待挂号、看病、取检验报告、结账、取药所带来的等待之苦。由于大数据时代的数据堆积,如何有效的通过数据挖掘对海量数据信息进行处理,成为了一个普遍关注的问题,传统的基于关键字搜索的信息查询已经不能够很好的满足患者用户的需求。本文主要通过对数据画像原理与推荐系统相关技术进行分析,力求找到高效率、稳定的、实时性强以及个性化的推荐算法,实现针对互联网用户进行病情与医生的精准推荐,为患者提供自动或者半自动的分诊系统,从而达到医疗信息的准确传递。主要工作分为以下三个部分:(1)本文对医学领域的人物进行画像,在医院堆积了大量的患者信息,通过设计医学画像模型,画像生成算法,画像更新算法,实现对患者信息的分析与应用,建立起一个医学画像库。(2)通过深入研究推荐算法,对协同过滤算法的原理与流程进行详细的阐述,并在此基础上结合了SVD(奇异值分解技术)减少数据稀疏性问题,同时,将医学画像的研究应用于推荐算法中,最终形成了一套基于SVD的协同过滤与融合画像Tag标签特征的推荐算法。实现该算法的核心步骤是协同过滤中相似度度量的设计。本文主要设计两种相似度的算法:传统的相似度计算与基于画像标签属性偏好的相似度计算,最后通过一个权值w进行动态的调整我们的算法相似度,直到选取合适的w使该系统能够更有效的提高系统的性能和系统的推荐精度。(3)初步实现一个基于B/S模式的医学推荐系统,优点在于系统可以通过浏览器界面上的问诊窗口、画像展示与推荐结果展示能更好的与患者用户进行交互,避免了大量的传统问诊所需的等待时间。个体画像展示的是登录用户自己的画像,推荐系统也是参考画像进行的推荐,本文中因此实现了一个真正的个性化的推荐系统。