基于网络数据的医生口碑分析系统的设计与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:cq823285326
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,各个行业都开始与互联网整合,当然医疗行业也不例外。在线医疗网站上积累了大量的患者对医生的评价信息,这些评价信息是患者选择一个医生的依据,患者一般在浏览了大量其他患者的评价后才能决定选择哪个医生为其诊治,但是这往往会花费患者很多时间和精力,而且患者也不可能把医生的所有的评论都阅读一遍。基于这个问题,论文提出设计和实现一个基于网络数据的医生口碑分析系统,为患者提供选择医生的参考指标,帮助患者快速选择医生。该系统采集网上患者对该医生的评论信息进行文本挖掘分析,从而得出医生的口碑评分以及满意评价比例、一般评价比例、不满意评价比例。该系统主要分为信息采取模块、评论文本预处理模块、评论文本模块、信息展示模块等模块。数据爬取模块使用一款开源的爬虫框架Web Magic,从医疗网站上采集医院、医生、患者评价等信息。评论文本预处理模块负责评论文本的分词和文本到向量的转换等工作,分词工具使用的是Ansj分词工具。评论文本挖掘模块通过逻辑回归实现算法评论的分类。评论最终会被分成“满意”、“一般”、“不满意”三类。评论的类别作为医生口碑评分的依据。信息展示模块负责展示爬取的医生信息、评论信息和口碑评分结果等信息。展示模块采用B/S架构,使用Spring MVC、Spring、My Batis等主流Web开发框架搭建一个Web服务器。整个系统使用My SQL数据库进行数据的存储。在测试环境中,该系统从挂号网采集到了1000多条医生数据和50000多条评论数据,训练出了评论分类模型,分类模型的准确度约为86%,满足系统应用需求。然后实现了评价的分类和医生的口碑评分的计算。最后实现了口碑分析结果的展示功能,用户可以登录系统,查看到医生的信息和医生的评分结果。整个系统实现了预期的功能。
其他文献
目的:评估甲磺酸阿帕替尼二线治疗晚期胆囊癌的有效性和安全性。方法:选取2015年5月至2017年5月晚期胆囊癌一线治疗失败的患者60例,根据治疗方法分为对照组30例及治疗组30例,
我们从网上下载、拷贝的文字资料,经常 会遇到资料中使用英文标点符号的情况。为了规 范文件编排,常常需要将此类文章放在Word中编 辑处理,并把所有的英文标点符号转化为中文
患者,女,54岁,2010年4月22日初诊。右上肢无力2年余。2年前患者在无明显诱因下感觉右上肢麻木无力,于外院就诊,诊断为"颈椎病",治以针灸、推拿、理疗,未见好转。后逐渐发生右手
邻苯二甲酸二-(2-乙基己基)酯(di-(2-ethylhexyl)phthalate,简称DEHP)是应用范围最广的邻苯二甲酸酯(phthalic acid esters,简称PAEs)类化合物之一,主要被用作增塑剂添加到产品中,邻
目的探讨头穴配合下合穴治疗腹泻型胃肠神经症的临床疗效。方法选择70例腹泻型胃肠神经症患者,随机分为针刺组和对照组,针刺组给以头穴配合下合穴针刺,对照组口服西药,采用目前国
Inter凭借新一代整合GPU显示核心的Clarkdale处理器.慢慢夺回整合平台的市场份额。而作为这一处理器的御用平台,H55主板自然而然成为用户关注的焦点。
随着手机的普及和移动技术的发展,手机上网用户越来越多。高校建立wAP网站显得非常必要。介绍WAP的技术要点和架构,分析高校校园网的功能模块,并详细讲解使用Visual Studio 2008
压痛阈是传统评测痛觉的方法之一。机体的疼痛阈值代表机体对疼痛感觉的分辨水平。压痛阈是指受试者的皮肤在接受外部压力刺激时,最初能感受到由压力觉变为痛觉时的最小压力值
枸杞质量溯源系统原型版本经过多次的迭代开发后,其代码缺陷越来越多,软件结构组织混乱,难以继续开发。采用SSH框架技术和接口设计方法进行系统重构,分别对系统的DAO层、业务控制