论文部分内容阅读
摘 要:医保三大目录的编码匹配工作繁琐,人工匹配效率低、差错率高。本文探讨利用查询语言实现EXCEL数据自动导入、智能匹配,减少维护人员工作量,提高匹配效率。
关键词:三大目录;结构化查询语言;自动匹配
一、 前言
随着医院即时联网单位的增加,医院与各地医保经办部门数据对应的任务越来越重,維护工作量越来越大,尤其是三大目录的对应直接关系到病人的报销比例,时效性、准确性要求特别强。三大目录是指药品目录、诊疗项目和服务设施目录、医用材料目录,总条目数超过15000条。以往都是医院医保目录维护人员逐条人工对应,如何利用计算机工具提高维护效率显得日益迫切。
二、 系统运行环境
选择微软关系型数据库SQLServer 2000作为系统开发环境,SQL查询语言作为实现工具。相对于最新的SQL Server 2016,其软硬件环境要求不高、部署简单、完美支持结构化查询语言TransactSQL。
三、 原始数据整理
医保经办部门提供的原始数据多为EXCEL格式,导入到SQLServer数据库之前要进行如下处理:
(1)删除表头、表格中的各级分类行、备注信息和非核心列以及其他无关数据。
(2)为每一列增加英文名称。
(3)整理表格中不合理内容。Excel表格数据要导入数据库进行处理,必须统一每列数据的类型。例如经办部门提供的诊疗项目和服务设施目录“单价”列中除了数字价格以外还出来现了诸如:医疗机构自主定价、免收、待定、未定和空白等非标准数据,都需要结合项目含义及对应要求进行数值替换,并附加替换说明备查表。
(4)数字、文本混合列数据的字符化处理。诊疗项目和服务设施目录“编码”列中出现了“110200001、1102000011、110200002、110200002a、110200002b、110200002c、110200002d”,前三个数据导入没问题,后四个数据在SQL Server数据库中显示为空值。数据库默认将“编码”列识别为float型,因为其新建表对应字段就是float类型的。SQL认为包含字母的那些编码无法转换成数字,是无效的数据,从而采用NULL来代替。
检索相关文献得知,在导入Excel混合数据列时,由于数据类型不唯一,导致SQL无法确定数据类型,在EXCEL中将单元格设为文本格式也不行。处理办法就是在该列所有值前加单引号强制确定为字符型。为避免在万余个数据前依次添加单引号,可以利用单引号与该列数据相“与”的方法一次性添加(’
关键词:三大目录;结构化查询语言;自动匹配
一、 前言
随着医院即时联网单位的增加,医院与各地医保经办部门数据对应的任务越来越重,維护工作量越来越大,尤其是三大目录的对应直接关系到病人的报销比例,时效性、准确性要求特别强。三大目录是指药品目录、诊疗项目和服务设施目录、医用材料目录,总条目数超过15000条。以往都是医院医保目录维护人员逐条人工对应,如何利用计算机工具提高维护效率显得日益迫切。
二、 系统运行环境
选择微软关系型数据库SQLServer 2000作为系统开发环境,SQL查询语言作为实现工具。相对于最新的SQL Server 2016,其软硬件环境要求不高、部署简单、完美支持结构化查询语言TransactSQL。
三、 原始数据整理
医保经办部门提供的原始数据多为EXCEL格式,导入到SQLServer数据库之前要进行如下处理:
(1)删除表头、表格中的各级分类行、备注信息和非核心列以及其他无关数据。
(2)为每一列增加英文名称。
(3)整理表格中不合理内容。Excel表格数据要导入数据库进行处理,必须统一每列数据的类型。例如经办部门提供的诊疗项目和服务设施目录“单价”列中除了数字价格以外还出来现了诸如:医疗机构自主定价、免收、待定、未定和空白等非标准数据,都需要结合项目含义及对应要求进行数值替换,并附加替换说明备查表。
(4)数字、文本混合列数据的字符化处理。诊疗项目和服务设施目录“编码”列中出现了“110200001、1102000011、110200002、110200002a、110200002b、110200002c、110200002d”,前三个数据导入没问题,后四个数据在SQL Server数据库中显示为空值。数据库默认将“编码”列识别为float型,因为其新建表对应字段就是float类型的。SQL认为包含字母的那些编码无法转换成数字,是无效的数据,从而采用NULL来代替。
检索相关文献得知,在导入Excel混合数据列时,由于数据类型不唯一,导致SQL无法确定数据类型,在EXCEL中将单元格设为文本格式也不行。处理办法就是在该列所有值前加单引号强制确定为字符型。为避免在万余个数据前依次添加单引号,可以利用单引号与该列数据相“与”的方法一次性添加(’