基于K—means算法的电子政务用户细分模型研究

来源 :商场现代化 | 被引量 : 0次 | 上传用户:a479704375
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要] 在系统阐释电子政务发展阶段的基础上,将CRM及其客户细分理念引入电子政务领域,构建用户细分模型,并进行实证分析,结果表明,细分结果能够为个性化服务的实现创造条件。
  [关键词] 电子政务 CRM 客户细分 K—means算法
  
  一、引言
  经过多年建设,我国的电子政务已取得了巨大的成就,围绕关系国计民生的大事要务,围绕企业和社会公众的实际需求,政府网站发挥了积极而明显的作用。从公共服务的角度,我国电子政务经历了按部门提供服务、按用户对象或应用主题提供服务的发展阶段,当前,迎来了个性化服务的发展阶段,要求充分以用户需求为依据提供个性化服务。
  而大多数电子政务网站提供的都是面向所有服务对象的通用服务,缺乏特色和针对性,满足不了广大用户多样化的需求。要解决这一矛盾,首先需要在充分了解用户需求的基础上,对用户进行细分,才能针对细分群体提供个性化服务。因此,本文将CRM及其客户细分理念引入电子政务领域,借鉴CRM主要的聚类算法K—means算法,构建用户细分模型,对用户进行细分。
  二、电子政务的发展阶段及面临的问题
  1.电子政务的发展阶段
  所谓电子政务,就是公共管理部门应用现代信息和通信技术,将管理和服务的一项项具体业务通过网络技术进行集成,在互联网上实现组织结构和工作流程的优化重组,超越时间、空间与部门分隔的限制,全方位地向社会提供优质、规范、透明的管理和服务。
  从公共服务的角度,我国电子政务主要经历了三个发展阶段。
  第一阶段是从政府职能的角度提供服务,即以机构设置为依据提供服务,例如将服务按照部门分类。这一阶段提供服务的主要特点有:(1)服务可用性低。在电子政务建设初期,大多数政府网站都按照部门提供服务,用户只有了解政府机构职能,才能选择部门进入相应的服务窗口。(2)服务易用性低。大多数网站按照部门提供服务,使得办事程序重复、繁琐,用户需要访问多个部门网站,由原本跑多个衙门转变为在网站上访问多个网站,服务的易用性大打折扣。(3)服务效果差。由于电子政务建设初期缺乏部门业务协同,导致办事效率低下,几乎无法发挥在线服务的高效性。
  第二阶段是从用户对象的角度提供服务,即以应用主题或用户对象为依据提供的一站式服务,例如按照婚姻生育、教育就业等应用主题或者企业、个人等用户对象分类。这一阶段提供服务的主要特点有:(1)服务可用性大大提高。按照应用主题或者用户对象提供服务的方式,大大降低了用户接受服务的难度,用户从单一的政府网站入口能够获取政府相关的信息和服务。(2)服务易用性有待提高。虽然按照应用主题或者用户对象对服务进行了初步分类,但是并没有结合用户需求对服务事项进一步细分,因此,用户进入相应的主题,面对数量庞大的事项往往无从下手。(3)服务效果明显提高。这一阶段的电子政务开始注重跨部门合作,业务协同得到加强,能够把不同的政府职能部门通过网络集成在一起,让公众享受“一站式”服务,有效地提高了服务效率。
  第三阶段是从用户特定需求的角度提供服务,即充分以用户多样化的需求为依据提供的个性化、定制化服务,例如将用户进一步细分为农民、老幼病残等群体。汪向东、姜奇平将这一阶段称为全面响应型电子政务,是指在任何时间和任何地点对全部政务需求包括公民个性化需求的全面响应。我国已经迎来个性化服务的发展阶段。这一阶段提供服务的主要特点有:(1)服务易用性大大提高。进一步实现“以公众为中心”和无缝隙的公共服务。用户能够在网站上方便地实现所有与政府打交道的事务,个性化需求得到满足。政府在此阶段才真正由原本的分散结构转变为一体化的网上政府,由原本的管理主体转变为服务中心。(2)服务效果大大改善。个性化服务阶段的电子政务最大限度地实现了电子政务的核心价值——为用户提供高认知度、高满意度的公共服务,使政府职能转变的目标与满足用户实际需求的建设工作高度统一。同时,改善和提高了政府形象与效能——电子政务真正体现政府管理方式创新的重要成果,展示建设社会主义“和谐社会”的重要成就。
  2.当前电子政务面临的问题
  电子政务是给任何人、任何社会群体提供公共服务,服务对象具有多层次、多样性的特点,存在面向用户需求和目标不同的差异,如何根据用户特定需求有针对性地提供个性化的公共服务,是目前我国电子政务面临的最大问题。要解决这一问题,首先需要对用户群体进行细分。本文借鉴CRM的核心理念及其客户细分思想,尝试对电子政务用户进行细分。
  三、CRM及其对电子政务的借鉴意义
  1.CRM的基本内涵及客户细分
  CRM是一种“以客户为中心”的企业商务战略,强调个性化定制、实现“一对一”营销和服务,目的是使企业根据客户细分进行重组,强化使客户满意的行为,从而改善客户的满意程度并提高企业的利润。核心理念就是倡导从“以产品为中心”转向“以客户为中心”的企业经营理念和运作模式,通过完善的客户服务和深入的客户分析来满足客户的个性化需求。
  CRM的核心方法是“个性化”的营销管理和服务。所谓客户细分是指根据客户的价值、需求和偏好等综合因素对客户进行分类,并提供有针对性的产品、服务和营销模式的过程,分属于同一客户群的消费者具备一定程度的相似性,而不同的细分客户群间存在明显的差异性。
  早期的客户细分方法主要有定性的经验描述法和定量的传统统计法。随着客户的需求、行为、偏好等因素随着市场的变化越来越快,客户细分的过程应该是一个动态的过程。客户动态细分的实现方式要靠K—means算法等数据挖掘技术,细分结果更符合市场的动态变化。在市场分析中,通过聚类分析能帮助决策者识别不同特征的客户群以及客户群的行为特征。
  2.对电子政务的借鉴意义
  目前大多数电子政务网站提供的都是面向所有服务对象的公共服务,缺乏特色和针对性,无法满足用户个性化需求。将CRM的核心理念及“个性化”的客户细分思想用于指导电子政务建设实践,对电子政务用户进行细分,能够满足用户个性化需求。对于每一个具体的用户,不管是个人还是企事业机构,由于其个体特征、知识结构等自身特点,以及所处的社会环境的不同,对政府服务都具有不同的需求。如:同是买房,不同的人由于收入水平的差别其购房类型、付款方式都会不同。因此,对用户进行细分是电子政务个性化服务发展阶段的迫切要求。
  四、电子政务用户细分模型的构建
  已有的电子政务用户的分类方法都是基于经验和一些描述性统计结果对用户进行粗略的分类,在电子政务用户分类领域缺少科学的分类算法。本文首次将CRM主要的聚类算法K—means算法应用到电子政务用户细分领域,构建用户细分模型。
  1.K—means算法基本原理
  K—means算法以欧式距离作为相似性测度,它是求对应某一初始聚类中心向量V=(V1,V2,…,VK)T最优分类,使得评价指标JC值最小。算法常采用误差平方和准则函数作为聚类准则函数,误差平方和准则函数定义为:S={x1,x2,…,xn}。其中,Mi是类Ci中数据对象的均值,p是类Ci中的空间点。
  K—means算法是一个最优化求解问题,目标函数存在着许多局部极小点,只有一个是全局最小点。目标函数的搜索方向总是沿着误差平方和准则函数减小的方向进行。不同的初始值使得聚类中心向量V沿着不同的路径使目标函数减少。目标函数分别沿着VA、VB、VC三种不同的初始值向量的路径逐步减小,分别找到各自对应的最小值。其中,只有B点对应的最小值才是全局最小点,而A、C两点对应的最小值是局部极小点。
  K—means算法采用迭代更新的方法:在每一轮迭代中,依据k个聚类中心将周围的点分别组成k个簇,而重新计算的每个簇的质心(即簇中所有点的平均值,也就是几何中心)将被作为下一轮迭代的参照点。迭代使得选取的参照点越来越接近真实的簇质心,所以目标函数越来越小,聚类效果越来越好。
  2.电子政务用户的细分模型构建
  K—means的目标是根据输入的参数k,将数据划分成k个簇。算法首先随机选取k个点作为电子政务用户对象的初始聚类中心,然后计算各个用户对象的样本到聚类中心的距离,把样本归到离它最近的用户聚类中心所在的类;对调整后的新类计算新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数JC已经收敛。在每次迭代中都要考察每个用户样本的分类是否正确,若不正确,就要调整。在全部样本调整完后,再修改聚类中心,进入下一次迭代。如果所有的样本被正确分类,则不会有调整,聚类中心也不会变化,这标志着JC己经收敛,算法结束。该算法框架如下:
  (1)给定大小为n的数据集,令I=1,选取k个初始聚类中心Zj(I),j=1,2,3,…,K;
  (2)计算每个数据对象与聚类中心的距离D(xi,Zj(I)),i=1,2,3,…,k,如果满足D(xi,Zk(I))=min{D(xi,Zj(I)),j=1,2,3,…,k},则xi∈wk;
  (3)计算误差平方和准则函数JC:
  
  (4)判断:若则算法结束;否则I=I+1,计算k个新的聚类中心,,返回(2)。
  K—means算法的步骤
  K—means算法
  算法K—means (s,k),{xi}ni=1,xi=(xi1,L,xip,L,xis)
  Input:n个数据对象集合xi
  Output:k个聚类中心Zj及k个聚类数据对象集合Cj
  Begin
  m=1
  initial k prototype Zj,j∈[1,k]
  repeat
  for i=1 to n do
   computer
  if D(xi,zj)=min{D(xi,zj)} then
  end
  if m=1,then
  
  m=m+1
  for j=1 to k do
  
  
  
  End
  当考察完所有数据对象后,一次迭代运算完成,新的聚类中心和JC值也计算出来。如果在一次迭代前后,JC值没有变化,说明算法己经收敛,即准则函数JC作为算法是否结束的依据。在迭代过程中,JC值逐渐减小,直到它的最小值为止。图2显示了K—means算法的迭代过程。这个算法需要的时间复杂度为0(tknd),其中t是算法循环的次数,t<  五、实证分析
  以下面的实例对上述模型进行实证分析,验证细分模型的有效性,得到细分结果。本文针对当前城镇居民最为关心的住房问题进行研究,对有住房需求的城镇居民以家庭为单位进行细分。
  1.细分属性选择及数据准备
  不同家庭具有不同的收入水平、家庭资产、风险偏好等,这些都是影响购房方式的重要因素,因此,本文初始选取了包括family population(家庭人口)、income(人均年收入)、family assets(人均家庭资产)、marriage(婚姻状况)、venture preference(风险偏好)、housing area(人均住房使用面积)、intention(购房目的)7个细分属性,以描述有住房需求的家庭的不同类型,选择北京市城八区的家庭调研数据集的20876条数据进行验证,得到部分数据的视图如下表所示。
  2.K—means聚类分析
  对上述属性进行相关性分析之后去除部分属性,得到income(人均年收入)、family assets(人均家庭资产)、housing area(人均住房使用面积)3个属性,本文选取K=5,随即选择5个对象代表5个类的均值,进行聚类分析,得到最终的聚类中心和类的分布,如下表所示。
  由此可见,将有用户对象细分成了以下5类:住房困难群体,人均年收入、人均家庭资产、人均住房使用面积均符合廉租房申请条件的家庭;购房困难群体:人均年收入、人均家庭资产、人均住房使用面积均符合经济适用房申请条件的家庭;潜力购房群体:未达到经济适用房的申请条件,由于收入水平和家庭资产的限制,目前选择租房;主要购房群体:达到结婚年龄,并且有能力买房的主要房产需求群体;住房升级或购房投资群体:经过多年的财富积累,有住房升级的需求或者买房投资。
  3.聚类效果评价
  采用无指导和有指导方法评价上述K—means算法的聚类效果,结果如表所示。
  从上表可以看出,K—means算法得出的类内距离均小于0.1,说明得到的用户群的类内特征相似,而类间距离均大于0.1,说明得到用户群的类间区别明显。
  4.细分结果分析
  住房困难群体,是廉租房的保障对象,针对此类用户群体应提供廉租房的申请条件、办理流程等服务,并且可将用户在服务过程中遇到的常见问题整理汇总,优化服务内容和方式;购房困难群体,是经济适用房的保障对象,应提供经济适用房申请条件、办理流程等服务;潜力购房群体,主要选择租房的形式,可提供租房的流程等服务,由于这类群体经济水平提高之后相应会有购房需求,可提供相关的前期准备服务;主要购房群体,可提供贷款申请、公积金使用等服务,此外,这类群体在购买住房之后,往往会有买车的需求,可同时提供买车的相关服务;住房升级或购房投资群体,由于其购买的往往是第二套及以上住房,应提供第二套及以上住房的购买政策和流程等服务,这类群体在住房升级之后,可能会有车辆升级的需求,同样可提供买车服务等。
  六、结论
  本文将CRM及其客户细分理念引入电子政务领域,构建了用户细分模型,并通过实证研究得到细分结果,在分析结果的基础上,能相应地提供个性化的政府服务,满足细分群体的特定需求。实践中电子政务用户数量巨大,若更大范围的选取用户数据,利用细分模型进行细分将得到更接近实际的分类结果。本文建立的细分模型与基于经验的现有细分方法相比,由于引入了客户细分理念和K—means算法,使得细分更加科学合理,且能够随着用户需求的变化进行动态的调整,不断提高服务的针对性。
  参考文献:
  [1]2006年中国政府网站绩效评估报告[R].中国软件评测中心,2007
  [2]李广乾:电子政府与电子政务一理想与现实的关系[M].2002
  [3]汪向东等:电子政务的行政生态学理论、方法与策略研究[R].中国社会科学院,2006
  [4] 2007年中国政府网站绩效评估报告[R].中国软件评测中心,2008
  [5]杨路明 巫宁等:客户关系管理理论与实务[M].北京:电子工业出版社,2004
  [6]段尧清 费奎明:个性化电子政务信息服务模式[J].情报杂志,2007年第6期
  [7]TonyBain等著 邵勇译:SQL Server 2000数据仓库与Analysis Services[M].电力出版社.2003
  [8]Vance Faber. Clustering and the Continuous K-means Algorithm
其他文献
[摘 要] 首先构造了一个虚拟最优方案,然后根据相似性科学中的相关理论及相关思想定义了方案相似度的概念并构造了加权相似度量算子(WSMO)来度量各决策方案与虚拟最优方案相似程度的大小,最后根据相似程度的大小进行决策分析。  [关键词] 虚拟最优方案 相似度 语言型属性决策    一、引言  由于信息的不完备性或属性自身的特点等原因,对某些属性的评估不能用精确的数值进行定量地描述例如:交通的便利性、
期刊
[摘要] 针对ERP采购管理中采购效率较低, 提出基于业务流程重组的ER户采购管理的思想,以数据驱动流程的方法设计实现了面向不同中小企业的通用ERP采购管理系统。  [关键词] 工作流 ERP 业务流程重组    一、引言  通用ERP采购管理系统即要适应不同中小业务流程,特别是采购业务中的不定性比较多企业中不同的组织结构和不同的采购、变化比较大这个现象,又要增强系统的柔性,提高对市场的应变能力。
期刊
[摘要] 通过分析ERP和供应链国内外现状,提出如何实现ERP在供应链中的延伸管理的方法,分析了ERP与供应链综合管理的优势所在,并对这种方法提出了展望。  [关键词] ERP 供应链管理 国际化    一、前言  20世纪60年代,企业开始了管理信息化的应用,从MRP到ERP,逐步实现了对采购、库存、生产、销售、财务和人力资源等业务的管理,使内部业务流程和处理实现了自动化,为企业内部纵向一体化管
期刊
[摘要] 随着IT产品更新速度的不断提高,对IT产品进行回收再利用,以及废弃物处理,不仅是环保法规的要求,也是企业节约资源、降低成本的需要,因此,IT产品的逆向物流已成为企业的热点话题。本文以逆向物流的基本理论为背景,分析了IT产品逆向物流的现状和特点,并针对IT产品实施逆向物流面临的主要问题,提出了IT产品回收再利用、绿色包装和绿色运输、研发低耗能IT产品,以及完善相关法律法规等建议,对IT产品
期刊
[摘要] 本文对基于Web的第三方物流管理系统的系统结构进行了分析,提出了第三物流管理系统的设计模型,搭建了一个基于B/S结构的第三方物流管理系统。  [关键词] 电子商务 第三方物流 B/S结构    一、引言  第三方物流,英文表达为Third-Party Logistics,简称3PL,也简称TPL,是相对“第一方”发货人和“第二方”收货人而言的。3PL既不属于第一方,也不属于第二方,而是通
期刊
[摘要] 本文主要针对小型生产企业量少类多、计划多变而导致料品采购库存难以控制的特点,提出在传统MRP的基础上,结合甘特图的特点,进行改进并设计表格,以适合小型生产企业。  [关键词] 生产能力 日期估算 MR    随着竞争的日益激烈,小型制造企业逐渐走向“多品种,多批少量,短周期”的生产模式,料账管理信息日益增多,稍有不慎,库存即成呆料,除非订单重复,否则必成损失。并且在生产过程中,经常会有紧
期刊
[摘要] 本文拟从上海常见的BOT、TOT、PPP三种模式的比较中寻找影响从事公共基础建设的项目公司绩效的内在关键因素,然后将内在关键因素引入到平衡计分卡(BSC)体系之中,以图利用BSC的战略绩效管理功能,规范和指导公共基础项目的融资活动;通过BSC的系统动力学分析,研究关键因素的互动关系,以达到提升上海公共基础项目融资管理水平之目的。  [关键词] 公共基础项目 平衡计分卡 融资模式 互动关系
期刊
目前,交通运输业在国民经济和综合体系中的地位和作用日益突出,伴随着国内经济的高速发展,造成了自然资源的过度消耗,使得我们的生存环境日益恶化,导致了经济发展面临着环境危机和能源危机的巨大挑战。因此,实施交通运输业可持续发展战略,提升资源利用效率,减少环境污染和降低交通事故,实现交通运输新的跨越发展——绿色物流,已成为当前一项重要的战略性任务。  一、绿色物流的内涵及产生的理论基础  1.绿色物流的内
期刊
[摘要] 项目后评估是项目评估的重要内容,通过项目后评估可以总结项目实施过程中的经验教训,为在建项目提供切实可行的对策和措施,从而提高其投资效益。本文首先对项目后评估方法进行了分析,然后应用LFA方法对帕森斯项目进行了后评估。  [关键词] 项目后评估 LFA 项目管理    一、引言  项目管理以其独特的方式正在被现代企业广泛采用,但同时项目一次性和独特性的特点又导致企业知识无法得到及时的总结和
期刊
[摘要] 本文从市场营销专业人才“2+1+1”培养模式的概述入手,通过介绍采用该培养模式需要解决的三个关键问题,着重探讨了“2+1+1”培养模式具体实施方案,为我国高校市场营销专业的人才培养提供了一种全新的借鉴思路。  [关键词] 市场营销专业 “2+1+1”培养模式 市场营销流程    目前,我国众多高校市场营销专业已开始注重“理论与实践并重”,并做了一些有益的探索,比如安排不同形式的实习,组织
期刊