论文部分内容阅读
在知识经济和信息化时代,竞争情报已成为企业的“第四核心竞争力”。随着Web技术的快速发展,如何从Web上及时有效地获取企业竞争情报成为竞争情报研究中的前沿问题。但已有的方法局限在“网页驱动”的网页搜集和文本搜索上,即主要借助搜索引擎或文本挖掘工具实现竞争情报搜集和分析。这种方式缺乏对Web信息的深度抽取和理解,所得到的抽取结果与用户的实际需求脱节,阻碍了Web环境下企业竞争情报理论与应用的进一步发展。本论文围绕Web环境下的企业竞争情报搜集需求,针对目前面向Web的企业竞争情报获取中存在的关键问题,重点研究Web环境下企业竞争情报的表示模型以及基于不同视角的Web环境下企业竞争情报获取方法。Web可以看成是由Web网页、Web网站以及Web用户构成的一个信息资源平台。基于此观点,我们着重研究了基于Web网页的企业竞争情报获取方法、基于Web网站的企业竞争情报获取方法、基于Web日志的企业竞争情报获取方法,以期能够构建系统性的面向Web的企业竞争情报获取框架,为Web环境下的企业竞争情报研究与实际应用奠定基础。总体而言,本论文的主要工作和贡献可总结为以下几个方面:(1)研究了Web环境下的企业竞争情报语义问题,提出并建立了基于实体的Web环境下企业竞争情报表示模型,在此基础上提出了一个基于实体和关系抽取的Web环境下企业竞争情报获取框架。(2)研究了面向Web网页的企业竞争情报获取问题,提出了企业商业关系的一个分类框架,并提出了一种基于句子时态标注的企业收购关系抽取方法,获得了较好的抽取效果。(3)研究了面向Web网站的企业竞争情报获取问题,给出了一种利用Web网站信息进行企业竞争对手分析的框架并进行了实证研究,为Web竞争情报获取与分析提供了新的思路。(4)研究了基于Web日志的企业竞争情报获取问题,给出了利用Web用户行为日志进行竞争对手分析的框架,并基于实际的互联网用户行为日志分析了电子商务企业之间的竞争关系,为Web竞争情报获取与分析提供了新的参考。