论文部分内容阅读
农业“走出去”战略加强了我国农业的国际合作,推动了农产品贸易的高速发展,但同时也导致了更多农产品贸易摩擦事件的发生。在大国博弈日益激烈的情况下,农产品贸易摩擦不仅与企业的微观经营与决策密切相关,同时也对国家粮食安全等国计民生重大事项产生了越来越重要的影响。在全面、完整、清晰、洞察性与关联性地理解农产品贸易摩擦事件的基础上形成高质量决策,成为越来越重要的宏微观管理需要。案例作为一种先验经验在决策过程中发挥重要作用,是信息充分决策的重要依据和有效工具。针对目前我国农产品贸易摩擦事件信息较为分散,且未曾发现相关案例库的现状,同时考虑到现有案例库构建技术存在案例结构化和聚合不足、案例信息采集与处理自动化程度不足等问题,采用网络爬虫和文本相似度计算等自然语言处理技术,研究了农产品贸易摩擦事件文本信息采集和基于人机交互的案例库构建关键技术,提出了农产品贸易摩擦案例库构建的技术框架,为案例库的实际构建提供了一个可行的解决方案。论文主要开展了四个部分的研究:(1)通过文献调研、各类案例库调研、专家访谈等方法,获取农产品贸易摩擦案例库的需求,分析与设计案例的框架结构和案例库的功能。(2)确定农产品贸易摩擦信息源和采集策略,实现了基于Scrapy框架的案例信息采集。(3)针对传统文本表示方法存在的不足,结合Word2Vec分布式表示和TF-IDF关键词提取方法,提出一种改进的关键词文本矩阵KTRM表示方法,据此进行文本相似度计算以实现案例信息处理和聚合。(4)运用自动分词、命名实体识别、关键词抽取等自然语言处理技术进行案例文本信息抽取,实现人机交互的半自动化案例构建。通过上述研究,论文形成了一个基于网络信息爬取和自然语言处理技术的人机交互式农产品贸易摩擦案例库建设解决方案,基本完成了案例库的设计和原型系统构建。论文所提出的技术方案及其关键技术可有效提高案例信息采集、信息处理、案例构建以及检索的效率,为提供更高质量的决策、进行后续的研究、应用与分析奠定了基础。