面向解决方案的中文文本挖掘平台研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:curarchy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,网络上“信息爆炸”的问题越来越严重。即信息越丰富,知识越贫乏。信息,作为互联网的核心,只有为用户带来有价值的信息,才能促进互联网的发展,所以,如何在浩瀚的信息海洋中找到有价值的信息,具有广泛的应用和实用价值,对于文本信息的挖掘研究也成为了研究热点。文本挖掘正在逐步成为各行各业中不可或缺的工具。目前,对于文本挖掘的研究,现在以对文本挖掘的技术为主,对于文本挖掘系统的研究相对较少,同时,研究环境以英文为主,中文环境相对较少。本文首先分析了文本挖掘的研究现状,然后对现有文本挖掘工具的特点进行了总结,针对当前缺少完整通用的中文文本挖掘工具的现状,将解决方案思路引入文本挖掘过程,形成文本挖掘解决方案。根据中文文本挖掘特点,改进文本挖掘流程,提出面向解决方案的文本挖掘模型。并在此基础上对模型进行了模块的划分,对每个模块的功能进行了详细的描述。在面向解决方案的文本挖掘模型基础上,结合现有的成熟开发技术和软件的体系结构,设计了面向解决方案的文本挖掘平台,对其工作机制做了详细的描述,对平台的模块进行详细设计。并针对挖掘软件常见的系统扩展困难、组件可复用性等问题给出了解决方法。只要遵循该平台的文本模型接口和挖掘模型接口,新的挖掘算法可以很容易地集成到该平台中去。同时,该平台是一个可以与挖掘应用紧密结合的、便于升级和移植的挖掘系统框架。在完成平台主要功能的分析与设计的基础上,对课题提出的面向解决方案的文本挖掘平台进行了主要功能的实现。在开发过程中,实现各个模块之间的无缝连接,算法开发人员可以在平台上直接进行上层的算法模型开发而无需考虑数据的周转与存储、系统的管理情况,减少算法研究和开发者非必须的工作量,提高工作效率。
其他文献
【目的】优化滴灌条件下苜蓿的水肥供应制度,提出节约、高效的水肥技术方案。【方法】以地下滴灌苜蓿为研究对象,进行水肥二因素完全随机试验,试验设置4个灌水水平(1 950、2
当前我国城市公园的使用后评价结论往往众说纷纭。传统介入式研究方法由于对研究对象的介入而无法保障其真实性与全面性。文章引入非介入式大数据尝试解决这一问题。以合肥市
随着我国企业社会责任意识增强,社会各界对企业慈善行为的关注度也日渐提升.文章简要阐述匹配捐赠模 式的组成要素,采用网络调研法与文献研究法对国外配捐的典型案例进行介绍
当下,"迎接独角兽回归"成为了资本市场重要的话题。从港交所"25年来最重要的上市制度改革"到内地监管鼓励新经济企业在A股上市的制度改革,无不透露着资本市场对独角兽企业回
<正>应激性溃疡(stress ulcer,SU)是指机体在应激状态下发生的以急性胃黏膜糜烂、溃疡和出血为特征的严重并发症[1],并可使原有病变恶化[2]。腹部手术后可以引起SU,一旦发生
目的:探讨分化型甲状腺癌术前原发肿物超声特征与术后颈部淋巴结转移的关系。方法:回顾性分析2016年5月—2018年5月经手术病理证实为分化型甲状腺癌的217例患者临床资料,根据
目前,三维动画课程是高校动画专业非常重要的核心课程。加拿大魁北克大学国立动画中心在三维动画课程的教学中已有非常完备的教学模式和课程体系。文章通过分析魁北克大学国
磷霉素废水是一种典型的抗生素废水,成分复杂,处理难度大。近年来随着市场需求的增大,工业生产量也逐渐增大,磷霉素制药废水的处理开始引起学者的关注。文章总结了近几年来磷
陕西金泰氯碱化工有限公司耗氯技改项目通过了安全设施竣工验收,同时获得陕西省工信厅“绿色系统集成示范工程”项目奖励资金270万元。
采用文献资料法、现场观察法和访谈法对四川省第11、12届省运会体操比赛的奖牌分布情况、比赛成绩和动作的完成情况进行对比分析。结果表明:与上届相比,女子体操完成动作的稳