文本挖掘探析

来源 :廊坊师范学院学报 | 被引量 : 0次 | 上传用户:senkooqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现.文本挖掘主要处理半结构化、无结构化和字符型数据.首先介绍了文本挖掘的概念,然后分析了文本挖掘的处理过程和关键技术,最后对文本挖掘进行了展望.
其他文献
马克思就西欧社会向资本主义发展提出了社会现代化理论,并认为社会主义是在资本主义充分发展的前提下建立的.但是现实社会主义是在落后国家首先建立起来的,按照计划经济体制
<高等数学>为数学思想方法的教学提供了一个良好的知识平台,在<高等数学>课程的教学中进行数学思想方法的教学,不仅是可行的,也是必要的.为此,应采取的主要措施有:一是改变传
井下作业监督的管理模式所涉及的范围比较广,规模庞大且工作人员较多,其管理模式还应进行多方面的考虑,例如:完善管理制度、工作人员配备、各职能部门的组织建设、监督以及培训工
设备的档案管理在医院管理中有极其重要的地位,为了保证档案数据准确,我院每年都会进行一次设备普查.普查中总会或多或少的发现一些问题.本文就在普查中发现的问题阐述了相应
目的探究早期脑桥出血患者磁共振改变及脑皮层结构的变化和这些变化对患者运动能力的关系。方法将在2014-02—2015-08间于解放军第八二医院接收治疗的早期脑桥出血患者30例纳
公共娱乐场所历来是消防监督的重点和难点,近年来发生在此类场所的火灾层出不穷,带给公共安全的压力也越来越大,文章分析了容易造成人员伤亡的原因,提出开展开展监督检查的措
讨论了|P(X)|=3、| SP(X)|=2和|P(X)|= 2、| SP(X)|=3两种情况下的四阶BCI-代数的计数问题,结论是:| P(X)|=3、| SP(X)|= 2的四阶BCI-代数有三个;| P(X)|=2、| SP(X)|=3的四
目的 探讨乳腺癌的螺旋CT特点,提高乳腺癌的影像学诊断和鉴别诊断的正确性。方法 回顾性分析37例经手术病理证实或穿刺活检证实的乳腺癌患者的螺旋CT图像。结果 本组瘤体均为
混凝土是建筑工程的主要结构材料,量大而面广,合理选用原材料,科学优化配合比,严密做好施工控制,是保证混凝土质量、提高混凝土耐久性、提高工程使用年限的重要环节。文章对混凝土
随着时代的进步和社会经济的发展,特别是科学技术的不断革新,如今焊机自动测试系统得到了较为广泛的应用,焊机自动测试系统是利用虚拟技术实现的,借助于一系列的软件和设备,来改变电焊机输出输入状态,快速准确的测试电焊机各项参数,自动判断和处理检测结果,并且可以对信号波形进行采集和分析,最后存储检测结果;在实践中应用,具有一系列的优势。文章简要分析了如何利用虚拟技术构建焊机自动测试系统,希望可以提供一些有价