基于并行计算的文本分类技术

来源 :计算机应用 | 被引量 : 2次 | 上传用户:unicom_1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统文本分类方法对于海量数据分类速度慢精度差等问题,将并行计算应用到文本分类领域,设计了一套基于MapReduce的并行化文本分类框架,结合Bagging算法思想提出了支持向量机的并行训练方法,并在Hadoop云计算平台上进行了实验,实验结果表明该分类方法具有较快的分类速度和较高的分类精度。
其他文献
Objective: The aim of our study was to analyze the characters of breast pure mucinous carcinomas on highfrequency ultrasonography with virtual touch tissue quan
目的 研究苯妥英钠对化学治疗耐药人胶质母细胞瘤细胞(8-MG-BA)内卡莫司汀、替尼泊苷积聚浓度的影响.方法 实验细胞分为5组,H4细胞组、8-MG-BA细胞组、8-MG-BA+苯妥英钠5 mg,
新世纪对人才素质要求的提高和高职毕业生就业形势的日趋严峻.决定了高职院校大学生尽早进行职业生涯设计的必要性和迫切性.文章根据进行职业生涯设计所应遵循的一般原则和步
高校校训是学校办学理念和教育思想的提炼与升华,它影响和规范着师生的言行举止和行为方式,具有导向、激励和育人的功能,在大学文化精神的建设中发挥着巨大的作用.然而长期以
[目的]观察中医药治疗干燥综合征的疗效.[方法]以益气养津、调节阴阳为法,辨证治疗干燥综合征38例.[结果]显效23例,好转13例,无效3例,总有效率92.3%.[结论]提示中医药对本病
玉米施肥虚掌握以下原则;基肥为主,追肥为辅;有机肥为主,化肥为辅;氮肥为主,磷、钾肥为辅;攻穗肥为主,攻粒月巴为辅.
目前,多媒体已成为一种不可或缺的辅助教学手段,多媒体如何辅助教学也成为广大中小学教师讨论的热点话题.笔者根据自己的教学经验,提出中学语文教学中使用多媒体应遵循适时、
塑料排水检查井已在不少工程中得到实际应用,但存在由于设计和施工不当而影响其实际使用效果的问题.通过分析现有塑料排水检查井在井筒结构强度、井筒高度、管道连接、管道养
模型检测是协议验证的技术之一。在CSMA/CD协议的验证过程中对该协议进行了简化,忽略了通道时延、退避算法等细节,运用Promela语言进行建模实现。最后,使用模型检测工具SPIN对协议实现的正确性、状态可达性以及可能存在的不可推进循环进行了分析和检验,并从结果的有效性和正确性方面得出了相应验证输出图。
目的 从瘢痕疙瘩患者治疗前温哥华瘢痕量表(VSS)评分推断激素封闭治疗的效果,进一步为患者制定合理的治疗方案.方法 选取2011年1—3月于我院皮肤科就诊的瘢痕疙瘩患者46例,在