论文部分内容阅读
由Google公司提出的Map Reduce分布式并行编程模型是一种用于处理大数据的工具。在大数据时代,为解决在海量文本数据中提取有效信息的迫切要求,本文结合中文文本特征,在利用位置分析对特征项进行初步加权的基础上改进了TFIDF算法,并阐述利用Map Reduce模型实现该算法的具体流程。