论文部分内容阅读
互联网的飞速发展产生了海量电影用户评价数据,这些数据为研究用户行为提供了有效支撑。针对传统单机串行系统处理海量数据的局限性,结合Hadoop、MapReduce、HBase等大数据处理技术,设计了基于期望优化(EM)算法的数据处理模块和基于爬山算法、贝叶斯信息准则(BIC)的用户行为模型(UBM)构建及预测模块,实现了基于Hadoop的电影用户行为预测系统。测试结果表明,该系统预测用户行为具有较高准确性与高效性。