论文部分内容阅读
当前,云计算、大数据和人工智能等信息技术的飞速发展,在线教育的适应性学习越来越引起教育信息技术领域专家研究的关注。现阶段,教育发展过程中面临着优质资源供给不足、规模化教育与人才差异化成长需求之间矛盾。因此,迫切需要构建一种既能汇聚各种优质资源又能提供个性化服务的技术体系,这是实现公平而有质量的教育目标必须直面的科学和技术问题。论文以在线教育面对的大量用户、海量教学内容为研究场景,以为学习者提供个性化、智能化的学习服务为目的,针对传统推荐系统中存在的数据稀疏、不平衡,算法扩展性不足,算法效率低、可用性低,鲁棒性欠佳等问题,对在线学习环境中的智能化、个性化资源推荐方法展开研究。论文的主要研究内容和创新性主要体现在四个方面。针对传统推荐数据不平衡与算法扩展性不足的问题,提出了一种新的推荐深度矩阵分解模型(DMF)。模型利用深度神经网络将用户和对象的各类输入信息进行特征提取,在此基础上通过构建特征转移函数,以生成用户和对象的隐含因子,最终通过训练实现内容推荐。借助特征转移函数,模型可以有能力去融合各类信息,提高了模型的扩展性,并且能够有效缓解数据不平衡对算法的影响;其次,针对深度学习推荐算法普遍的,算法效率低、可用性不足的问题,构建了隐含反馈嵌入算法,将原本高维稀疏的隐含反馈数据进行嵌入学习将其表示为一个低维实值向量从而极大地降低模型的参数规模并提高模型效率。针对推荐系统中的数据稀疏性问题,基于深度矩阵分解模型提出了一种优化的深度变分矩阵分解模型(DVMF)。模型将用户与对象的隐含因子进行全贝叶斯处理看作一个随机变量,这种假设更符合用户喜好具有动态性的实际情况,且全贝叶斯处理的模型能够有效地缓解模型在数据稀疏情况下造成的过拟合问题。其次,深度变分矩阵分解模型使用了变分推断技术与重参数化采样方法使模型能够通过随机的梯度方法进行模型优化,使其能够应对大规模数据场景,提高了模型训练效率与可用性。针对一般机器学习模型面对对抗攻击时鲁棒性不足的问题,提出了两个对抗深度隐含因子模型(ADLFM)。模型在深度矩阵分解模型的基础上构建了两种针对它的对抗攻击:针对输入信息的对抗攻击与针对隐含因子的对抗攻击,之后提出了相应的对抗训练方法,有效提高了模型对对抗攻击的鲁棒性;模型针对对抗样本生成的优化问题,提出了一个对抗样本的显式近似解法,能够不通过迭代求解的模式直接生成对抗样本,极大地提高了模型的训练效率。针对推荐系统中数据稀疏与不均衡的问题,基于图信息汇聚的思想提出了一个分离图神经推荐模型(SGNR)。模型将用户和对象的群体特征进行建模,抽取群体的协同特征有效地缓解数据稀疏与不平衡问题;针对一般推荐系统中异质信息网络难建模的问题,提出了图分离的思想,将推荐系统中的数据图进行分离,分离成用户关系图和对象关系图两个同质信息网络,使得建模过程变得简单;针对传统图神经网络难以实施随机或小批量的优化问题,将传统图神经网络中信息汇聚过程与神经网络的非线性转化过程进行分离,使得模型可以使用小批量的优化方法进行优化,提高模型的效率与可用性。利用实际的在线学习环境中搜集相关数据与经典推荐系统数据集对所提出的四个推荐模型进行了算法验证与分析。实验结果表明所提出的算法在性能方面普遍优于当前的主流推荐方法。