论文部分内容阅读
Fintech(Financial technology,金融科技)随着云计算、大数据、区块链、人工智能等技术的发展正变得越来越火热。传统的金融行业正在寻求与互联网技术公司合作,主动拥抱金融科技。在“互联网+”时代,P2P(Peer-to-Peer,个人对个人)网络借贷市场作为典型的Fintech应用场景,具有很高的研究价值。如何全面和准确的评估个人信用风险状况,是金融行业的进行风险控制的关键所在。传统的金融行业在信用评估的全面性和时效性上存在短板。大数据分析和肖像建模技术的发展为信用评估提供了一种新的思路。本文综合了大数据分析方法和数据画像建模技术,通过整合和分析人人贷网络借贷平台上借款人自然属性和行为特征,将借款人各个维度的数据进行融合,构建成了大数据环境下用户金融肖像的典型模型——个人信用肖像模型。针对P2P网络借贷用户在互联网上留下的海量的自然属性和行为特征数据。本文创新性的提出了构建用户的静态肖像模型和动态肖像模型。静态肖像模型是采用将用户的互联网行为映射成标签的方法,该方法有利于对用户繁杂的借贷行为进行梳理,使用户的关键特征简洁明了的呈现。静态肖像模型的构建也有利于对用户静态特征进行分析。动态肖像模型是将用户的自然属性与行为特征进行数据融合,采用机器学习或者深度学习算法对借款人的信用进行演化推理,预测借款人能否按时还款。静态模型与动态模型协同作用,可以分析借款人借贷行为的影响因素。构建用户的静态肖像模型,本研究针对P2P领域自然语言处理任务开发了分词系统。并且采用TF-IDF(Term Frequency–Inverse Document Frequency,词频-逆文件频率)算法对分好的词语进行权重标注,接着采用xgboost(e Xtreme Gradient Boosting)算法对用户借款的典型特征进行提取。采用这些方法能够更加直接的观察到用户的行为特征。在用户的静态肖像模型的基础上,对用户的自然属性和行为特征两大特征的各个维度进行统计分析,并根据行为经济学方法论验证用户的群体特征。为用户的动态模型构建打下理论基础。构建用户的动态肖像模型,本研究采用了xgboost算法,bagging(Bootstrap Aggregating)算法和CNN(Convolutional Neural Networks,卷积神经网络)算法进行动态模型构建的对比分析。研究发现,采用深度学习算法在根据已有信息对用户的信用进行演化推理预测时,精度最高。最后,本文针对已有研究的应用场景和接下来的研究方向进行了展望。